Erfordert die Fragestellung den Einbezug
mehrerer Größen (mehrdimensionale Betrachtung),
so ist die Nutzung entsprechender
statistischer Methoden unausweichlich,
weil der Mensch die in den Daten enthaltenen
Zusammenhänge nur schwer ermitteln
kann. Die statistischen Methoden unterteilt
man in unüberwachte (unsupervised) bzw.
überwachte (supervised) Methoden (Abb. 5).
Die unüberwachten Methoden haben zum
Ziel, Gemeinsamkeiten in den Datensätzen
zu ermitteln. Man fasst diese unter dem Begriff
Clusteranalyse zusammen. Sie werden
oft bei der Identifikation neuer, noch nicht
in der Datenbank enthaltenen Strukturen
zwecks Zuordnung eingesetzt (Beispiel aus
der Infrarotspektroskopie: Ref. 5). Man verwendet
diese Methode auch beim maschinellen
Lernen, um Neues in die Datenbasis
zu integrieren.
Für die Extraktion von Zusammenhängen
werden überwiegend überwachte
Methoden eingesetzt (z. B. siehe Ref. 3).
Diese kann man wiederum in zwei Klassen
einteilen: Klassifikation und Regression.
Beiden gemeinsam ist, dass man einen Zusammenhang
Ursprungsdaten / Datenkompression
• Hauptkomponenten
• Fourier-Transformation
• Wavelet
• …
Clusteranalyse / Diskriminanzanalyse Korrelationskoeffizient / Funktion
3 2020 | moproweb.de 23
zeigt, wie man Produkteigenschaften mittels
Nahinfrarotspektroskopie in der Prozesslinie
(Abb. 1) vorhersagt. Später wurde dies automatisiert
und zu Prozesssteuerungszwecken
genutzt (Ref. 6). Abb. 2 zeigt, wie die Regelung
in der bestehenden Prozesslinie aufgesetzt
wurde. Ein zusätzlicher PID-Softwareregler,
rot dargestellt, wurde installiert, um
die erhaltenen Infrarottrockenmassenwerte
zwecks Beeinflussung des Zulaufstroms zum
Separator zu verwenden (Abb. 3).
Die so vorliegende Datenbasis gilt es nun,
nutzbar zu machen. Die einfachste Art ist
die graphische Darstellung einer Größe (eindimensionale
Betrachtung) über die Zeit.
Visualisiert man noch in dieser Graphik am
Prozessleitstand den technologisch erlaubten
Bereich z. B. als grünes Band, den Warnbereich
und verstärkte Überwachung in gelber
Farbe und den Prozesseingriffsbereich
in roter Farbe (Abb. 4), so hat man Hilfestellung
für die Prozesssteuerung gegeben. Im
nächsten Schritt würde man dann eine regelungstechnische
Lösung implementieren.
Zusammenhänge
Supervised
Ursprungsdaten / Datenkompression
• Hauptkomponenten
• Fourier-Transformation
• Wavelet
• …
• Multiple Lineare Regression (MLR)
• Principle Component Regression (PCR)
• Partial Least Square Regression (PLSR)
• Neuronale Netze (NN)
• Fuzzy Logik (FL)
• Support Vector Machine (SVM)
• Entscheidungsbaum
• …
MLR
PCR
PLSR
NN
FL
SVM
…
Korrelation
Abbildung 5: Überblick über statistische Methoden (erhebt keinen Anspruch auf Vollständigkeit)
zwischen Eingabegrößen und
einer oder mehreren Bestimmungsgrößen
herstellt. Die „Überwachung“ besteht darin,
dass mittels einer Strategie der Zusammenhang
Eingabe- und Bestimmungsgröße modelliert
wird. Für diese Strategie gibt es nun
wiederum mehrere statistische Methoden.
Hier sollen die Namen der aktuell diskutierten
Strategien aufgelistet werden, um gewisse
Vorstellungen über die Erzeugung des
Zusammenhangs zu vermitteln:
• Multiple lineare Regression (MLR) bzw.
Partial Least Square Regression (PLSR),
um einen linearen Zusammenhang zwischen
Eingabegrößen und Bestimmungsgröße
zu erzeugen. Der Zusammenhang
lässt sich in Form einer Funktion darstellen
und interpretieren.
• Neuronale Netze (NN), um hiermit ähnlich
der menschlichen Gehirnsignalverarbeitung
einen Bezug herzustellen. Der
Strukturen Klassifikation
Funktionelle
Abhängigkeiten
Unsupervised / / Supervised