molkerei-industrie_11_2019

mi | Technik/IT gungszeit, den Wasserbedarf und den Bedarf an Pumpenergie für die Reinigung mit Hilfe eines selbstlernenden Verfahrens optimiert. Die bisherigen Methoden zur Steuerung für die Reinigung wird durch Q-Learning 18 11 2019 | moproweb.de eine deutliche Verbesserung der Prozessparameter und der Adaptionsfähigkeit des Verfahrens bringen. Durch Evaluation der Umgebung in ihrem aktuellem Zustand und im Vergleich zu ihrem vorherigen Zustand, bevor der Regler eingegriffen hat, zieht der Agent seine Schlüsse zur Bewertung. Es wird bewertet, ob der Eingriff eine positive, also zielführende Veränderung bewirkt hat oder nicht. Eine positive Änderung wird belohnt, Abbildung 4: Detektierte Verschmutzung einer Reinigung. Die Reinigung unterteilt sich in drei Phasen, dem Quellen, dem eigentlichen Abreinigen und dem Ausklingenden Konvergenzbereich in dem keine praktische Reinigung mehr stattfindet während eine negative nicht belohnt bzw. bestraft wird. Welche Veränderungen als positiv bewertet werden, wird vorher vom Benutzer definiert. Eine Abnahme der detektierten Verschmutzung oder eine durchgängige bzw. konstante Reinigungsspur des Flüssigkeitsstrahls an der Behälterwand sind positive Reinigungsergebnisse. Um die Veränderungen in eine gewisse Relation zueinander zu setzen und um Messrauschen zu dämpfen, wird der Belohnungsfaktor noch mit einem Vorfaktor (Discount-Faktor) gedämpft. Eine Methode des datenbankbasierenden bestärkenden Lernens ist das sogenannte Q-Learning 12. Dabei wird der aktuelle Eingriff des Algorithmus in den Prozess auf Grundlage des vorherigen Eingriffs sowie den Eingriffen auf vergangene Prozesse beeinflusst. Im Falle der Reinigung wird die Änderung der Prozessparameter durch den aktuellen Fortschritt, sowie durch die bisherigen Bestwerte vergangener Reinigungen realisiert. Die vergangenen Reinigungen werden vor jeder neuen Reinigung im Hinblick auf ihre Effizienz ausgewertet und dienen als Gedächtniswerte für die kommende Reinigung. Ein Reinigungsparameter, der für die Auswertung herangezogen wird, ist der globale Verbrauch an Reinigungswasser. Die gesamte Optimierung zielt auf den Wasserverbrauch, den Energiebedarf (hier nur für die Pumpe) und die Reinigungszeit ab. Als Inputwert für den Regelalgorithmus nimmt eine Kamera (BASLER AG Ahrensburg, BASLER acA4600-10uc) das emittierte UV Spektrum im Tankinneren auf. Die Kamera ist innerhalb eines luftgekühlten Flanschs montiert und von einem UV-LED Ring umgeben (siehe Abbildung 3). Um eine Verschmutzung di- Abbildung 3: Versuchsaufbau im Technikum des Fraunhofer IVV Dresdens. Im oberen Stutzen des Tanks befindet sich der Kameraaufbau mit LED Ring und der Schutzverglasung. Der Zielstrahlreiniger hängt zentral von oben in das Innere des Tanks