Der / die Studierende soll im Rahmen des Forschungsprojekts einen Workflow zur datengetriebenen Fehlerdiagnose und prädiktiven Fehlererkennung in Zeitreihendaten (Lernen auf Drift) entwickeln. Hierbei stehen der Einsatz und die zielgerichtete Weiterentwicklung von lernenden Algorithmen im Fokus.
Fertigungsanlagen erzeugen im Betrieb einen Strom von Prozessdaten. Durch verschiedene Betriebs- zuständeund externe Einflüsse kommt es dabei zu vielen unterschiedlichen Veränderungen im Prozess und damit auch in den Zeitreihen. In einem ersten Schritt sollen diese Veränderungen in den Zeitreihendaten erkannt und normale Prozessschwankungen von Fehlern unterschieden werden. Es müssen Merkmale aus den vorliegenden Daten extrahiert werden, die es erlauben, robuste Aussagen über den Maschinenzustand zu tätigen. Auf Basis dieser Merkmale kann dann in einem zweiten Schritt, mithilfe intelligenter Algorithmen und Verfahren, die Entwicklung betrachtet und vorhergesagt werden, sodass Ausfallwahrscheinlichkeiten und –zeitpunkte prognostiziert werden können. Dabei soll der Fokus auf Verfahren liegen, die zur Analyse von Zeitreihendaten, d.h. für die Anomalie-Erkennung in Zeitreihen, geeignet sind. Hierfür bieten sich Formen rekurrenter neuronaler Netze an, wie beispielsweise Long Short Term Memory – Netze. Diese besitzen Rückkopplungen zwischen Neuronen verschiedener Schichten, wodurch die in tieferen Schichten gewonnenen Erkenntnisse vorne wieder eingespeist werden können. Dadurch sind sie in der Lage, Informationen und Muster über einen längeren Zeitraum zu speichern. Es muss dabei häufig ein zeitvariantes Prozessverhalten berücksichtigt werden, welches beispielsweise durch Schlupf im System hervorgerufen wird und die Muster- bzw. Anomalie-Erkennung erschwert.
Neben realitätsnahen Testprozessen, wie sie an der IoT-Factory des CfADS zu finden sind, sollen die entwickelten Algorithmen in die Anwendung überführt werden und bei der Firma VENJAKOB Maschinenbau angewendet werden. Die Bearbeitung erfolgt in enger Zusammenarbeit mit dem Team des Center for Applied Data Science der HSBI.
Bezug zum Thema Data Science
Im Rahmen der Tätigkeit soll der Studierende in Zusammenarbeit mit den Mitarbeitern des CfADS bei der Realisierung eines Data Science Workflow mitwirken. Es werden Prozessdaten aus realen Anwendungen erhobenund mittels Data-Mining-Verfahren verdichtet und für die Erstellung von datenbasierten Modellen herangezogen. Die Daten sollen unter der Verwendung der Cloud-Plattform des Center for Applied Data Science verarbeitet werden.Diese basiert auf dem Haadoop-Framework, welches für Big-Data-Analysen prädestiniert ist. Folglich können die in den Veranstaltungen erworbenen Erkenntnisse direkt im Projekt angewendet werden.
Verfügbare Ressourcen
Für die Bearbeitung des Projekts kann die Infrastruktur des CfADS genutzt werden, die aus folgenden Komponenten besteht bzw. bestehen wird:
- Data-Analytics-Cluster: rechenstarker Computercluster auf Basis des Hadoop-Frameworks
- IoT-Factory: Modellfabrik zur Nachbildung realer Produktionsabläufe
- Smart Service Lab: Labor zur Entwicklung von Smart Services und Assistenzsystemen auf Basis von Smart Devices.
Die notwendige Datengrundlage kann durch die Nutzung der IoT-Factory geschaffen werden. Außerdem kann aufFertigungsdaten der Firma VENJAKOB Maschinenbau zugegriffen werden. Die dafür notwendige Schnittstelle und Methoden zur Vorverarbeitung wurden im Rahmen eines laufenden Forschungsprojekts entwickelt.
Projektplan
Erstes Semester:
Konkretisierung des Forschungsvorhabens. Dies beinhaltet die Einarbeitung in die CfADS-Infrastruktur und in die zu betrachtenden Prozesse. Ebenso wird mit einer Literaturrecherche und der Einarbeitung in die Thematikbegonnen. Die Erstellung eines Forschungsexposés am Ende des Semesters ist Prüfungsleistung.
Zweites Semester:
Tiefere Einarbeitung in ausgewählte Verfahren und eine erste Implementierung der Verfahren. Die Untersuchungerfolgt zunächst anhand von Testprozessen (IoT-Factory). Die Erstellung eines Papers zum Stand der Forschung (Überblick über das jeweilige Forschungsgebiet) ist Prüfungsleistung.
Drittes Semester:
Anwendung ausgewählter Verfahren auf reale Prozessdaten der Firma VENJAKOB Maschinenbau. Die Erstellungeines Papers mit ersten quantitativen Ergebnissen ist Prüfungsleistung.
Viertes Semester:
Anpassung und Optimierung der verwendeten Verfahren. Dies beinhaltet die Auswertung der Güte und dieEvaluierung der erzielten Ergebnisse. Die Masterarbeit inklusive Kolloquium ist Prüfungsleistung.
Eignungskriterien
Zwingend:
- Grundkenntnisse der Informatik
- Erfahrungen in dem Umgang mit Tools zur Auswertung großer Datenmengen,
wie z.B. MAT- LAB/Simulink, Python
- Teamfähigkeit und Interesse an wissenschaftlicher Arbeit
Optional:
- Erfahrungen in den Bereichen der Regelungs- und Automatisierungstechnik und der Visualisierung von Daten und deren Zusammenhänge
Erwerbbare Kompetenzen
- Praktischer Einsatz verschiedener Verfahren des Maschinellen Lernens
- Big-Data Workflows unter der Verwendung eines Hadoop-Ökosystems
- Maschinelle Lernverfahren, speziell im Bereich der Zeitreihenanalyse
- Aufbereitung und Präsentation von Analyseergebnissen