Datengetriebene Fehlerdiagnose und prädiktive Fehlererkennung in Zeitreihen

Projektübersicht

Anzahl Studierende	1
Art	gefördertes Projekt mit externem Partner
Projektverantwortung	Prof. Dr.-Ing. Martin Kohlhase
Projektkontext	Projekt in Zusammenarbeit mit der Firma VENJAKOB Maschinenbau GmbH & Co. KG aus Rheda-Wiedenbrück und dem Center forApplied Data Science Gütersloh (CfADS). Eine parallele Anstellung als WHK am CfADS ist möglich.
Projektdurchführung	Marius Baldauf

Kurzbeschreibung

Die zunehmende Vernetzung in fertigenden Unternehmen ist zentraler Bestandteil der Industrie 4.0. Dabei werden in der Regel große Datenmengen aus den Produktionsprozessen erhoben, bspw. Maschinendaten, Betriebsdaten, Qualitäts- oder Instandhaltungsdaten. Gezielte Analysen können dazu beitragen die Effizienz und Produktivität vieler Anlagen zu erhöhen sowie den Einsatz von Ressourcen schonender zu gestalten. Ein Anwendungsfeld ist beispielsweise die gezielte und bedarfsgerechte Maschinenwartung. Mit datenbasierten, lernenden Verfahrenkönnen dabei vermeidbare Stillstandzeiten reduziert, eine hohe Produktqualität sichergestellt und kritische Komponenten überwacht werden. Um dieses zu ermöglichen, müssen auftretende Fehler bzw. Anomalien im Maschenverhalten detektiert und folgend verlässlich prädiziert werden.

Im Rahmen dieses Forschungsprojekts soll der / die Studierende in Zusammenarbeit mit den Mitarbeitern des CfADS einen Workflow entwickeln, der die datengetriebene Fehlererkennung und Fehlerprädiktion ermöglicht. Hierfür sollen lernende Algorithmen verwendet werden, die ggfs. angepasst bzw. anwendungsbezogen adaptiert werden müssen. Der entwickelte Workflow soll in die CfADS-Cloud implementiert und an der IoT-Factory hinsichtlich Funktionalität getestet werden. Anschließend werden die Verfahren an Anlagen der Firma VENJAKOB Maschinenbau GmbH & Co. KG validiert. Mit den anaysierten Daten und auf Basis der erkannten Fehlerbilder sowie Anlagenzustände kann eine passgenaue Instandhaltung geplant werden. Komponenten- und anlagenabhängig kann eine ideale Servicestrategie abgeleitet und umgesetzt werden. Die Methoden sollen schließlich in generalisierter Form die Forschungsinfrastruktur des CfADS erweitern.

Der Umgang mit Verfahren und Algorithmen zur Analyse von Prozess- bzw. Maschinendaten bestimmt zunehmend das Aufgabenfeld der Arbeitnehmerinnen und Arbeitnehmer in den Unternehmen. Die effiziente Nutzung bzw. zielgerichtete Analyse von Prozessdaten entscheidet nicht selten über die Zukunftsfähigkeit von Unternehmen mit der Folge, dass Fähigkeiten in diesem Bereich einen immer größeren Stellenwert in den Unternehmen einnehmen. Im Rahmen des Forschungsprojekts besteht die Möglichkeit, Fähigkeiten zu erwerben, die diesem neuen Anforderungsprofil gerecht werden.

Aufgabenstellung

Der / die Studierende soll im Rahmen des Forschungsprojekts einen Workflow zur datengetriebenen Fehlerdiagnose und prädiktiven Fehlererkennung in Zeitreihendaten (Lernen auf Drift) entwickeln. Hierbei stehen der Einsatz und die zielgerichtete Weiterentwicklung von lernenden Algorithmen im Fokus.

Fertigungsanlagen erzeugen im Betrieb einen Strom von Prozessdaten. Durch verschiedene Betriebs- zuständeund externe Einflüsse kommt es dabei zu vielen unterschiedlichen Veränderungen im Prozess und damit auch in den Zeitreihen. In einem ersten Schritt sollen diese Veränderungen in den Zeitreihendaten erkannt und normale Prozessschwankungen von Fehlern unterschieden werden. Es müssen Merkmale aus den vorliegenden Daten extrahiert werden, die es erlauben, robuste Aussagen über den Maschinenzustand zu tätigen. Auf Basis dieser Merkmale kann dann in einem zweiten Schritt, mithilfe intelligenter Algorithmen und Verfahren, die Entwicklung betrachtet und vorhergesagt werden, sodass Ausfallwahrscheinlichkeiten und –zeitpunkte prognostiziert werden können. Dabei soll der Fokus auf Verfahren liegen, die zur Analyse von Zeitreihendaten, d.h. für die Anomalie-Erkennung in Zeitreihen, geeignet sind. Hierfür bieten sich Formen rekurrenter neuronaler Netze an, wie beispielsweise Long Short Term Memory – Netze. Diese besitzen Rückkopplungen zwischen Neuronen verschiedener Schichten, wodurch die in tieferen Schichten gewonnenen Erkenntnisse vorne wieder eingespeist werden können. Dadurch sind sie in der Lage, Informationen und Muster über einen längeren Zeitraum zu speichern. Es muss dabei häufig ein zeitvariantes Prozessverhalten berücksichtigt werden, welches beispielsweise durch Schlupf im System hervorgerufen wird und die Muster- bzw. Anomalie-Erkennung erschwert.

Neben realitätsnahen Testprozessen, wie sie an der IoT-Factory des CfADS zu finden sind, sollen die entwickelten Algorithmen in die Anwendung überführt werden und bei der Firma VENJAKOB Maschinenbau angewendet werden. Die Bearbeitung erfolgt in enger Zusammenarbeit mit dem Team des Center for Applied Data Science der HSBI.

Bezug zum Thema Data Science
Im Rahmen der Tätigkeit soll der Studierende in Zusammenarbeit mit den Mitarbeitern des CfADS bei der Realisierung eines Data Science Workflow mitwirken. Es werden Prozessdaten aus realen Anwendungen erhobenund mittels Data-Mining-Verfahren verdichtet und für die Erstellung von datenbasierten Modellen herangezogen. Die Daten sollen unter der Verwendung der Cloud-Plattform des Center for Applied Data Science verarbeitet werden.Diese basiert auf dem Haadoop-Framework, welches für Big-Data-Analysen prädestiniert ist. Folglich können die in den Veranstaltungen erworbenen Erkenntnisse direkt im Projekt angewendet werden.

Verfügbare Ressourcen
Für die Bearbeitung des Projekts kann die Infrastruktur des CfADS genutzt werden, die aus folgenden Komponenten besteht bzw. bestehen wird:

Data-Analytics-Cluster: rechenstarker Computercluster auf Basis des Hadoop-Frameworks
IoT-Factory: Modellfabrik zur Nachbildung realer Produktionsabläufe
Smart Service Lab: Labor zur Entwicklung von Smart Services und Assistenzsystemen auf Basis von Smart Devices.

Die notwendige Datengrundlage kann durch die Nutzung der IoT-Factory geschaffen werden. Außerdem kann aufFertigungsdaten der Firma VENJAKOB Maschinenbau zugegriffen werden. Die dafür notwendige Schnittstelle und Methoden zur Vorverarbeitung wurden im Rahmen eines laufenden Forschungsprojekts entwickelt.

Projektplan
Erstes Semester:
Konkretisierung des Forschungsvorhabens. Dies beinhaltet die Einarbeitung in die CfADS-Infrastruktur und in die zu betrachtenden Prozesse. Ebenso wird mit einer Literaturrecherche und der Einarbeitung in die Thematikbegonnen. Die Erstellung eines Forschungsexposés am Ende des Semesters ist Prüfungsleistung.

Zweites Semester:
Tiefere Einarbeitung in ausgewählte Verfahren und eine erste Implementierung der Verfahren. Die Untersuchungerfolgt zunächst anhand von Testprozessen (IoT-Factory). Die Erstellung eines Papers zum Stand der Forschung (Überblick über das jeweilige Forschungsgebiet) ist Prüfungsleistung.

Drittes Semester:
Anwendung ausgewählter Verfahren auf reale Prozessdaten der Firma VENJAKOB Maschinenbau. Die Erstellungeines Papers mit ersten quantitativen Ergebnissen ist Prüfungsleistung.

Viertes Semester:
Anpassung und Optimierung der verwendeten Verfahren. Dies beinhaltet die Auswertung der Güte und dieEvaluierung der erzielten Ergebnisse. Die Masterarbeit inklusive Kolloquium ist Prüfungsleistung.

Eignungskriterien
Zwingend:

Grundkenntnisse der Informatik
Erfahrungen in dem Umgang mit Tools zur Auswertung großer Datenmengen,
wie z.B. MAT- LAB/Simulink, Python
Teamfähigkeit und Interesse an wissenschaftlicher Arbeit

Optional:

Erfahrungen in den Bereichen der Regelungs- und Automatisierungstechnik und der Visualisierung von Daten und deren Zusammenhänge

Erwerbbare Kompetenzen

Praktischer Einsatz verschiedener Verfahren des Maschinellen Lernens
Big-Data Workflows unter der Verwendung eines Hadoop-Ökosystems
Maschinelle Lernverfahren, speziell im Bereich der Zeitreihenanalyse
Aufbereitung und Präsentation von Analyseergebnissen

Kontakt

Prof. Dr.-Ing. Martin Kohlhase

+49.521.106-7209

martin.kohlhase@hsbi.de