Mit KI-basierter Bilderkennung die Pollenzusammensetzung in Honig bestimmen
‹
›
Um die geografische Herkunft und die botanische Zusammensetzung von Honig zu bestimmen, werden Honigsedimente manuell im Labor analysiert. Ganz so, wie es die entsprechende DIN-Norm vorgibt, um Honig korrekt auszuzeichnen, Allergiker:innen zu informieren und Daten über die Biodiversität zu gewinnen. Der Prozess ist allerdings sehr arbeits- und zeitaufwendig. Hier setzt Philipp Viertel an, der am Campus Minden der Hochschule Bielefeld (HSBI) an KI- basierten Bilderkennungsverfahren für die Pollenzusammensetzung in Honig forscht. Im Rahmen seiner Promotion entwickelt er intelligente Lösungsansätze für diesen Prozess, die vor allem auch in der Laborarbeit eingesetzt werden können.
Bielefeld (hsbi). Acht Seiten umfasst die DIN-Norm, in der die Untersuchung von Honig und die Bestimmung der relativen Pollenhäufigkeit genaugeregelt ist: Die Honigproben werden dazu händisch ausgezählt. Das heißt, darauf spezialisierte Expertinnen oder Experten erstellen im Labor ein Sediment, zählen mindestens 500 Pollenkörner und identifizieren diese. Dadurch kann der Leitpollen bestimmt werden, der insbesondere dafür dient, das Honigprodukt korrekt auszuzeichnen, zum Beispiel als Lindenhonig. Man erhält aber auch Informationen zur botanischen Zusammensetzung des Pollens im Honig, was für Allergiker:innen von großer Bedeutung ist. Auch die geographische Bestimmung wird dabei durchgeführt, und die Informationen aus dem Honig geben zudem Rückschluss auf die Biodiversität.
Der Nachteil: Das manuelle Verfahren im Labor ist sehr arbeits- und zeitaufwendig und bedarf hoch spezialisierter Fachkräfte. Viele Imker:innen können sich ständige Analysen jedoch nicht leisten und schätzen dann selber, welche Zusammensetzung der Honig hat. „Solche Selbsteinschätzungen sind oft falsch, wie Studien zeigen“, so Philipp Viertel.
Was könnte eine Künstliche Intelligenz hier verbessern? Philipp Viertel erklärt: „Ziel meiner Arbeit ist es, diesen aufwendigen Prozess zu automatisieren bzw. zu unterstützen mittels Methoden der Künstlichen Intelligenz.“ Denn eine Automatisierung oder KI-Unterstützung wäre nicht nur weniger aufwendig. Sie könnte quantitativ noch mehr Analysen bereitstellen, zum Beispiel über das Trachtverhalten der Bienenvölker, also welche Pflanzen sie anfliegen, was genau findet sich im Honig, wie verändern sich diese Indikatoren über die Zeit, usw. Eine bessere Kennzeichnung von Honigprodukten würde auch Allergiker:innen noch besser schützen.
Die Idee kam von den Bienenfreunden Minden
Doch noch einmal ganz zum Anfang zurück: Wie kommt man überhaupt darauf, KI und Honig in Verbindung zu bringen? Schließlich ist Philipp Viertel gar kein Imker. „Ich habe hier in Minden Informatik studiert und dabei von Beginn miterlebt, was angewandte Forschung bedeutet. So wurde mein Interesse an KI-Verfahren wie neuronalen Netzen geweckt, und ich habe in meiner Masterarbeit ein KI-Thema in der Bildverarbeitung untersucht. KI und maschinelles Lernen kann man in unendlich vielen Bereichen einsetzen. Deshalb war für mich schnell klar, dass ich auch nach dem Master weiter wissenschaftlich arbeiten möchte. Dass ich nun über KI und Honig promoviere, geht darauf zurück, dass wir 2019 von Imkern aus der Region Minden-Lübbecke zum Thema Herkunftsbestimmung für Honigerzeugnisse angesprochen wurden. Reinhard Jäger von den Bienenfreunden Minden hatte damals den Kontakt zur Hochschule aufgenommen. Das Thema hat mich fasziniert und so bin ich es angegangen.“
Betreut wird er in dem Projekt „Automatische Klassifikation von Pollenproben“ von Prof. Dr. Jan Rexilius, der am Campus Minden die Professur für Angewandte Informatik, insbesondere maschinelles Sehen und Simulation innehat.
Zunächst hat der Doktorand sich ein Bild über den Stand der Forschung verschafft und sich mit Expertinnen und Experten ausgetauscht. Bei einem Besuch der Landesanstalt für Bienenkunde der Universität Hohenheim konnte er sich den Laborprozess anschauen und hat auch selber am Mikroskop gesessen. „Ich habe einen eigenen Datensatz von Pollenbildern erstellt, den ich für meine Forschung verwende“, ergänzt Philipp Viertel. Außerdem hat er sich mit freien Palynologen, also Pollenkundlern, vernetzt. Die Ergebnisse hat er bereits in mehreren wissenschaftlichen Arbeiten publiziert und auf Fachtagungen vorgestellt, beispielsweise bei der Gesellschaft für Informatik in der Land- und Forstwirtschaft.
Mit synthetischen Pollenbildern gegen die schlechte Datenlage
Ganz konkret wertet der Doktorand Pollenbilder aus: Dabei werden mit einem Lichtmikroskop Bilder aus dem Honigsediment bei mindestens 400-facher Vergrößerung aufgenommen. Zusätzlich kann angefeuchteter Pollen direkt von den Blüten genommen werden – sozusagen als Referenzmaterial. Auch dabei werden mikroskopische Bilder mit derselben Vergrößerung aufgenommen.
Viertel hat bereits gute Ergebnisse erzielt, insbesondere für Szenarien mit wenigen Pollenklassen, also Honige, für die die Bienen wenige unterschiedliche Pflanzen angeflogen haben. „Probleme bereiten mir die große Diversität im Honig, die schlechte Datenlage und die inhomogene Bildqualität der Pollenbilder, die zum Beispiel durch Färbemittel entsteht.“ Es gibt nämlich nur recht wenige Datensätze, die öffentlich zugänglich sind und diese weisen oft Merkmale auf, die die Auswertung erschweren. Zum Beispiel decken sie eine Flora ab, die mit unserer mitteleuropäischen nicht kompatibel ist, oder sie wurden gefärbt. Palynologen färben Pollen oft mit dem Farbstoff Fuchsin, um bestimmte Strukturelemente der Pollenkörner besser hervorzuheben. Die Pollen werden dadurch allerdings lila gefärbt.
Mit seinen wissenschaftlichen Arbeiten versucht Philipp Viertel, diese Probleme zu lösen. In Experimenten hat er synthetische Pollenbilder erzeugt und dabei besonderer KI-Verfahren eingesetzt. Synthetische Pollenbilder sind selbst erzeugte Pollenbilder, um der schlechten Datenlage entgegenzutreten. Das heißt, man trainiert ein besonderes neuronales Netz auf bestehenden Daten und als Ergebnis werden ähnliche, aber neue Bilder erzeugt. Das bringt Vor- und Nachteile mit sich, erklärt Viertel: „Die synthetischen Bilder können relativ gut verwendet werden und sogar echte Daten teilweise ersetzen. Auf der anderen Seite benötigt man aber bereits einen Datensatz, um erstmal zu lernen, bevor man neue Bilder synthetisch erzeugen kann.“
Methode des „Few-Shot Learning“ aus der Gesichtserkennung könnte ein weiterer Ansatz sein
Einen weiteren Lösungsweg sieht er im so genannten Few-Shot Learning, das mit nur sehr wenigen Bildern gute Klassifikationsergebnisse liefern kann. Typische Deep Learning-Verfahren benötigen oftmals sehr viele Daten, die auch alle gelabelt sein müssen. Das erfordert sehr viel händische Arbeit. Few-Shot Verfahren bieten hier eine Alternative. Die Verfahren werden beispielsweise in der Gesichtserkennung verwendet. Der Wissenschaftler erklärt: „Man extrahiert mittels eines neuronalen Netzwerks die visuellen Merkmale eines Pollenbildes, aber anstatt eine Klassifizierung im Sinne einer Vorhersage zu generieren, wird ein eindimensionaler Vektor gebildet, ein Encoding des Bildes. Aus wenigen Bildern wird dann ein gemittelter Prototyp erzeugt. Mit einem metrischen Distanzmaß wird dann ein neues unbekanntes Bild dem Klassenprototyp zugeordnet, wo der Abstand am kleinsten ist.“
Aktuell arbeitet Philipp Viertel an einer Publikation, wie der Few-Shot Ansatz mit multi-fokalen Bildern erweitert werden kann. Eine weitere Problemstellung bei Pollenbildern ist nämlich, dass sie niemals scharf sind, weil sie nicht auf die selbe optische Ebene zu bekommen sind. Das bedeutet, dass man mit dem Mikroskop ständig fokussieren muss und die Pollenmerkmale dabei in unterschiedlicher Schärfe zu sehen sind. So sind die Ornamente auf der Hülle, also zum Beispiel Stacheln oder Rillen, gut zu sehen, aber dafür ist die Textur unscharf. Fokussiert man dann, ist das Ergebnis umgedreht: Textur scharf, Ornamente unscharf. Möglicherweise wird das Verfahren später in einem staatlichen Labor getestet, zum Beispiel in der Landesanstalt für Bienenkunde der Universität Hohenheim.
Ergebnisse könnten auf andere Einsatzbereiche übertragen werden
Die Verfahren und Ideen ließen sich auch auf andere Palynomorphe übertragen wie beispielsweise Sporen aus Luft- oder Bodenproben, im Wald oder in Räumen – Stichwort Schimmelsporen. „Generell ist das Verfahren übertragbar auf Szenarien, bei denen mikroskopische Objekte analysiert werden müssen, bei denen die Datenakquise sehr schwierig und aufwendig ist.“ Entsprechende Institute seien an so einem Verfahren interessiert. Dafür müsste es in einem staatlichen Labor zunächst getestet werden. Den Grundstein dafür hat Philipp Viertel mit seiner Doktorarbeit, die er zurzeit schreibt, gelegt. Er wird noch bis Ende Juli am Campus sein, dann geht es für ihn ins Klinikum Mitte in Bielefeld, wo er seine Kenntnisse aus KI und Bildverarbeitung im medizinischen Bereich einbringen und an Forschungsprojekten aktiv mitarbeiten wird. Dort ist er bereits jetzt mit einer halben Stelle tätig. Honig ist dann also erstmal kein Thema mehr für ihn. „Höchstens zum Frühstück“, sagt Viertel augenzwinkernd. (vku)
Philipp Viertel promoviert am Promotionskolleg (PK) NRW. Das PK NRW ist eine wissenschaftliche Einrichtung eines Netzwerks von 21 Hochschulen für angewandte Wissenschaften (HAW) in Nordrhein-Westfalen. Die HSBI ist Teil dieses Netzwerks. Gegründet wurde das PK NRW im Jahr 2020. Es bietet neben umfassenden, interdisziplinären Qualifizierungsangeboten auch die Möglichkeit, strukturierte Promotionsprogramme zu durchlaufen. Denn im November 2022 wurde dem PK NRW das Promotionsrecht verliehen. Es kann nun – wie zuvor nur Universitäten – selbst Doktorgrade verleihen. Seit dem 1. September 2023 ist es möglich, sich für eine kooperative Promotion zwischen HSBI und PK NRW einzuschreiben.
Für weiteres Bildmaterial können Sie sich gerne an presse@hsbi.de wenden.