Forscher des Google Brain Teams zu Gast bei der AICommunityOWL

Lucas Beyer ist Spezialist für maschinelle Bilderkennung. Er hat nicht nur die Algorithmen, die es dafür braucht, verbessert. Gemeinsam mit seinem Team von Google Brain hat er auch die Beschreibungen von Bilddatensätzen optimiert. Über seine Erkenntnisse berichtet und diskutiert er am 6. Juli 2021 mit der Machine Learning Reading Group (MLRG) der AICommunityOWL.

Für das menschliche Gehirn sind viele Bilder auf der Grundlage von Wissen verständlich – wir verstehen, was wir sehen. Künstliche Intelligenz muss dafür erst trainiert werden. Ein Roboter beispielsweise muss auf der Grundlage von den Bildern, die er sieht, verstehen, ob er sich am richtigen Ort befindet. Er muss analysieren, welches Teil er als nächstes greifen soll und wo es liegt. Dafür muss er die Bilder auswerten können.

„Maschinelle Bilderkennung war lange ein ungelöstes Problem, bis das Forschungsfeld in den Jahren 2012 bis 2015 revolutioniert wurde“, erklärt Professor Dr. Markus Lange-Hegermann, der am Fachbereich Elektrotechnik und Technische Informatik der TH OWL Mathematik und Datenwissenschaften lehrt. Er ist Initiator der Machine Learning Reading Group der AICommunityOWL. „Die neuen Erkenntnisse haben maschinelle Bilderkennung plötzlich möglich gemacht. Dieser Durchbruch hat auch den Weg für die dann folgende explosionsartige Entwicklung von KI und maschinellem Lernen geebnet.“

Was hatte sich verändert? „Die Algorithmen waren besser, die Computer schneller und es gab online auf einmal einen großen Schatz an Bilddatensätzen, bei denen mit Hilfe von Beschreibungen auch klar definiert war, was man darauf sieht. Damit konnte man die Algorithmen trainieren.“ Gerade für industrielle Anwendungen blieb aber ein Problem: Es gab und gibt noch immer viel zu wenig Bilder, an denen die Fachleute die Algorithmen trainieren können. „Der Anteil an Bilddaten, bei denen erklärt ist, was man darauf sieht, ist oft zu gering“, erklärt Professor Lange-Hegermann. In den letzten Jahren hat sich daher die Technik des Transferlernens etabliert: „Das heißt, dass man mit den Daten trainiert, die man hat und das Bilderkennungsmodell mit ein paar Tricks auf die wenigen vorliegenden Datensätze umschreibt. Lucas Beyer und sein Team bei Google Brain haben es geschafft, diese Algorithmen so zu verbessern, dass man mit sehr wenigen Bildern plötzlich Modelle vom Allgemeinen auf die jeweilige Anwendung transferieren kann“, so Professor Lange-Hegermann.

Das Google Brain Team besteht aus Wissenschaftlerinnen und Wissenschaftlern, die zu Deep Learning, einem Teilgebiet des maschinellen Lernens, forschen, aber auch zu KI im Allgemeinen. „Google Brain wird als akademisches Forschungsinstitut von Google selbst finanziert. Wer dort arbeitet, kann sich ausschließlich auf seine Forschung konzentrieren und ist dafür finanziell sehr gut ausgestattet – entsprechend prestigeträchtig sind diese Stellen“, erklärt Professor Lange-Hegermann. „Lucas Beyer hat eine Reihe von sehr bedeutsamen Papern zur Bilderkennung publiziert, die viel Aufsehen erregt haben. Deswegen bin ich sehr glücklich, dass er vor uns vorträgt.“

Um an der Machine Learning Reading Group teilzunehmen, ist Grundlagenwissen im Maschinellen Lernen erforderlich. Interessierte sollten zur Vorbereitung die angekündigten Paper lesen. Teilnehmen können beispielsweise Studierende technischer Fachrichtungen wie Data Science, Technische Informatik, Elektrotechnik oder Information Technology. Organisator Professor Lange-Hegermann möchte in dem Format Expertinnen und Experten für Maschinelles Lernen aus der Region zusammenbringen.

Mehr Informationen zum MLRG-Treffen am 6. Juli

Hintergrund:

Die AICommunityOWL ist ein Netzwerk aus AI-Enthusiasten – gegründet 2020 von Mitgliedern des Fraunhofer IOSB-INA, der Technischen Hochschule OWL, dem CENTRUM INDUSTRIAL IT – CIIT und Phoenix Contact. Gemeinsam wollen sie das Thema Künstliche Intelligenz in Forschung und Industrie vorantreiben, um Lösungen für die Herausforderungen der Zukunft zu schaffen: für die Industrie, für Mobilität, für intelligente Gebäude und Smart Cities.