Was fehlt der KI?

Bild 1 | Um KI effektiv für Bildverarbeitungsaufgaben einsetzen zu können, reicht die übliche Bereitstellung von Hardware allein nicht aus. Ein Umdenken ist notwendig.
Bild 1 | Um KI effektiv für Bildverarbeitungsaufgaben einsetzen zu können, reicht die übliche Bereitstellung von Hardware allein nicht aus. Ein Umdenken ist notwendig.
Bild 1 | Um KI effektiv für Bildverarbeitungsaufgaben einsetzen zu können, reicht die 
übliche Bereitstellung von Hardware allein nicht aus. Ein Umdenken ist notwendig.
Bild 1 | Um KI effektiv für Bildverarbeitungsaufgaben einsetzen zu können, reicht die übliche Bereitstellung von Hardware allein nicht aus. Ein Umdenken ist notwendig.Bild: IDS Imaging Development Systems GmbH

Das ist eine Frage, die momentan häufig diskutiert wird. Die Antwort liegt wie so oft im Auge des Betrachters. Die notwendige Hardware für den produktiven und effizienten Einsatz steht jedenfalls zur Verfügung. Viele Hersteller von Vision Hardware haben das bereits erkannt, wie das stetig wachsende Angebot von KI-Plattformen unterschiedlicher Leistungsklassen zeigt. Aber es gibt dennoch Startschwierigkeiten. Die übliche Bereitstellung von Hardware allein reicht nicht, ein Umdenken ist notwendig.

Intelligente KI-Edge-Geräte reduzieren anfallende Sensor-/Bilddaten. Sie erzeugen on-the-edge verwertbare Informationen und kommunizieren diese zur Steuerungseinheit.
Intelligente KI-Edge-Geräte reduzieren anfallende Sensor-/Bilddaten. Sie erzeugen on-the-edge verwertbare Informationen und kommunizieren diese zur Steuerungseinheit. Bild: IDS Imaging Development Systems GmbH

Es fehlt an Erfahrung

Wenig hilfreich ist, dass KI bzw. Machine Learning (ML) ganz anders funktioniert als regelbasierte Bildverarbeitung und sich damit auch die Herangehensweise und Bearbeitung von Vision Aufgaben unterscheidet. Die Qualität der Ergebnisse ist auch nicht mehr das Produkt von manuell entwickeltem Programmcode, sondern wird durch den Lernprozess mit geeigneten Bilddaten bestimmt. Was so einfach klingt, führt nur mit ausreichend Fachwissen und Erfahrung zum gewünschten Ziel. Ohne geschultes Auge für die richtigen Daten treten oft Fehler auf, die wiederum zu einer falschen Anwendung von ML-Methoden führen. Tests haben gezeigt, dass unterschiedliche Nutzer für die selbe Aufgabe sehr unterschiedliche Trainings-Qualitäten der künstlichen neuronalen Netze (KNN) erzielen, weil teilweise Bilder mit zu viel unwichtigem Inhalt, schlechter Belichtung, Unschärfe oder auch falschen Labels für das Training verwendet wurden.

Die Schlüsselkompetenzen für die Arbeit mit ML-Methoden sind nicht mehr dieselben wie bei der regelbasierten Bildverarbeitung und müssen gezielt aufgebaut werden. Wer bereits die Zeit und Ressourcen hatte, damit zu arbeiten, zu testen und zu spielen, sammelt diese Erfahrung und kennt die Fallstricke. Deshalb beschäftigen sich derzeit wohl eher neue Firmen und Startups mit KI. Sie haben keine Altlasten, sind nicht an bestehende Verfahren gebunden und wagen sich teilweise spielerisch und mit viel Forscherdrang an Aufgaben, wo die klassische Bildverarbeitung bisher ohne Lösung blieb. Doch solange die Big-Player die neue Technologie noch nicht flächendeckend beim Kunden einführen und sich dafür stark machen, fehlt das Wissen und das Vertrauen – auch beim Kunde. Um die alten Hasen aus ihrer Komfortzone zu locken, muss sich daher etwas ändern, denn die KI steht einem etablierten System gegenüber, für das in den vergangenen Jahren passende Umgebungsbedingungen geschaffen wurden. Wissen, Dokumentation, Trainings, Hardware, Software, Entwicklungsumgebungen, Akzeptanz und Nachfrage seitens der Kunden hatten lange Zeit zu reifen. KI kommt dagegen noch sehr roh und puristisch daher. Wer sie beherrscht erntet zwar Bewunderung und Anerkennung, aber auch fragende Gesichter und Unverständnis.

Ein weiterer Aspekt sind neue Zielgruppen. Dr.-Ing. Peter Ebert, Chefredakteur der inVISION und Kenner der Szene meint „Die Vision-Community der Zukunft besteht nicht nur aus klassischen Bildverarbeitungsexperten, sondern bekommt auch Zuwachs aus dem IoT-Bereich.“ Mit neuen Anwendergruppen ergeben sich zwangsläufig auch andere Use Cases und Anforderungen für die Nutzung vorhandener Technologien. Nicht immer reicht dort das klassische Programmier-SDK aus. Altbewährte Regeln müssen aufgebrochen werden.

Bild: IDS Imaging Development Systems GmbH

Software als KI-Wegbereiter

Es fehlt nicht an passender Hardware. Die Einsatzmöglichkeiten von ML werden durch effizient arbeitende KI-Beschleuniger vor allem interessant für kleine stromsparend arbeitende Embedded Vision Systeme bzw. vollintegrierte Inferenzkamera Plattformen, wie sie bereits von einzelnen Herstellern angeboten werden. Doch die Startschwierigkeiten der neuen Technologie in der Industrie löst das nicht. Die KI muss getestet, validiert, nachtrainiert und abschließend in einen produktiv arbeitenden Workflow (Anwendung) integriert werden. Aber wer macht das und wer kann das? Dafür sindKompetenzen notwendig, die über eine Prototypenentwicklung hinausgehen. Meist braucht es noch einen Systemprogrammierer, der in der Lage ist, diese Werkzeuge für eine spezielle Plattform zu programmieren.

IDS geht mit der NXT Plattform einen anderen Weg und ist überzeugt davon, dass mit den richtigen, aufeinander abgestimmten Werkzeugen jede Benutzergruppe das Potential einer KI-Vision-Plattform voll nutzen kann. Dies ohne viel Zeit und Kosten in den Aufbau neuer Kernkompetenzen zu stecken, die für die Umsetzung eigener KI-Anwendungen gar nicht zwingend nötig sind. Spezialwissen für das Trainieren neuronaler Netze undProgrammieren eigener Anwendungen lassen sich für viele einfache KI-Workflows in den Werkzeugen verpacken. So kann jeder Anwender seine individuellen Anforderungen umsetzen, ohne ein eigenes Spezialistenteam aufzubauen. Die Software ermöglicht dabei, dass jede Benutzergruppe, die für ihre jeweiligen Aufgaben und Arbeitsweisen passenden Werkzeuge verwenden kann.

Eine Bildverarbeitungsanwendung ist der Rahmen, der mehrere spezifische Einzelaufgaben in einen anwendungsspezifischen Ablauf bringt und fehlerfrei und effizient ausführen soll. Klassisch wird diese Aufgabe von Entwicklern in einem zur Plattform passenden Programmcode wie z.B. C++ programmiert. Wenig anders verhält es sich bei den neu auf den Markt kommenden KI-Plattformen. Ein SDK stellt die notwendigen Softwareschnittstellen zur hardwarenahen Programmierung der jeweiligen Plattform mitsamt der vorhandenen KI-Beschleuniger bereit. Meist steht den Anwendungsentwicklern damit eine weitgehend frei programmierbare Plattform für eigene Prozesslösungen zur Verfügung. Für denjenigen, der weiß was er tut, stellen lediglich die Hardwareperformance und die SDKs eine Grenze für die Kreativität dar. Auch die NXT Inferenzkamera ist durch ein ein entsprechendes SDK mit vielen C++ Sourcecode-Beispielen eine offene Plattform für Entwickler, die vollständig eigene Bildverarbeitungsanwendungen in Form von Vision Apps mit dem KI-Beschleuniger deep ocean entwerfen wollen.

Geführte Anwendungserstellung

Ein Großteil der Bildverarbeitungsanwendungen arbeiten jedoch mit relativ einfachen Abläufen: Bild aufnehmen Bild analysieren bzw. Merkmale extrahieren Prozessentscheidungen treffen Aktion einleiten. Das kann einfaches Erkennen und Klassifizieren von Produkten sein, mit anschließender Weiterleitung von Informationen über verschiedene Schnittstellen an eine Maschinensteuerung oder Sortieranlage. Das sind Basisfunktionalitäten, die sich nur in wenigen Details unterscheiden und deshalb nicht jedes mal neu programmiert werden müssten. Doch die Auswahl eines Deep Learning (DL) Use Cases, wie Klassifikation oder Objekt Detektion sind als Einstiegspunkt für ein Projekt oft bereits zu abstrakt, um die weiteren notwendigen Handlungsschritte für die Datenaufnahme und Vision App Konfiguration ableiten zu können.

Veröffentlicht am
Kategorisiert in inVISION

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert