VisionGPT?

Die Diskussionsteilnehmer (v.l.n.r): Eric Carey (Teledyne), Thies Möller (Basler), Donato Montanari (Zebra), Ronni Vuine (Micropsi), Olaf Munkelt (MVTec) und Moderator Peter Ebert (inVISION).

Laut Statista beträgt der Markt für generative KI im Jahr 2024 rund 33Mrd.€ und wird sich bis 2030 verzehnfachen. ChatGPT hat gezeigt, wie generative KI erfolgreich eingesetzt werden kann, aber ist dies auch für die industrielle Bildverarbeitung möglich? Während der Vision 2024 traf sich Chefredakteur Peter Ebert mit fünf Experten aus der Branche, um die Chancen und Risiken zu diskutieren.

Generische KI-Bilderkennung

Bild 2 | Abbildung von AnomalyAI inkl. Datenerstellung, Modelltrainings und Erkennung echter Anomalien

Die visuelle Qualitätskontrolle in der Industrie ist besonders bei der Anomalieerkennung mit großen Herausforderungen konfrontiert. Klassische KI-Modelle verlangen dabei große Mengen an Trainingsdaten, die oft nicht verfügbar sind. Ein neues Verfahren von Codecentric generiert synthetische Fehlerbilder und benötigt hierfür keine echten fehlerhaften Daten. Die Technologie zeigt hohe Präzision bei Stoff-, Holz- und Lederoberflächen und verbessert die Effizienz und Flexibilität der Fehlererkennung erheblich.

Edge Vision im Praxistest

Bild 1 | Durch die Kombination von Hardware, Software und Services ermöglicht das Industrial Edge Ökosystem skalierbare Bildverarbeitungslösungen, z.B. mit entsprechenden Apps von Basler oder MVTec.

Mit der Aufnahme des Vision Connectors von Basler und der Anomaly Detection for Visual Inspection von MVTec in das Siemens Industrial Edge Ecosystem können Vision-Lösungen einfacher in Automatisierungslandschaften integriert werden. Anstelle komplexer Insellösungen entsteht ein flexibles System, in dem sich Lösungen mit wenigen Klicks skalieren und verwalten lassen. Ein Jahr nach dem Start stellt sich die Frage: Wie haben sich die Lösungen in der Praxis bewährt und weiterentwickelt?

Deep OCR direkt auf der Kamera

Das Deep-OCR-Modell der Denknet OCR von Denkweit erkennt nicht nur einzelne Zeichen, sondern berücksichtigt nun auch deren Zusammenhänge mit hoher Zuverlässigkeit.

Accelerate IoT

Image 1 | The intelligent vision sensor IMX500 with AI processing capabilities enabled devices output only metadata, reducing the amount of transmitted data and costs for the overall system operation.

Aitrios – an edge AI sensing platform by Sony Semiconductor Solutions (SSS) – is designed to accelerate the development and deployment of image sensor-based sensing solutions, and revolutionizes the way we use IoT devices.

Food Observation

Image 1 | The Smart Replenishment Solution Dashboard

Applied firstly in the fresh food shelves in supermarkets, an intelligent solution of Macnica ATD Europe and Asus IoT combines shelf compliance and electronic shelf labeling (ESL) for the retail business. It involves a camera-based and AI-driven system to automate the replenishment process by alerting when stock is low, and focuses on automating price tag changes using electronic shelf labeling.

MIPI-Vision

Image 2 | Emerging Vision System Architecture Considerations (*Current developments)

Machine vision (MV) is poised for a more intelligent and powerful future, driven by advancements in AI-assisted image signal processing (ISP) and sensing. The MIPI Camera Working Group and Camera Interest Group continue to actively engage with the broader industry to identify emerging vision applications and drive the ongoing evolution of MIPI CSI-2, the widely adopted camera interface introduced in 2005.

Vertrauenssache

Bild 1 | KI-basierte Bildverarbeitungssysteme verfügen über eine bessere Generalisierbarkeit und können sich ändernde Bedingungen eleganter handhaben als regelbasierte Systeme.

Die Integration von KI-Vision in der automatisierten Fertigung ist ein bedeutender Wandel von deterministischen Systemen zu statistischen Modellen. Die Technologie ermöglicht Anwendungen ohne Programmieraufwand und demokratisiert damit die Technologie für verschiedene Levels an Expertise. Doch es gibt Vorbehalte gegenüber einer vermeintlichen Black Box. Shirin Saleem, KI-Expertin bei Cognex, erklärt die Vorteile der KI-Vision Systeme.

Vorhergesagte Bewegungen

Bild 1| Bei bewegten Objekten ist es erforderlich, ihr Verhalten in Echtzeit vorhersagen zu können. FPGA-basierte KI-Vision Plattformen helfen diese Aufgaben zu erledigen.

Multikamera basierte KI-Visionanwendungen revolutionieren derzeit die Objekterkennung und -verfolgung. FPGA-basierte modulare Plattformen sind prädestiniert für den Aufbau solcher echtzeitfähiger Lösungen. In Anwendungen mit mehreren Kameras müssen die Daten zudem synchronisiert und Vorhersagen über die Bewegung von Objekten in einem zu spezifizierenden Raum getroffen werden. N.A.T. bietet OEMs für entsprechende Lösungsplattformen.

MIPI-Vision

Figure 2 | Emerging Vision System Architecture Considerations (*Current developments)

Machine vision (MV) is poised for a more intelligent and powerful future, driven by advancements in AI-assisted image signal processing (ISP) and sensing. The MIPI Camera Working Group and Camera Interest Group continue to actively engage with the broader industry to identify emerging vision applications and drive the ongoing evolution of MIPI CSI-2, the widely adopted camera interface introduced in 2005.