KI revolutioniert OCR - Die perfekte Maschine

Text Vision nimmt digitale Abbildungen von Labels, optimiert diese und rekonstruiert schließlich die fehlenden Daten mithilfe der Logik künstlicher Intelligenz. – Bild: Prime Vision

Labels enthalten eine große Menge an Informationen, wie zum Beispiel Adressdaten, Barcodes, Haltbarkeits- und Produktionsdaten, SKU-Nummern (Stock Keeping Unit), Chargencodes und vieles mehr. Abhängig von spezifischen Anforderungen an die Lagerprozesse verschiedener Logistikunternehmen sind all diese Daten für den Sortierprozess möglicherweise von entscheidender Bedeutung.

Optische Zeichenerkennung (OCR) mit künstlicher Intelligenz (KI) trägt dazu bei, die Leserate von Labels auf nahezu 100 Prozent zu steigern. – Bild: Prime Vision

Die Lösung für ‚No-Reads‘ in greifbarer Nähe

Labels werden in der Regel gelesen, wenn Artikel im Rahmen eines Sortierprozesses ein Kameratunnel passieren und liefern verwertbare Informationen, z.B. wo die Sendung hingehen muss, sowie andere wichtige Daten für die weitere Bearbeitung. Allerdings ist es unrealistisch, bei allen Gütern eine perfekte maschinelle Datenerfassung zu erwarten. Labels können verdeckt oder beschädigt sein, was dazu führt, dass eine korrekte automatisierte Lesung unmöglich wird. Auch wenn es sich hierbei nur um einen kleinen Teil der Warenmenge handelt, summieren sich diese Fehler in einem Lager mit hohem Volumen schnell.

Bis vor kurzem resultierten nicht maschinell lesbare Labels in eine zeit- und kostenaufwendige manuelle Intervention, um die entsprechenden Güter wieder in den regulären Sortierprozess zurückzuführen. OCR bietet hierfür eine Lösung. Durch die Verbesserung von Kamerabildern und die Nutzung von Kundeninformationen zur Rekonstruktion und Identifizierung von Schlüsseldatensträngen auf beschädigten oder unleserlichen Etiketten erhöht diese Technologie die Leseraten erheblich. Die Geschwindigkeit, mit der dies geschieht, ermöglicht eine Integration in einen voll automatisierten Prozess.

Verbesserte Leseraten durch Deep Learning

Prime Vision ist bereits vor 20 Jahren damit begonnen, die Leseraten beschädigter oder verdeckter Labels für Postdienstleistungsunternehmen zu optimieren. Seine aktuelle Text-Vision-Lösung unterscheidet sich durch den innovativen Einsatz der KI-Technologien mit der Unterstützung von Deep Learning. Während andere OCR-Systeme Leseraten von 95 Prozent erreichen, kann Text Vision diese auf bis zu 98 Prozent, in Praxisanwendungen selbst auf bis zu 99 Prozent steigern.

Bei der Text Vision Technologie werden Fotos von Labels genommen und diese in einem vorbereitenden Bearbeitungsschritt optimiert. Daraufhin wird der zu lesende Text-Block oder Datenstring ermittelt, extrahiert und schließlich mithilfe von KI rekonstruiert. Durch die Anwendung dieser Schritte gestattet Text Vision eine automatisierte Intervention bei ‚No-Reads‘ mit einer erfolgreichen Zeichenerkennung als Ergebnis, ohne dass hierfür der maschinelle Sortierprozess unterbrochen werden muss.

Um dies zu ermöglichen, muss die KI-Anwendung mithilfe des Deep Learning trainiert werden. So kann die entsprechende Region eines Labels ausfindig gemacht werden, die den Datenstring enthält, der für den Sortierprozess relevant ist. Das System wird anhand realer Beispiele unterschiedlichster Kundenlabels trainiert, damit es schließlich lernt, sich auf den wesentlichen Bereich zu konzentrieren. Um die Rekonstruktion der maßgeblichen Daten noch weiter zu verbessern, kann KI die extrahierten Informationen mit entsprechenden Datenbanken abgleichen. Letztendlich kann das OCR-System für jeden spezifischen Anwendungsbereich optimiert werden, sodass es für jeden individuellen Sortierprozess optimal geeignet ist und bestmögliche Ergebnisse liefert.

Auf der Überholspur

Die Verringerung von Lesefehlern ist zwar für große Logistikbetriebe von großer Bedeutung, aber wie bei allen Lagerhaltungsprozessen ist letztlich die Effizienz des gesamten Systems ausschlaggebend. Die wichtigsten Prinzipien sind: mehr lesen, schneller lesen und Fehler reduzieren. Prime Vision begegnet diesen Herausforderungen mit einem engagierten Forschungs- und Innovationsteam, das aktiv experimentiert und die neuesten Technologien testet, um auf diese Weise das Leistungspotenzial von OCR auf ein noch höheres Niveau anzuheben.

Die Lösung für ‚No-Reads‘ in greifbarer Nähe

Verbesserte Leseraten durch Deep Learning

Auf der Überholspur

Schreibe einen Kommentar Antworten abbrechen