Per Spracheingabe

Das Computer-Vision-Modell von Sereact ist ein grundlegendes Modell für das Greifen mithilfe von Robotern. Es ist in der Lage, Segmentierungen, 3D-Boxen und Greifpunkte für Objekte vorherzusagen, die es noch nie zuvor gesehen hat. Hinzu kommt die Lösung PickGPT, ein Bild/Sprach-Aktionsmodell, das in der Lage ist, Roboteraufgaben auf der Grundlage von Bild- und Spracheingaben auszuführen. So lässt sich die Flexibilität des Robotersystems erhöhen. Mithilfe der Fähigkeit, Befehle in natürlicher Sprache zu verstehen, können die Roboter leicht für verschiedene Aufgaben umprogrammiert werden, ohne dass umfangreiche Kodierungen erforderlich sind. Das ist besonders nützlich in dynamischen Umgebungen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert