Wie wäre es, wenn Sie mit Ihrer Maschine sprechen könnten?

Bild: AITAD GmbH

In vielen Haushalten hat der Einsatz von Sprachassistenten bzw. Keyword-Spotting Lösungen den Alltag verändert. Nach einem sogenannten Wake-Word wie etwa „Alexa!“, Hey Siri“, welches die Applikation aktiviert, übermittelt diese den Wunsch des Bedienenden an einen entfernten Server, der den Sprachbefehl analysiert und anschließend das Auswertungsergebnis an das Gerät zurücksendet. Auf diesem Weg werden etwa Musikwünsche erfüllt, ein Film auf die Playlist gesetzt oder Weihnachtsgeschenke bestellt. Ähnlichkeiten in der Technologie finden sich auch in der Industrie und Medizintechnik, wo KWS an Bedeutung zunimmt. Durch die Erfassung und Nutzung von Sprache können schon heute Prozesse beschleunigt sowie effizienter gestaltet und sogar Leben gerettet werden.

„Wenn der Mitarbeitende die Maschine in der Produktion mit seiner Stimme steuert, dann bedeutet das mehr Flexibilität“, sagt Viacheslav Gromov, Geschäftsführer vom KI-Anbieter Aitad.

Bild: AITAD GmbH

Spracherkennung in Industrie und Medizintechnik

Die Übertragung von Sprachsignalen an entfernte Server birgt Latenzzeiten, die in sicherheitsrelevanten Umgebungen nicht akzeptabel sind. Ebenso spielen das Manipulations- und Ausfallrisiko einer Netzwerkverbindung eine Rolle. Der Einsatz in sicherheitskritischen Umgebungen in Industrie und Medizin erfordert Lösungen, die lokal und in Echtzeit arbeiten. Hier kommen Sprachsteuerungsmodelle ins Spiel, die mit Embedded-KI umgesetzt werden. Hierbei werden nicht nur einzelne Wakewords erkannt, sondern bis zu 30 vordefinierte Begriffe, was komplexe Befehle ermöglicht. Ein Schlüsselwort aktiviert das System. Anschließend können komplexe Kombinationen dieser vordefinierten Wortgruppe gesprochen und von der KI ausgewertet werden, die zusammen mit den Mikrofonen auf dem gleichen kleinen Board sitzt (Embedded-KI-Systemkomponente).

Beispiele für solche Sprachbefehle (hier im Beispiel mit ‚Roboter‘ als Wakeword):

  • „Roboter, starte Programm A auf Maschine 3“
  • „Roboter, Förderband 6 anhalten“
  • „Roboter, Motor 4 in Maschine 3, erhöhe die Drehzahl um 40 Prozent“
  • „Roboter, Rollstuhl, jetzt links abbiegen“
  • „Roboter, Not aus“

Frei konfigurierbar, echtzeitfähig und robust

Die Einsatzmöglichkeiten für Sprachsteuerungen sind nahezu unbegrenzt:

  • Im Operationssaal können Chirurgen das Hochfrequenzskalpell per Sprachbefehl starten, justieren und wieder abschalten.
  • Berührungsloses Steuern von Maschinen und Geräten in Produktion und Krankenhäusern.
  • Notaus per Sprachbefehl erspart im Ernstfall den Spurt zum Not-Aus-Schalter.
  • Menschen mit Assistenzbedarf können beispielsweise den Rollstuhl per Sprache steuern.

Auch in rauen Umgebungen geeignet

Embedded-KI-Sprachsteuerungen können auch in rauen Umgebungen eingesetzt werden. Die KI wird mit Störgeräuschen trainiert, um eine zuverlässige Spracherkennung sicherzustellen, selbst wenn es in der Umgebung laut ist. Die Integration eines zusätzlichen Mikrofons ermöglicht es, den Standort des Sprechers zu erkennen und störende Geräusche zu eliminieren (Beamforming).

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert