Mobile Monday #36 – Voice Search & künstliche Intelligenz - Bühne

Mobile Monday #36 – Voice Search & künstliche Intelligenz

Im Mobile Monday #36 wurden künstliche Intelligenzen und die Auswirkung auf unser tägliches Leben sowie das Auffinden von Informationen unter die Lupe genommen.

PodiumsdiskutantInnen

• Thomas Urban, Director Operations & Growth von Improove
• Michael Katzlberger, CEO von TUNNEL23
• Liz Myers: Voice Designer & Coach, vormals Alexa Evangelist.

Zu Beginn stand die Frage im Raum, bei welchen alltäglichen Ereignissen uns eine künstliche Intelligenz eigentlich unterstützen kann. Vor allem auch, warum wir mit ihr sprechen anstatt schreiben sollten?

Vorrangig wird hier die schnelle Interaktions- und Kommunikationsmöglichkeit genannt: Wenn wir sprechen sind wir flotter und kommen schneller an Informationen, als wenn wir uns erst Terme überlegen müssen, um z.B. auf Google zu suchen.

Das hat sogar evolutionäre Gründe: Sprechen lernen wir viel früher und schneller als schreiben.
Dennoch steckt die Technik noch in den Kinderschuhen und es gibt einerseits sehr viel Optimierungspotential auf technischer Seite, andererseits aber auch die Möglichkeit wirtschaftlich in diesem Bereich Fuß zu fassen.

Eine Frage des Abends war dahingehend, warum gerade jetzt die Entwicklung in Richtung „Voice Commands & Search“ vorangetrieben wird?
Das hat einerseits den Grund, dass uns jetzt die Möglichkeiten zur Verfügung stehen. Vergleicht man die Spracherkennung von früher mit heute, liegen zwischen der korrekten Identifikation von Befehlen fast 40% Trefferrate. Diese Steigerung liegt in der Entwicklung von neuralen Netzwerken und dem Sammeln und Interpretieren von sehr vielen Daten.

Apropos Sammeln, ein Mythos konnte Montag abends entzaubert werden: Alexa, als Vertreter einer KI, nimmt nicht dauerhaft die Umgebung auf, sondern reagiert mit einem extra Chip auf sogenannte „Wakewords“ – praktisch eine Art Hardwareschutz, auch vor ungewollten Aufnahmen durch Fremdsoftware.

Der Abend hatte aber neben diesem Thema auch weitere kritische Fragen auf Lager:
Durch eine Stimmenausgabe und Eingabe von Information fehlt uns das bekannte „Screenen“ von Informationen und der eigenen Auswahl geeigneter Quellen. Die KI gibt uns quasi vor, was die „eine Antwort“ auf unsere Frage ist – offiziell natürlich auf Basis von Relevanz. Doch wie wird diese Relevanz bestimmt und inwiefern ist dies durch Missbrauch geschützt? Auch im Bezug auf Hacking können hierbei Gefahren entstehen, wodurch zurecht die Frage nach einer gesetzlichen Regulierung gestellt wurde.

Dennoch und das muss man betonen, ist die Technik hinter KIs eine neue Errungenschaft. Ein Sprachinterface bietet ebenso viele Möglichkeiten. Man stelle sich vor, wie eine KI demenzkranke Personen unterstützen kann. Durch Sprache, erkennen wir schnell wie ein sehr positives Einsatzfeld aussehen kann. Auch personalisierte Dienste stehen auf der Liste der Möglichkeiten: individuelle Daten abfragen, Sicherheitstools basierend auf Stimmen oder selbst das Erkennen von Businessworkflows.

Einen kleines Stück Zukunft und auch die großen Entwicklungsfelder von KI konnten durch ein Video abgerundet werden:

Emotional Recognition, Multiturn Conversations, History of Experience und neue Arten Informationen zu suchen sind Themen, die uns – vielleicht schon früher als später – beschäftigen werden.