Voicebots werden aktuell immer interessanter für Unternehmen, die Ihren Kundenservice automatisieren möchten. Hierbei stellt sich bei vielen Unternehmen die Frage, inwiefern ein KI-Bot die Kunden gut verstehen kann. Wie schaut es aus mit Leuten mit Akzenten? Was ist mit älteren Menschen? Was ist, wenn es Hintergrundgeräusche gibt?
Unsere Erfahrung ist, dass die heutigen Technologien schon gut genug sind, um ein Großteil der Konversationen unfallfrei durchzuführen. Die Latenzen sind gering. Das Gesprochene wird gut erkannt. Mehrere Sprachen können gleichzeitig erkannt werden. Nichtsdestotrotz gibt es noch einige Herausforderungen.
Herausforderungen
- Akzente: Die gängigen Speech to Text Technologien könnten Probleme haben Akzente zu erkennen, die sehr weit vom Hochdeutsch abweichen. Akzente aus der Schweiz und Österreich sind hiermit ausgeschlossen – diese Dialekte können mittlerweile sehr gut erkannt werden.
- Fremde Produktnamen: Falls Ihr Unternehmen Produkte aus anderen Ländern verkauft, könnte es sein, dass der Kunde in einem deutschen Satz Nomenklatur aus anderen Sprachen verwendet, z.B. „ich möchte einen Sauvignon Blanc Wein bestellen“. Hier hilft es oft das Speech to Text Modell mit dem Katalog der Produktnamen zu fine-tunen / zu trainieren.
- Email-Adressen: Es ist schwer / fast unmöglich Email-Adressen wie kevin(Punkt)wu(at)leapingai(Punkt)com präzise zu erkennen mit einem Voicebot. Nicht nur enthalten diese Buchstaben und andere Zeichen gemischt in einem Wort; häufig findet man auch Denglisch in den Emails. Unsere Empfehlung ist es Email-Adressen wo nur möglich zu vermeiden.
- Namen: Es könnte schwierig sein, Namen von Personen präzise zu erkennen. Wird der Name Berthold als Berthold, Bertolt oder Bertholdt buchstabiert? Hier hilft es häufig den Namen nochmal Buchstabe für Buchstabe zu wiederholen und das Verständnis zu verifizieren.
- Ältere Menschen: Wenn der Benutzer nuschelt oder sich nicht deutlich ausdrückt, kann es in der Tat eine Herausforderung sein jedes Wort präzise zu transkribieren. Auch hier hilft es beim Kunden nochmal einen Follow-up zu machen, z.B. „könnten Sie dies bitte noch einmal wiederholen?“
- Hintergrundgeräusche: Wenn mehrere Personen gleichzeitig reden, kann es eine Herausforderung sein das gewünschte Transkript zu bekommen.
Fazit
Aktuell gibt es noch einige Herausforderungen für Voicebots den Kunden präzise zu erkennen. Unsere Empfehlung ist es jedoch dies nicht als Anlass zu nehmen, um einen Einsatz von Voicebot auszuschließen. Für fast alle Herausforderungen gibt es Workarounds + die Basistechnologie verbessert sich sehr schnell aktuell.