Shortnews: Siri beherrscht mit 21 Sprachen, die in 36 Ländern gesprochen werden, deutlich mehr als andere digitale Assistenten. Demnächst soll laut einem Bericht von Reuters noch Shanghainese folgen. Das ist ein spezieller Dialekt, der in und rund um Shanghai gesprochen wird.
Anlässlich dieser Erweiterung hat Reuters beim „Speech Team“ von Apple, die dafür den Hut aufhaben, mal nachgefragt, wie so etwas vonstatten geht.
Zunächst werden demnach festgelegte Textpassagen von Personen mit verschiedenen Akzenten und Dialekten vorgelesen und gleichzeitig auch als Text in das System eingespeist. Auch unterschiedliche Stimmen werden dadurch erfasst. Das System baut daraus ein Sprachmodell und erkennt beispielsweise typische Stimmmuster und Wörterabfolgen der Sprache.
Dann geht es ins Live-System: Zunächst werden für alle Nutzer erst einmal die Diktierfunktionen freigeschaltet. Diese speichert Apple, wenn das der Kunde bei der Einrichtung des iOS-Gerätes erlaubt hat, anonymisiert ab und wertet sie dann aus. Die Diktate werden von Hand ebenso transkribiert, um die Fehlerrate des Systems zu minimieren. Erst wenn dann genug Daten vorhanden sind, wird Siri in der Sprache freigegeben und dann weiter verbessert.
17 Gedanken zu „Im Speech-Team: Wie Siri neue Sprachen lernt“
Die Kommentare sind geschlossen.