Spracherkennung und Interpretation ist für uns Menschen eines der alltäglichsten Dingen überhaupt. Wir unterhalten uns nicht nur mit einer Person, sondern können uns auch mit mehreren Personen gleichzeitig unterhalten ohne den Faden zu verlieren. Doch die Erkennung von Sprache ist für den Computer viel schwerer als man denkt. Zwar werden Computer und mobile Geräte immer schneller und besser, doch die Komplexität der Sprache ansich ist für einen Computer sehr schwer zu händeln. Nuance ist eine Firma, die sich seit vielen Jahren auf die Spracherkennung spezialisiert hat.
Kurz vorneweg: Der komplette Artikel wurde von mir per Spracheingabe erstellt, um zu demonstrieren wie genau und wie gut die Software arbeitet. Per Hand mussten nur wenige, kleine Erkennungsfehler ausgebessert werden. Somit ist dieser Artikel zu 95% sprachlichen Ursprungs.
Dragon Dictate 4.0 ist die neueste Version der bekannten Spracherkennungssoftware von Nuance. Nuance wird manchem ein Begriff sein, denn die Firma steckt auch hinter der Komplexität von Siri. In der neuen Version arbeitet die Software wesentlich genauer, als in der vorherigen Versionsnummer. Nach der Installation des Programms begrüßt einen die Software und fordert das Anlegen eines Benutzerprofils. Nach der Eingabe des Namens folgt die Auswahl der Audio-Eingangsquelle. Dafür kann entweder das interne Mikrofon des Mac, oder ein externes Headset bzw. ein externes Mikrofon genutzt werden. Ebenso wichtig ist die Festlegung der eigenen gesprochenen Sprache – in dem Fall „Deutsch“.
Im Anschluss muss der Benutzer für wenige Minuten eine kurze Reihe von Textpassagen vorlesen – welche der Software zur genauen Erkennung der Tonhöhe und Tonart dienen. Somit lernt Dragon Dictate die Betonung und die Aussprache des Nutzers kennen. Nach der kurzen Spracherkennung ist das Einrichten auch schon beendet. Der Benutzer hat nun die Möglichkeit dem Programm noch mehr Trainingseinheiten zu gönnen, indem er noch mehr Textpassagen vorliest. Dadurch wird das Programm geschult und versteht den Nutzer noch detaillierter. Auch kann der User eigene Wörter definieren, welche das Programm dann manuell erlernt. Ich musste der Software nur wenige Wörter manuell beibringen. Doch vor allem bei „MacBook“ musste ich manuell eingreifen, denn statt „MacBook“ verstand das Programm zu 60% immer „Mittwoch“. Auch „iMessage“ mochte Dragon Dictate 4 als Wort weniger und schrieb stattdessen immer „eingesetzt“. Das mag einerseits an der Aussprache der Wörter liegen, anderseits wahrscheinlich auch an der Tatsache, dass es sich um englischsprachige Wörter handelt. Doch mit wenigen Handgriffen konnte ich auch das der Spracherkennungssoftware beibringen.
Die Mac-Anwendung bindet sich in die Menüleiste des Mac ein. Dadurch ist sie immer erreichbar und kann aktiviert bzw. deaktiviert werden. Doch das ist nicht alles. Sofern die Software aktiviert ist, können auch Kommandos an Dragon Dictate abgegeben werden. So kann ein Befehl “Öffne Mail“ lauten – DragonDictate öffnet durch diesen Befehl direkt das E-Mail-Programm. Die Spracherkennungssoftware versteht viele Befehle und kann teilweise auch innerhalb der Anwendungen agieren.
Was an dieser Stelle ganz wichtig ist – Dragon Dictate arbeitet, anders als das Siri-Diktat, offline. Die Spracherkennung wird über das Mikrofon aufgezeichnet und von dem Prozessor des Mac verarbeitet. Somit kann man auch unterwegs ohne Internetverbindung Textpassagen diktieren.
Dragon Dictate 4.0 zeigt in seiner neuesten Version, wie gut Spracherkennung heute schon funktionieren kann. Ich kenne schon Dragon Dictate 3.0 und bin überrascht, welch große Verbesserungen die neue Softwareversion mit sich bringt. Die neue Version zeigt ganz klar, wie wichtig die Zukunft der Spracherkennung im Allgemeinen ist – denn die Sprache gilt als eines der komplexesten Dinge auf der Welt. Ich habe, wie eingangs schon beschrieben, diesen Artikel komplett per Spracheingabe verfasst und bin überrascht, wie effektiv die Software mit mir agieren kann. Die Software hat ein wirklich gutes Gehör und verarbeitete Spracheingabe extrem schnell. Zum Diktieren benutzte ich das im MacBook verbaute Mikrofon und saß dabei in einem ruhigen Büroraum.
Wer wirklich viel schreibt, dem wird dieses Programm mit Sicherheit einen großen Spaß und einen großen Nutzen liefern. Es ist zwar eine große Umstellung die Gedanken in Spracheingabe umzuwandeln, anstatt sie wie bisher per Tastatur einzugeben, doch mit etwas Gewöhnungszeit und Umgang mit der Software lernt man einen komplett neuen Workflow kennen. Die Software ist im offiziellen Handel erhältlich und kostet 120 €. Wer bereits Dragon Dictate 3.0 benutzt, der kann sich für 70 € das Upgrade-Paket kaufen.
Bei Interesse kann das Produkt hier bestellt werden.
9 Gedanken zu „Im Test: Die Spracherkennung Dragon Dictate 4 für den Mac“
Die Kommentare sind geschlossen.