Sprache-zu-Text-Erkennung

Computer, zum Diktat bitte!

Sprechen ist schneller als schreiben. Für die Philips-Software kein Problem.
Sprechen ist schneller als schreiben. Für die Philips-Software kein Problem.(c) Philips Speech
  • Drucken

Egal wie flink man über die Tasten fegen kann, Sprache ist immer schneller. Die Lösung des heimischen Anbieters Philips Speech zeigt, wie „Sprache zu Text“ richtig geht.

Genau so schnell schreiben, wie sprechen − das können allenfalls gelernte Stenotypisten. Diese Berufsgruppe zieht beim Tippen berufsbedingt allen davon, werden schon bei der Prüfung meist in Kurzschrift 150 Silben pro Minute und beim Zehn-Finger-System 210 Anschläge pro Minute verlangt. Mithalten kann da selbst der geübteste Vielschreiber nicht.

Experten schätzen, dass wir bis zu siebenmal schneller sprechen als wir schreiben. Wer also E-Mails oder andere Textsorten diktiert, gewinnt Zeit. Nicht jeder kann es sich leisten, einen Stenotypisten einzustellen. Sprache-zu-Text-Erkennung ist längst kein Experimentierfeld mehr. Ein Anbieter einer solchen Gesamtlösung kommt aus Österreich.

Der Ihnen vorliegende Text hier entstand zum Beispiel mit Hilfe von Philips Speech Processing Solutions, einer Hard- und Software-Lösung aus Wien. 170 Mitarbeiter beschäftigt das Unternehmen in acht Büros über den Erdball verteilt. Ebenso international auch die Kundschaft: Von den Färöer-Inseln bis Simbabwe vertrauen mittlerweile fünf Millionen Kunden auf die Lösung des Unternehmens, Tendenz steigend. „Der Zeitaufwand für manuelle Tätigkeiten schrumpft, Ansprüche an Kollaboration, Mobilität und Volatilität steigen“, ist Thomas Brauner, CEO von Speech, überzeugt.

Eine Matrjoschka-Lieferung. Die Philips-Lösung wird vorrangig in medizinischen und juristischen Bereichen eingesetzt. Bedingt durch das Home-Office in der Coronapandemie erlebte die seit 65 Jahren bestehende Firma eine nie dagewesene Nachfrage.

Die Speech One kommt verpackt wie eine kleine Matrjoschka zu Hause an. Eine große Schachtel, die insgesamt acht kleinere Schachteln beherbergt. Die einzelnen Teile wirken eingangs einschüchternd und kompliziert, aber die Einrichtung ist logisch, selbsterklärend und schnell erledigt. Die Ladestation wird am PC über USB angeschlossen. Das monaurale Headset (nur eine Hörmuschel) wiegt knapp 80 Gramm und verfügt über magnetische Pölsterchen. Selbst stundenlanges Tragen fällt nicht ins Gewicht.

Um die Sprache-zu-Text-Funktion nutzen zu können, bedarf es in unserem Fall der Einrichtung eines Kontos für die Cloud-Lösung. Der Kunde hat grundsätzlich die Wahl ob Desktop-, Private Cloud, oder Cloud-Lösung. Die Login-Daten sind im steirischen Mürztal im Hochsicherheits-Serverzentrum „auf Bankenniveau“ geschützt. Die Weboberfläche von Philips Speech ist einfach gehalten und selbsterklärend. Die Optionen sind vielfältig, von reinem Diktat, bis hin zur Simultanübersetzung und dem Hochladen einer fertigen Audiodatei, die zu Text umgewandelt werden soll. Die fertigen Dateien können auch auf den eigenen Rechner gezogen werden.

Es grünt so grün. Die Kapazitäten der Software und des hochpräzisen Mikrofons sind endlich. Deutliches Sprechen ist die Mindestvoraussetzung für die Software. Nuschelt man in Mundart ins Mikrofon bringt das zwar lustige Resultate, aber einen nicht näher ans Ziel. Eine Sprachschule à la „My Fair Lady“ ist nicht notwendig. Ungewohnt ist nur die direkte Ansage von Satzzeichen und Absätzen, die können aber auch im Nachhinein hinzugefügt werden. Sich durch die unformatierte Endloswurst zu kämpfen, kostet viel Zeit. Einige Wörter muss die Software erst lernen, dafür gibt es ein eigenes Wörterbuch. Mit ein bisschen Übung (auf beiden Seiten) entstehen in kürzester Zeit fast fehlerfreie Texte.

("Die Presse", Print-Ausgabe, 25.10.2020)

Lesen Sie mehr zu diesen Themen:


Dieser Browser wird nicht mehr unterstützt
Bitte wechseln Sie zu einem unterstützten Browser wie Chrome, Firefox, Safari oder Edge.