Sprechprobe: Digitale Diktiergeräte haben eine heimliche Revolution hinter sich

Digitale Diktiergeräte haben nicht nur das Band abgelöst. Mit Spracherkennungssoftware erlauben sie jetzt sogar die Umwandlung von gesprochenem in getippten Text. FORMAT hat es ausprobiert.

In der Mysteryserie „Twin Peaks“ war es neben FBI-Agent Dale Cooper einer der Hauptdarsteller: das Diktiergerät. Auf ihm verewigte der Special Agent seine neuesten Erkenntnisse im Mordfall Laura Palmer. Seither ist es auf der Leinwand still geworden um den akustischen Notizblock. Völlig zu Unrecht natürlich, könnte Agent Cooper heutzutage seine Audionotizen doch gleich per Mail zum FBI-Headquarter schicken oder von der Spracherkennungssoftware auf seinem Laptop „abtippen“ lassen.

Archivierung leicht gemacht
Relativ unbeachtet vom technologischen Mainstream hat sich rund ums Thema Diktieren in den letzten 15 Jahren eine heimliche Revolution ereignet. Die digitale Aufnahme von Sprache auf Flash-Speicher oder PC-Festplatte macht heute nicht nur den Kassetten-Diktiergeräten zusehends den Garaus, sondern erlaubt auch das blitzartige Verschicken von Audiodateien rund um den Globus oder im Firmennetz. Eine der Folgen: Das Abtippen von Diktaten, Interviews und Konferenz-Mitschnitten kann, aber muss nicht mehr vom eigenen Büropersonal erledigt werden. Seit Sprach- und Textdateien praktisch zum Nulltarif per Mail versandt werden können, haben strenge Kosten-Nutzen-Rechner diese Tätigkeit an externe Schreibbüros, Heimbüros oder Telearbeitsplätze ausgelagert. Ein weiterer Effekt des digitalen Diktats: Die Sprachfiles lassen sich nach der Tipp-Arbeit ganz einfach archivieren. Ein Umstand, der vor allem im medizinischen und juristischen Bereich von essenzieller Bedeutung ist. Damit das verschickte beziehungsweise abgelegte Audiomaterial nicht an die falschen Ohren gelangt, lassen sich heikle Audiodateien selbstverständlich auch verschlüsseln …

Auf Sprachaufzeichnung optimiert
Besonders in fünf Bereichen wird das digitale Diktieren heute intensiv genutzt: bei Ärzten, speziell im Spitalsbereich, bei Anwälten und bei Gericht, bei Gutachtern, bei Architekten – und natürlich bei Journalisten und Medienarbeitern, die ihre Interviews auch nicht mehr in Steno festhalten wollen. Den Markt teilt sich heute eine Hand voll Hersteller (Philips, Olympus, Sony, Panasonic, Sanyo und Grundig). Wie ein Branchen-Insider verrät, sind „die Margen hier immer noch sehr gut“. Der „wirkliche Gewinn“ wird allerdings im professionellen Diktier-Workflow-Bereich in Krankenanstalten, bei Großfirmen, bei der Justiz und anderen öffentlichen Institutionen gemacht. Für den normalen Diktiergeräte-Nutzer ist dies freilich eher von akademischem Interesse. Er fragt sich vielleicht, warum er überhaupt ein Diktiergerät kaufen soll, wo doch sein Handy und sein MP3-Player auch Voice-Memos aufnehmen können. Die Antwort ist einfach: Diktiergeräte sind in Sachen Mikro, Lautsprecher und Bedienelemente auf Sprachaufzeichnung optimiert, bei Handys und MP3-Playern ist Letzteres nur eine Zusatzfunktion. Allerdings sind die Grenzen in beide Richtungen fließend: Geräte mit hochempfindlichem Stereomikrofon wie Sonys ICD-SX800 und SX700 (im Bild) eignen sich auch für Livemusikmitschnitte, und fast alle Diktiergeräte lassen sich als MP3- bzw. WMA-Musikplayer nutzen (siehe Superlauscher und Doktors Liebling ) .

Diktiergerät-Standard MP3
Wenn es nicht auf Top-Stereoqualität, sondern auf Speicherkapazität ankommt, sind Diktiergeräte ihren multifunktionellen Konkurrenten jedenfalls überlegen. Im Longplay-Modus passen bei Sonys ICD-SX800 bis zu 750 Stunden auf 2 Gigabyte Speicherplatz. Erreicht wird dies entweder durch exotische Fileformate mit hoher Kompression wie LPEC (Sony) bzw. DSS Pro (Olympus, Philips, Grundig) oder durch das Runterdrehen der Bit-Raten bei MP3 und WMA. Am Ende hat man im MP3- oder WMA-Longplay-Mode zwar nur noch Mono „in Telefonqualität“, kann die Sprachdateien aber ohne Installation von Zusatzsoftware sofort auf jedem PC abspielen. Letzteres ist – abgesehen von Lizenzgebühren – der Hauptgrund, warum sich MP3 immer mehr auch als Aufnahmestandard durchsetzt. Wenn die Spracherkennungssoftware dann sofort ein Transkript ausspucken würde, wäre der Service perfekt. Einige Hersteller liefern die Software gleich mit. „Daten automatisch mit einer Genauigkeit von 99 Prozent in Text umwandeln“, schwärmt der Pressetext. Wie der FORMAT-Test zeigt , ist das in der Praxis noch nicht ganz der Fall. Die Damen im Vorzimmer können aufatmen.

Rainer Grünwald