Samstag, 12. Januar 2013

Microsoft-Technik lässt Menschen mit fremder Zunge sprechen

"Wir brauchen wohl nicht auf das 22. Jahrhundert zu warten, bis der aus 'Star Trek' bekannte Universalübersetzer verfügbar ist", schreibt der Chef der Microsoft-Forschung Rick Rashid in einem Weblog-Beitrag. Als Grund für seinen Optimismus gibt er die Ergebnisse seiner Abteilung an, die an einem Simultan-Übersetzer arbeitet. Rashid hatte die Technik am 25. Oktober auf der Konferenz Computing in the 21st Century im chinesischen Tianjin vorgeführt und nun schriftlich Hintergrund-Informationen geliefert.

Rashid hatte vorgeführt, wie zunächst seine Vortragsworte von einem Spracherkennungssystem erfasst wurden. Im nächsten Schritt wurden seine Wörter ins Chinesische übersetzt und in die richtige Reihenfolge gebracht. Das Besondere bei der Ausgabe: Die Sprachausgabe ahmte Rashids Stimme nach. Dafür hatte Rashid ungefähr eine Stunde lang gesprochenes Material geliefert, nach der die Standardstimme des Systems moduliert wurde.

Vor zwei Jahren hätten Forscher von Microsoft und der University of Toronto einen wichtigen Durchbruch in der Geschichte der Übersetzung geschafft, schreibt Rashid. Mit einer Technik, die Deep Neural Networks (PDF-Datei) genannt wird und die dem menschlichen Gehirn nachgeahmt sei, sei die Spracherkennung entscheidend verbessert worden. Gegenüber früheren Methoden sei die Fehlerrate der Spracherkennung um 30 Prozent gesenkt worden. Das bedeute, nun werde nicht mehr ein Wort je vier oder fünf Wörtern falsch erkannt, sondern nur noch eines je sieben oder acht.


Rashids Vorführung am 25. Oktober.

Bisher sei das System noch nicht ausgereift, räumte Rashid ein. Sowohl die Spracherkennung als auch die Übersetzung bärgen noch Fehler, die Ergebnisse könnten mitunter humorvoll sein. Die Technik sei aber bereits nützlich. Obwohl es sich noch um eine Testvorführung gehandelt habe, sei das Publikum begeistert gewesen. (anw)


View the original article here

0 Kommentare:

Kommentar veröffentlichen