Brain specialist

Stille Post mit Google Translate

leave a comment »

Wurde früher mit mäßigem Erfolg versucht, maschinellen Übersetzungsprogrammen Sprachregeln beizubringen, ist nun, beispielsweise in Form von Google Translate (GT), ein anderes Konzept so weit, dass man es anscheinend in mancher Hinsicht als hilfreich bezeichnen kann: der statistische Ansatz. Grundlage von GT ist ein Pool aus bereits mehrsprachig im Internet vorliegenden Texten (also das, was sich auch Linguee zunutze macht), aus denen das Programm nach den Gesetzen der Wahrscheinlichkeit das jeweils passendste Äquivalent der gewünschten Zielsprache rauszieht.

Was mich interessieren würde: Bereichert GT seinen mehrsprachigen Pool auch durch die eigenen Übersetzungen? Wird also gleichzeitig ein Translation-Memory-Konzept verfolgt? Das wäre ja sinnvoll, wenn zumindest der Ausgangstext schon mal einigermaßen verlässlich ist. Hier ein Test mit den ersten Sätzen des Spiegel-Artikels, in dem die Neuentwicklung vorgestellt wird:

Ein deutscher Forscher hat eines der ersten alltagstauglichen Übersetzungsprogramme entwickelt. Brachiale Rechenkraft verhilft der Google-Software zu verblüffend guten Ergebnissen.

Die englische Übersetzung via GT lautet:

A German researcher has developed one of the first translation software for everyday. Brute computing power helps the Google software to surprisingly good results.

Verständlich, oder? Zurückübersetzt ins Deutsche:

Ein deutscher Forscher hat eine der ersten Übersetzungs-Software für den Alltag entwickelt. Brute Rechenleistung hilft der Google-Software zu erstaunlich guten Ergebnissen.

Hm. Brute Rechenleistung. Das Programm hat offenbar nicht wieder zu seinem Ausgangstext zurückgefunden, verfügt also nicht über ein Translation Memory, sondern es hat den Text nach seinen eigenen Regeln neu zusammengewürfelt. Noch mal Stille Post, jetzt wieder Englisch:

A German researcher has developed one of the first translation software for everyday life. Brute computing power of Google’s software helps to surprisingly good results.

Aus for everyday wurde for everyday life, vermutlich weil zuvor alltagstauglich in für den Alltag umgewandelt worden war. Letzte Runde Stille Post, noch eine Rückübersetzung ins Deutsche:

Ein deutscher Forscher hat eine der ersten Übersetzungs-Software für den Alltag entwickelt. Brute Rechenleistung der Google-Software hilft, erstaunlich guten Ergebnissen.

Die Rechenleistung ist immer noch brute, und zum Satzende hin hat das Programm anscheinend die Lust verloren.

Interessant wäre es, diesen Test nach einer bestimmten Zeit zu wiederholen. Mit einem regelbasierten Programm gleicher Version würde sich da nichts ändern, aber das Internet wächst ja unaufhörlich, wodurch sich die Qualität der Übersetzung gemäß dem statistischen Ansatz eigentlich fortlaufend verbessern müsste.

Update zehn Minuten später: Eben dachte ich noch, der Textausschnitt ist sicher zu klein, um „nach einer bestimmten Zeit“ aufgrund eines signifikant veränderten Textpools durch GT anders übersetzt zu werden. Gab also mehr aus Langeweile den Ausgangstext noch mal ein, wobei surprisingly dies heraus kam:

A German researcher has developed one of the first translation software for everyday. Brute force calculation helps the Google software to astonishingly good results.

Hoppla: Brute force calculation?! Das mit der „fortlaufenden Verbesserung“ nehme ich zurück…

Update 1 Tag später: GT bleibt bei seiner letzten Übersetzungsversion von gestern. Obwohl ich das Programm ausdrücklich noch mal an seine erste, bessere Version erinnert habe, mittels der Funktion „Eine bessere Übersetzung vorschlagen“. Diese bessere Übersetzung kann man dann „senden“. Allerdings weiß ich nicht, wohin bzw. wozu. Zumindest übernimmt GT meine Sendung nicht für eine erneute Übersetzung. Werden diese Übersetzungsvorschläge alle irgendwo zentral gesammelt, und man muss sich einfach ein paar Jahre gedulden, bis sie umfangreich genug sind, um vom Programm als statistisch relevant erkannt und ausgewählt zu werden?

Questions over questions.

Advertisements

Written by brainspecialist

29. April 2010 um 21:00

Veröffentlicht in Watch your language

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

%d Bloggern gefällt das: