Aktuelles Artikel aus der New York Times abgedruckt.
Bei einem Treffen bei Google im Jahr 2004 wandte sich die Diskussion um eine E-Mail-Nachricht des Unternehmens von einem Fan in Südkorea erhalten hatte. Sergey Brin, eine Google-Gründer, lief die Nachricht über einen automatischen Übersetzungsdienst, dass das Unternehmen lizenziert.
Die Botschaft, sagte Google war ein Lieblings-Suchmaschine, aber das Ergebnis zu lesen: "Die geschnittenen rohen Fisch Schuhe er will. Google grüne Zwiebel Ding! "
Mr. Brin sagte Google sollte in der Lage sein es besser zu machen. Sechs Jahre später, Griffe ihrer freien Google Translate Service 52 Sprachen, mehr als jeder ähnliches System, und die Leute nutzen es Hunderte von Millionen Mal pro Woche, um Webseiten und andere Texte zu übersetzen.
"Was sehen Sie auf Google Translate ist Stand der Technik" in elektronischen Übersetzungen, die nicht nur auf ein spezifisches, sagte Alon Lavie, Associate Research Professor in der Language Technologies Institute der Carnegie Mellon University.
Googles Bemühungen, über die Suche im Web zu erweitern haben mit gemischten Erfolg. Die digitalen Bücher-Projekt wurde vor Gericht hing, und die Einführung seines sozialen Netzwerks, Buzz, hob Privatsphäre befürchtet. Das Muster legt nahe, dass es manchmal Fehltritt, wenn es um unternehmerischen Traditionen und kulturellen Konventionen Herausforderung sucht.
Aber Google ist schnell steigen, um den oberen Rängen der Übersetzung Geschäft ist eine Erinnerung daran, was passieren kann, wenn Google entfesselt seine Brute-Force-Rechenleistung für komplexe Probleme.
Das Netzwerk von Datenzentren, dass es für die Websuche gebaut wurden, dürfen nun, wenn festgezurrt zusammen, der weltgrößten Computermesse. Google ist mit dieser Maschine an die Grenzen der Übersetzung technology push. Letzten Monat zum Beispiel sagte, es war bemüht, seine Übersetzungs-Tool mit Bildanalyse kombiniert, so dass eine Person, sagen wir, einen Handy-Foto von einem Menü in Deutsch und bekommen sofort eine englische Übersetzung.
"Maschinelle Übersetzung ist einer der besten Beispiele, dass Google die strategische Vision zeigt", sagte Tim O'Reilly, Gründer und Chief Executive der Technik Verlag O'Reilly Media. "Es ist nicht etwas, das jemand anderes ist sehr ernst nehmen. Aber Google versteht etwas von Daten, die sonst niemand versteht, und es ist bereit, die notwendigen Investitionen, um diese Art von komplexen Problemen im Vorfeld der Markt anzugehen. "
Erstellen einer Übersetzung Maschine ist seit langem als eine der härtesten Herausforderungen im Bereich der künstlichen Intelligenz gesehen. Seit Jahrzehnten versucht Informatiker mit einem regelbasierten Ansatz - Lehre der Computer die sprachlichen Regeln der beiden Sprachen und ihm die nötigen Wörterbücher.
Aber in der Mitte der 1990er Jahre begannen Forscher bevorzugen einen sogenannten statistischen Ansatz. Sie fanden heraus, dass, wenn sie den Computer mit Tausenden oder Millionen von Passagen und ihre Menschen verursachten Übersetzungen eingespeist, könnte es zu lernen, um genaue Vermutungen darüber, wie Sie neue Texte übersetzen zu machen.
Es stellt sich heraus, dass diese Technik, die große Datenmengen und viele Rechenleistung erfordert, bis Google die Gasse ist.
"Unsere Infrastruktur ist sehr, diese gut geeignet," Vic Gundotra, Vice President für Engineering bei Google, sagte. "Wir können Ansätze, die andere nicht einmal träumen können."
Automatisierte Übersetzung Systeme sind bei weitem nicht perfekt, und selbst Google nicht gefallen menschliche Übersetzer aus einem Job in absehbarer Zeit. Experten sagen, es ist sehr schwierig für einen Computer, einen Satz in ihre Einzelteile zerlegen, dann übersetzen und zusammensetzen.
Aber Google-Service ist gut genug, um das Wesen einer News-Artikel zu vermitteln, und es hat sich eine schnelle Quelle für Übersetzungen für Millionen von Menschen. "Wenn du einen rough-and-ready Übersetzung benötigen, ist es der Ort zu gehen", sagte Philip Resnik, eine maschinelle Übersetzung Experte und außerordentlicher Professor für Linguistik an der University of Maryland, College Park.
Wie seine Konkurrenten auf dem Gebiet, hat vor allem Microsoft und IBM, Google seine Übersetzungs-Engine mit Transkripte der Vereinten Nationen Verfahren, die von den Menschen in sechs Sprachen übersetzt sind, und denen des Europäischen Parlaments, das in 23 übersetzt zugeführt werden. Dieser Rohstoff wird verwendet, um Systeme für die gängigsten Sprachen trainieren.
Aber Google hat den Text der Web abgekocht, sowie Daten aus seinem Buch Scanning-Projekt und anderen Quellen, um über diese Sprachen zu bewegen. Für weitere obskure Sprachen, hat es einen "Werkzeugkasten", dass die Nutzer mit Übersetzungen helfen und fügt dann die Texte zu seiner Datenbank veröffentlicht.
Google bietet könnten eine Delle in Umsatz von Corporate Translation Software von Firmen wie IBM aber die automatisierte Übersetzung ist wohl nie ein großer Moneymaker sein, zumindest nicht nach den Maßstäben der Googles Werbegeschäft setzen. Dennoch konnte Google die Bemühungen zahlen sich aus in mehrfacher Hinsicht.
Weil Google Anzeigen sind allgegenwärtig online, alles, was es den Menschen erleichtern die Verwendung des Web profitiert das Unternehmen macht. Und das System könnte zu interessanten neuen Anwendungen führen. Letzte Woche sagte, das Unternehmen würde es Spracherkennung verwenden, um Beschriftungen für englischsprachige YouTube-Videos, die dann in 50 andere Sprachen übersetzt werden könnte generieren.
"Diese Technologie kann die Sprachbarriere weg", sagte Franz Och, Principal Scientist bei Google, die das Unternehmen maschinelle Übersetzung Team führt. "Es wäre niemandem gestatten, mit niemandem kommunizieren."
Herr Och, ein deutscher Forscher, der zuvor an der University of Southern California tätig, sagte er sich zunächst zurückhaltend zu Google beizutreten, fürchten sie, würde die Übersetzung als Nebenprojekt zu behandeln. Larry Page, die Google-Gründer andere dazu berufen, ihn zu beruhigen.
"Er sagte im Grunde, dass dies etwas, was sehr wichtig für Google ist," Mr. Och erinnerte kürzlich. Herr Och unterzeichnet am im Jahr 2004 und wurde bald in der Lage, Mr. Seite das Versprechen auf die Probe gestellt.
Während viele Übersetzung Systeme wie Google die Nutzung bis zu einer Milliarde Wörter des Textes auf ein Modell einer Sprache zu schaffen, ging Google viel größer: ein paar 100 Milliarden englische Wörter. "Die Modelle werden besser und besser, je mehr Text, den Sie verarbeiten," Mr. Och sagte.
Die Mühe hat sich gelohnt. Ein Jahr später gewann Google ein staatliches Wettbewerb, anspruchsvolle Übersetzungssysteme Tests.
Immense Rechenleistung, Haufen von Daten und Statistiken - - Google hat einen ähnlichen Ansatz verwendet, um andere komplexe Probleme zu lösen. Im Jahr 2007, zum Beispiel, begann es mit 800-GOOG-411, eine kostenlose Telefonauskunft-Service, gesprochene Anfragen interpretiert. Es erlaubt Google auf die Stimmen von Millionen von Menschen zu sammeln, so es bekommen konnte besser erkennen gesprochenen Englisch.
Ein Jahr später veröffentlichte Google eine Suche-by-Voice-System, dass so gut wie jene, dass andere Unternehmen Jahre lang gebaut wurde.
Und Ende letzten Jahres eingeführt Google einen Dienst namens Goggles, dass Handy-Fotos Analysen, den Abgleich mit einer Datenbank von mehr als einer Milliarde Online-Bilder, darunter Fotos von Straßen für den Street View-Service übernommen.
Herr Och räumte ein, dass die Google-Übersetzung System noch verbessert werden muss, aber er sagte, es sei besser schnell. "Die aktuelle Qualitätsverbesserung Kurve ist immer noch ziemlich steil", sagte er.
Original-Artikel ...