Reportatge pres del diari New York Times.
En una reunió a Google el 2004, la discussió es va centrar en un missatge de correu electrònic de la companyia havia rebut d'un fan a Corea del Sud. Sergey Brin, un dels fundadors de Google, va dirigir el missatge a través d'un servei de traducció automàtica que l'empresa tenia llicència.
El missatge deia que Google era un motor de cerca favorit, però el resultat de la lectura: "Les sabates de rodanxes de peix cru que desitgi. Google ho verd ceba! "
Brin va dir que Google ha de ser capaç de fer-ho millor. Sis anys més tard, és gratis Google Translate servei maneja 52 idiomes, més que qualsevol altre sistema similar, i la gent el fa servir centenars de milions de vegades a la setmana per traduir pàgines web i altres textos.
"El que es veu en Google Translate és l'estat de l'art" en les traduccions equip que no es limiten a un àrea determinada, va dir Alon Lavie, un professor associat de recerca a l'Institut de Tecnologies del Llenguatge a la Universitat Carnegie Mellon.
Esforços de Google per a expandir-se més enllà de la recerca a Internet han tingut un èxit desigual. El seu projecte de llibres digitals ha estat penjada a la cort, i la introducció de la seva xarxa social, Buzz, va augmentar els temors de privacitat. El patró suggereix que de vegades pot pas en fals quan es tracta de desafiar les tradicions i convencions d'empreses culturals.
Però ràpid ascens de Google per als nivells més alts de l'empresa de traducció és un recordatori del que pot passar quan Google allibera la seva força bruta, poder de còmput en problemes complexos.
La xarxa de centres de dades que es va construir per cerques a la web ara poden ser, en lligats, de computació més gran del món. Google està fent servir la màquina per empènyer els límits de la tecnologia de traducció. El mes passat, per exemple, es va dir que estava treballant per combinar la seva eina de traducció amb l'anàlisi d'imatges, permetent a una persona, per exemple, fer una foto de mòbil d'un menú en alemany i obtenir una traducció a l'Anglès instant.
"La traducció automàtica és un dels millors exemples que mostra la visió estratègica de Google," va dir Tim O'Reilly, fundador i director executiu de la tecnologia editorial O'Reilly Media. "No és una cosa que ningú s'està prenent molt seriosament. No obstant això, Google entén alguna cosa sobre les dades que ningú entén, i que està disposat a fer les inversions necessàries per fer front a aquest tipus de problemes complexos per davant del mercat ".
La creació d'una màquina de traducció ha estat sempre vist com un dels reptes més difícils en la intel ligència artificial. Durant dècades, els científics de la computació intentat utilitzar un enfocament basat en regles - l'ensenyament de la informàtica les normes lingüístiques dels dos idiomes i li dóna els diccionaris necessaris.
Però en la dècada de 1990, els investigadors van començar a favor d'un enfocament estadístic anomenat. Ells van trobar que si s'alimenta l'ordinador o milers de milions de passatges i les seves traduccions generades pels humans, podria aprendre a fer conjectures precises sobre com traduir els nous textos.
Resulta que aquesta tècnica, que requereix enormes quantitats de dades i un munt de potència de computació, és fins carreró de Google.
"La nostra infraestructura és molt adequat per a això", va dir Vic Gundotra, vicepresident d'enginyeria de Google,. "Podem tenir enfocaments que altres ni tan sols poden somiar."
Sistemes de traducció automàtica estan lluny de ser perfecte, i fins i tot de Google no posarà traductors humans fora d'un treball en el curt termini. Els experts diuen que és molt difícil per a un equip a trencar una oració en parts, a continuació, traduir i tornar a unir-los.
Però el servei de Google és prou bo per a transmetre l'essència d'un article de notícies, i s'ha convertit en una font ràpida de traduccions de milions de persones. "Si necessita una traducció aproximada-i-llest, és el lloc per anar", va dir Philip Resnik, un expert en la traducció automàtica i professor adjunt de lingüística a la Universitat de Maryland, College Park.
Igual que els seus rivals al camp, sobretot Microsoft i IBM, Google ha alimentat al seu motor de traducció de les transcripcions de les Nacions Unides per als procediments, que es tradueixen per l'home en sis idiomes, i els del Parlament Europeu, que es tradueixen en 23. Aquesta matèria primera s'utilitza per entrenar els sistemes dels idiomes més comuns.
No obstant això, Google ha recorregut el text de la web, així com les dades del seu projecte d'escaneig de llibres i altres fonts, per anar més enllà d'aquests idiomes. Per més llengües fosques, s'ha llançat una "caixa d'eines" que ajuda als usuaris amb les traduccions i després afegeix els textos de la base de dades.
Oferta de Google podria fer efecte en les vendes de programari de traducció corporatives d'empreses com IBM, però la traducció automàtica no és probable que sigui una font de diners gran, almenys per als estàndards de negoci de la publicitat de Google. No obstant això, els esforços de Google podria pagar de diverses maneres.
Com que els anuncis de Google estan en línia a tot arreu, tot el que fa més fàcil per a la gent a usar els beneficis d'Internet de la companyia. I el sistema podria portar a noves aplicacions interessants. La setmana passada, la companyia va dir que l'ús de reconeixement de veu per generar subtítols d'Anglès-idioma dels vídeos de YouTube, el que podria ser traduït a 50 idiomes.
"Aquesta tecnologia pot fer la barrera de l'idioma desaparegui", va dir Franz Och, científic principal de Google que lidera l'equip de l'empresa de traducció automàtica. "Això permetria a qualsevol persona per comunicar-se amb els altres."
Sr Och, un investigador alemany que va treballar anteriorment a la Universitat del Sud de Califòrnia, va dir que es van mostrar reticents a unir-se a Google, per por que el tractament de la traducció com un projecte paral.lel. Larry Page, un altre fundador de Google, anomenat per tranquil · litzar.
"Bàsicament diu que això és una cosa que és molt important per a Google", va recordar recentment Och. Sr Och van signar el 2004 i aviat va ser capaç de posar la promesa de pàgina del senyor de la prova.
Mentre que molts sistemes de traducció de Google com l'ús de fins a mil milions de paraules del text per crear un model d'una llengua, Google va ser molt més gran: uns pocs centenars de milions de paraules anglès. "Els models es tornen cada vegada millor el text més que el procés", va dir Och.
L'esforç va valer la pena. Un any després, Google va guanyar un concurs dirigit pel govern que les proves de sofisticats sistemes de traducció.
Google ha utilitzat un enfocament similar - immensa potència de computació, un munt de dades i estadístiques - per fer front a altres problemes complexos. El 2007, per exemple, va començar a oferir 800-GOOG-411, un servei de directori d'assistència gratuïta que interpreta les sol.licituds parlat. Va permetre Google per recollir les veus de milions de persones de manera que podria millorar en el reconeixement d'Anglès parlat.
Un any més tard, Google va llançar un sistema de recerca per veu, que era tan bona com les que va prendre anys a altres empreses per construir.
I a finals de l'any passat, Google va llançar un servei anomenat ulleres que analitza les fotos mòbil, corresponent a una base de dades de més de mil milions d'imatges en línia, incloent fotos dels carrers preses pel seu servei Street View.
Sr Och reconèixer que el sistema de traducció de Google encara cal millorar, però em va dir que estava millorant ràpidament. "La corba de millora de la qualitat actual segueix sent bastant elevat", va dir.
Article original ...