News article ristampato da The New York Times.
In un incontro a Google nel 2004, la discussione si rivolse ad un messaggio di posta elettronica l'azienda aveva ricevuto da un fan in Sud Corea. Sergey Brin, uno dei fondatori di Google, corse il messaggio attraverso un servizio di traduzione automatica che la società aveva concesso in licenza.
Il messaggio ha detto che Google è un motore di ricerca preferito, ma il risultato di lettura: "Le scarpe fettine di pesce crudo lo desidera. Google verdi cosa cipolla! "
Mr. Brin ha detto che Google dovrebbe essere in grado di fare meglio. Sei anni più tardi, il suo servizio gratuito di Google Translate gestisce 52 lingue, più di ogni altro sistema simile, e la gente lo usa centinaia di milioni di volte a settimana per tradurre pagine Web e altro testo.
"Quello che si vede su Google Translate è lo stato dell'arte" nelle traduzioni computer che non sono limitati ad un particolare argomento, ha affermato Alon Lavie, professore associato di ricerca in Tecnologie Language Institute della Carnegie Mellon University.
Google sforzi di espandersi oltre la ricerca sul Web hanno avuto un successo. Il suo progetto digitale libri è stato appeso in tribunale, e l'introduzione del suo social network, Buzz, ha sollevato timori sulla privacy. Il modello suggerisce che a volte passo falso quando si tenta di sfidare le tradizioni di lavoro e convegni culturali.
Ma la crescita rapida di Google per i vertici del business traduzione è un ricordo di ciò che può accadere quando Google scatena la sua forza bruta potenza di calcolo su problemi complessi.
La rete di centri dati che lo costruì per le ricerche web possono ora essere, quando legati insieme, il più grande computer del mondo. Google sta usando quella macchina per spingere i limiti della tecnologia di traduzione. Il mese scorso, per esempio, ha detto che stava lavorando per combinare il suo strumento di traduzione con l'analisi delle immagini, consente ad una persona da prendere, ad esempio, una foto cellulare di un menù in tedesco e ottenere una traduzione istantanea inglese.
"La traduzione automatica è uno dei migliori esempi che mostra la visione strategica di Google," ha detto Tim O'Reilly, fondatore e amministratore delegato della casa editrice O'Reilly Media tecnologia. "Non è qualcosa che nessun altro sta prendendo molto sul serio. Ma Google capisce qualcosa su dati che nessuno capisce, ed è disposto a fare gli investimenti necessari per affrontare questi tipi di problemi complessi in vista del mercato ".
Creazione di una traduzione automatica è stata a lungo considerata come una delle sfide più difficili nel campo dell'intelligenza artificiale. Per decenni, gli scienziati informatici provato utilizzando un approccio basato su regole - l'insegnamento del computer le regole linguistiche di due lingue e dandogli un dizionari necessario.
Ma a metà degli anni 1990, i ricercatori cominciarono a favore di un cosiddetto approccio statistico. Essi hanno scoperto che, se alimentato il computer di migliaia o milioni di passaggi umani e le loro traduzioni-generato, si potrebbe imparare a fare ipotesi precise su come tradurre i testi nuovi.
Si scopre che questa tecnica, che richiede enormi quantità di dati e un sacco di potenza di calcolo, è fino vicolo di Google.
"La nostra infrastruttura è molto adatto a questo", Vic Gundotra, vice presidente per l'ingegneria di Google, ha detto. "Possiamo prendere approcci che gli altri non possono nemmeno sognare."
Sistemi di traduzione automatica è lungi dall'essere perfetto, e anche Google non metterà traduttori umani da un lavoro in tempi brevi. Gli esperti dicono che è estremamente difficile per un computer per rompere una frase in più parti, poi tradurre e rimontarle.
Ma il servizio di Google è sufficiente per trasmettere l'essenza di un articolo, ed è diventata una fonte veloce per le traduzioni per milioni di persone. "Se hai bisogno di un rough-and-ready traduzione, è il posto dove andare," ha affermato Philip Resnik, un esperto di traduzione automatica e professore associato di Linguistica presso l'Università del Maryland, College Park.
Come i suoi rivali nel settore, in particolare Microsoft e IBM, Google ha nutrito il suo motore di traduzione con trascrizioni di lavori delle Nazioni Unite, che vengono tradotti dall'uomo in sei lingue, e quelli del Parlamento europeo, che sono tradotti in 23. Questa materia prima viene utilizzata per addestrare i sistemi per le lingue più comuni.
Ma Google ha perlustrato il testo del Web, così come i dati dal suo progetto di libro di scansione e da altre fonti, di andare oltre tali lingue. Per le altre lingue oscure, ha rilasciato un "tool kit" che aiuta gli utenti con le traduzioni e poi aggiunge quei testi al suo database.
Offerta di Google potrebbe mettere un'ammaccatura nella vendita di software di traduzione aziendali da aziende come IBM Ma la traduzione automatica non è mai probabile che sia un grande affarista, almeno non per gli standard del business pubblicitario di Google. Eppure, gli sforzi di Google potrebbe pagare in diversi modi.
Perché gli annunci di Google sono online onnipresente, tutto ciò che rende più facile per le persone ad utilizzare i benefici Internet della società. E il sistema potrebbe portare a interessanti nuove applicazioni. La scorsa settimana, la società ha detto che sarebbe utilizzare il riconoscimento vocale per generare le didascalie in lingua inglese per i video di YouTube, che potrebbe poi essere tradotto in altre 50 lingue.
"Questa tecnologia può fare la barriera linguistica andare via", ha detto Franz Och, uno scienziato principale di Google a capo della compagnia team di traduzione automatica. "E 'permetterebbe a chiunque di comunicare con chiunque altro."
Mr. Och, un ricercatore tedesco che in precedenza ha lavorato presso la University of Southern California, ha detto che era inizialmente riluttante a unirsi a Google, temendo che tratterebbe della traduzione come un progetto parallelo. Larry Page, altro fondatore di Google, chiamato per rassicurarlo.
"Egli ha detto in sostanza che questo è qualcosa che è molto importante per Google", ha ricordato di recente Och. Mr. Och firmato nel 2004 e fu presto in grado di mettere promessa signor Page alla prova.
Mentre molti sistemi di traduzione come Google utilizzare fino a un miliardo di parole di testo per creare un modello di una lingua, Google è andato molto più grande: parole inglesi a poche centinaia di miliardi. "I modelli diventano sempre meglio il testo più che di processo", ha detto Och.
Lo sforzo ha pagato. Un anno dopo, Google ha vinto un concorso gestito dal governo che mette alla prova i sistemi di traduzione sofisticati.
Google ha utilizzato un approccio simile - potenza di calcolo immensa, cumuli di dati e statistiche - ad affrontare altri problemi complessi. Nel 2007, per esempio, ha iniziato ad offrire 800-GOOG-411, un servizio gratuito di directory assistance che interpreta le richieste parlato. Ha permesso a Google di raccogliere le voci di milioni di persone in modo che potesse stare meglio a riconoscere inglese.
Un anno dopo, Google ha rilasciato una ricerca-by-voice sistema che era buono come quelli che hanno avuto gli altri anni le aziende a costruire.
E alla fine dell'anno scorso, Google ha introdotto un servizio chiamato Goggles che analizza foto cellulare, corrispondenti a un database di oltre un miliardo di immagini online, tra foto di strade preso per il suo servizio Street View.
Mr. Och riconosciuto che il sistema di traduzione di Google è ancora da migliorare, ma lui ha detto che stava migliorando velocemente. "L'attuale curva di miglioramento della qualità è ancora piuttosto ripida", ha detto.
L'articolo originale ...