News article kordustrükk alates The New York Times ajalehes.

Aasta kohtumisel Google aastal 2004, arutelu pöördus e-kiri firma oli saanud fänn Lõuna-Koreas. Sergey Brin, Google asutaja, jooksis sõnum läbi automaatse tõlke teenust, et ettevõte oli litsentsitud.

Sõnum ütles Google oli lemmik otsingumootor, kuid tulemus lugeda: "viilutatud toores kala kingad, mida ta soovib. Google rohelise sibulaga asi! "

Hr Brin ütles Google peaks olema võimalik teha paremini. Kuus aastat hiljem, selle tasuta Google Translate teenuse käepidemed 52 keeles, rohkem kui ükski sarnane süsteem ja inimesed kasutavad seda sadu miljoneid korda nädalas tõlkida veebilehti ja muu tekst.

"Mida sa näed Google Translate on nüüdisaegse" arvuti tõlkeid, mis ei ole piiratud ühegi konkreetse valdkonnaga, ütles Alon Lavie ühendab teadustöös professori Language Technologies Institute Carnegie Mellon University.

Google püüdlustest paisutab otsivad internetist on täidetud segatud edu. Selle digitaalsed raamatud projekt on üles riputatud kohtus, ning kehtestada tema sotsiaalne võrgustik, Buzz, tõstis privaatsust hirme. Muster näitab, et see võib mõnikord Viga, kui ta püüab väljakutse äri traditsioone ja kultuuritraditsioonid.

Aga Google on kiire tõus tippu ešelonidele tõlge äri on meeldetuletus sellest, mis võib juhtuda, kui Google vallandab selle brute-force arvutite võimsus on keerulisi probleeme.

Võrgustik andmekeskuste et ehitatud Web otsinguid võib nüüd, mil soritud koos, maailma suurimat arvutivõrku. Google kasutab seda masinat push piirid tőlketehnoloogiat. Eelmisel kuul näiteks see ütles, et see töötas ühendada tema tõlkimise vahend koos kujutise analüüs, mis võimaldab isikul, ütleme, võtke mobiiltelefon foto menüü saksa ja saad kohe tõlgituna inglise keelde.

"Masintõlge on üks parimaid näiteid, mis näitab Google'i strateegilise visiooni," ütles Tim O'Reilly asutaja ja tegevjuht tehnoloogia kirjastaja O'Reilly Media. "See pole midagi, et keegi teine on võtnud väga tõsiselt. Aga Google mõistab midagi andmed, et keegi mõistab ja on valmis tegema vajalikke investeeringuid, et võidelda selliseid keerulisi probleeme enne turul. "

Loomine tõlkimise masin on pikka aega peetud üks raskemaid väljakutseid tehisintellekti. Aastakümneid arvuti teadlased proovinud, kasutades reeglid lähenemine - õpetamine arvuti keeleline reeglid kahes keeles ning talle vaja sõnaraamatuid.

Aga 1990-ndate keskel, teadlased hakkasid soodustades niinimetatud statistiline lähenemine. Nad leidsid, et kui nad toidetud arvuti tuhandete või miljonite lõigud ja nende inimeste loodud tõlked, see võiks õppida teha täpseid arvailtaisiin kuidas tõlkida uusi tekste.

Selgub, et see meetod, mis nõuab tohutul hulgal andmeid ja palju arvutustehnika hobujõudu, on õigus kuni Google'i alley.

"Meie infrastruktuur on väga hästi seda," Vic Gundotra, asepresident insener Google ütles. "Me ei saa võtta lähenemisviise, et teised ei saa isegi unistada."

Automaattõlke süsteemid on kaugel täiuslikkusest ja isegi Google ei pane inimeste tõlkijad välja töö igal ajal kiiresti. Eksperdid ütlevad, et see on äärmiselt raske arvuti murda lause osadeks, siis tõlkida ja kokku panna neid.

Aga Google'i teenus on piisavalt hea, et edasi sisuliselt uudis, ja see on muutunud kiire allikas tõlked miljoneid inimesi. "Kui teil on vaja käib küll tõlget, see on koht, kuhu minna," ütles Philip Resnik, masintõlge ekspert ja dotsent keeleteaduse University of Maryland, College Park.

Nagu tema rivaalid valdkonnas, eelkõige Microsoft ja IBM, Google on toidetud selle tõlge mootor ärakirjad Ühinenud Rahvaste Organisatsiooni menetluses, mis on tõlgitud inimeste poolt kuueks keeles ning need Euroopa Parlamendile, mis on tõlgitud 23. See tooraine kasutatakse rongi süsteemid levinumaid keeli.

Aga Google on pesemata teksti Web, samuti andmeid selle raamatu skaneerimine projekti ja teised allikad, liikuda nendest keeltest. Jaoks läbipaistmatumaks keeles, ta on "tööriistakomplekti", mis aitab kasutajatele tõlkeid ja lisab siis need tekstid oma andmebaasi.

Google'i pakkumist võiks panna mõlk müük ettevõtte tõlkimise tarkvara firmad nagu IBM Aga automaattõlke kunagi tõenäoliselt suur Moneymaker, vähemalt mitte standardite järgi Google'i reklaami äri. Still, Google püüdlused tasub end mitmel viisil.

Kuna Google'i reklaamid on kõikjal online, midagi, mis muudab lihtsamaks, et inimesed kasutavad Web kasu ettevõte. Ja süsteem võib kaasa tuua uusi huvitavaid rakendusi. Eelmisel nädalal ettevõtte ütles ta kasutab kõnetuvastus luua tekste inglise keele YouTube'i videod, mis võiksid olla tõlgitud 50 teistes keeltes.

"See tehnoloogia võib teha keelebarjääri ära minema," ütles Franz Och, peamine teadlane Google, kes viib ettevõtte masintõlge meeskond. "See võimaldaks keegi suhelda kellegi teisega."

Hr Och Saksa teadlane, kes on varem töötanud University of Southern California, ütles, et ta oli esialgu tõrges liituda Google, kartes see kohtleks tõlget pool projekti. Larry Page, Google teised asutaja ehk rahustab teda.

"Ta põhimõtteliselt ütles, et see on midagi, mis on väga oluline, et Google," Hr Och meenutas hiljuti. Hr Och allkirjastati 2004 ja oli kohe võimalik panna hr Page lubadus test.

Kuigi paljud masintõlkesüsteemid nagu Google kasutada kuni miljard sõnad teksti luua mudel keeles, Google läks palju suurem: mõned 100000000000 ingliskeelseid sõnu. "Mudelid muutunud paremaks veel teksti, mida protsess," Hr Och ütles.

Vaeva ära tasunud. Aasta hiljem, Google võitis valitsuse juhitud konkurents, et katsed kogenud masintõlkesüsteemid.

Google on kasutanud sarnast lähenemist - tohutut infotöötlus võimsus, hunnikutes andmed ja statistika - lahendada keerukaid probleeme. Aastal 2007 näiteks, see hakkas pakkuma 800-GOOG-411, vaba kataloog abi teenus, mis tõlgendab rääkinud taotlusi. See võimaldas Google koguda hääli miljoneid inimesi, seega võib saada paremini tunnistades rääkinud inglise keelt.

Aasta hiljem, Google vabastatakse otsingu-by-hääle süsteemi, mis oli nii hea, kui neile, kes võttis teiste ettevõtete aastat ehitada.

Ja eelmise aasta lõpus, tutvustas Google teenust nimega Goggles mis analüüsib size fotosid, sobitades neid andmebaasi üle miljardi internetis kujutisi, kaasa arvatud fotod tänavatel võtta oma Street View teenuse.

Hr Och tunnistas, et Google tõlge süsteemi vaja veel arenguruumi, kuid ta ütles, et läheb paremaks kiire. "Praegune kvaliteedi parandamise kõver on ikka päris järsk," ütles ta.

Originaal artikkel ...