Ziņu raksts pārpublicēts no The New York Times laikrakstā.

In sanāksmi Google in 2004, diskusija pievērsās e-pasta ziņojumu uzņēmums ir saņēmis no ventilatora Dienvidkorejā. Sergejs Brins, Google dibinātājs, skrēja ziņojumu, izmantojot automātiskās tulkošanas pakalpojumus, kas uzņēmumam bija licencēta.

Ziņa teica, Google ir mīļākie meklētājprogrammu, taču rezultāts lasīt šādi: "lobīti jēlas zivis kurpes vēlas. Google zaļo sīpolu lieta! "

Mr Brins teica, Google vajadzētu spēt darīt labāk. Sešus gadus vēlāk, tā bezmaksas Google Translate pakalpojumu rokturi 52 valodās, vairāk nekā jebkura līdzīga sistēma, un cilvēki to izmanto simtiem miljonu reižu nedēļā tulkot Web lapu un citu tekstu.

"Ko jūs redzat uz Google Translate ir stāvokli", datoru tulkojumus, kas nav tikai uz vienu konkrētu jomu, teica Alon Lavie, piesaistīs zinātniskās izpētes profesors valodu tehnoloģiju institūta Carnegie Mellon University.

Google centieni paplašināt tālāk meklējot tīmeklī ir tikušies ar jauktu panākumiem. Tās digitālo grāmatu projekts ir hung up tiesā, un tās sociālo tīklu, Buzz, ievads izvirzīja privātuma bažas. Raksts norāda, ka tas reizēm var misstep, kad tā mēģina apstrīdēt biznesa tradīcijas un kultūru tradīcijas.

Bet Google ir ātri pieaugt uz augšu posteņus tulkošanas jomā, ir atgādinājums par to, kas var notikt, ja Google unleashes tās brutālu spēku skaitļošanas jauda ir sarežģītas problēmas.

Datu centru tīklu, ka tas būvēts Web meklēšanu, tagad var, kad piesien kopā, pasaulē lielākā datoru. Google izmanto šo mašīnu lai push robežas tulkošanas tehnoloģiju. Pagājušajā mēnesī, piemēram, tas teica, ka strādā, lai apvienotu savus tulkošanas rīks, ar attēlu analīzi, ļaujot personai, teiksim, ņem Mobilais fotogrāfiju izvēlnes vācu valodā un saņemt tūlītēju tulkojumu angļu valodā.

"Machine translation ir viens no labākajiem piemēriem, kas parāda Google stratēģisko redzējumu," teica Tim O'Reilly, dibinātājs un izpilddirektors tehnoloģijas izdevējs O'Reilly Media. "Tas nav kaut kas, ka kāds cits lieto ļoti nopietni. Bet Google saprot kaut ko par datiem, ka neviens cits saprot, un ir gatavi veikt vajadzīgos ieguldījumus, lai risinātu šāda veida sarežģītas problēmas priekšā tirgum. "

Radīt tulkošanas mašīna ir sen tikusi uzskatīta par vienu no toughest problēmas mākslīgo intelektu. Gadu desmitiem, datorzinātnieku to izmēģināju, izmantojot uz noteikumiem balstīta pieeja - mācību dators valodu noteikumus divās valodās, un kas tai nepieciešams vārdnīcas.

Taču 1990.gadu vidū, pētnieki sāka atbalstot tā saukto statistisko pieeju. Viņi konstatēja, ka, ja viņi baro datoru tūkstošiem vai miljoniem eju un to cilvēku radīto tulkojumi, tas var iemācīties izdarīt precīzus minējumus par to, kā pārvērst jaunos tiesību aktus.

Izrādās, ka šī tehnika, kas prasa milzīgus datu apjomus un daudz skaitļošanas jauda, ir tiesības uz augšu Google aleja.

"Mūsu infrastruktūra ir ļoti labi piemērots, lai šo," Vic Gundotra, viceprezidents inženieru Google, teica. "Mēs varam būt pieejas, ko citi nevar pat sapņot."

Automatizētas tulkošanas sistēmas, ir tālu no ideāla, un pat Google netiks likts cilvēka tulkotāji no darba jebkurā tuvākajā laikā. Eksperti saka, ka ir ārkārtīgi grūti datoru, lai izjauktu teikumu daļās, tad tulkot un Salieciet tos.

Bet Google pakalpojums ir pietiekami labs, lai sniegtu būtību ziņu raksts, un tā ir kļuvusi par ātri avotu tulkojumus miljoniem cilvēku. "Ja jums ir nepieciešams raupja un gatavi tulkojumu, tā ir vieta, kur iet," teica Filips Resnik, mašīntulkošanu, ekspertu un asociētais profesors lingvistikā pie Merilendas Universitātes College Park.

Tāpat kā tās konkurentiem šajā jomā, jo īpaši Microsoft un IBM, Google ir baroti tulkošanas dzinējs ar stenogrammas Apvienoto Nāciju Organizācijas lietā, kas tiek tulkoti cilvēki sešās valodās, un tie Eiropas Parlamenta, kas ir tulkota 23. Šis materiāls ir izmantots, lai apmācītu sistēmas visbiežāk valodās.

Bet Google ir mazgāta tekstu Web, kā arī datus no tās grāmatas skenēšana projektu un citiem avotiem, ir jāvirzās tālāk šīs valodas. Lai iegūtu vairāk neskaidra valodās, ir izlaidusi "instrumentu komplekts", kas palīdz lietotājiem ar tulkojumiem, un pēc tam pievieno šo tekstu savā datubāzē.

Google piedāvā varētu likt bedri pārdošanas korporatīvās tulkošanas programmatūru no uzņēmumiem, piemēram IBM Bet automatizētās tulkošanas nekad varētu būt liels Moneymaker, vismaz ne pēc Google reklāmas biznesa standartiem. Still, Google centieniem varētu atmaksāties vairākos veidos.

Tāpēc, ka Google reklāmas ir visuresoša online, viss, kas ļauj cilvēkiem vieglāk izmantot interneta priekšrocības uzņēmums. Un sistēma var novest pie interesantiem jauniem pieteikumiem. Pagājušajā nedēļā, uzņēmums teica tā izmantos runas pazīšanu, lai radītu parakstus par angļu valodas YouTube video, kas varētu iztulkot 50 citās valodās.

"Šī tehnoloģija var padarīt valodas barjera iet prom," teica Francs och, galvenais zinātnieks Google, kurš vada uzņēmuma mašīntulkošanu komanda. "Tas ļaus ikvienam sazināties ar kāds cits."

Mr och, vācu zinātnieks, kurš iepriekš strādājis pie University of Southern California, teica, ka viņš sākotnēji nevēlējās pievienoties Google, baidoties, tas attiektos pret tulkošanu kā blakus projekts. Larry Page, Google citiem dibinātājs, aicināja pārliecināt viņu.

"Viņš būtībā norādīja, ka tas ir kaut kas ir ļoti svarīgi, Google," Mr och nesen atgādināja. Mr och parakstīts 2004 un drīz vien tas spēj nodot Mr Page solījumu pārbaudi.

Kaut arī daudzi tulkošanas sistēmām, piemēram, Google izmanto līdz pat miljardiem vārdus tekstu, lai izveidotu modeli valodu, Google bija daudz lielāks: pāris 100.000.000.000 angļu vārdus. "Modeļi kļūst labāk un labāk vairāk teksta, tu process," Mr och teica.

Pūles atmaksājās. Gadu vēlāk, Google ieguva valdības darboties konkurence, ka testi sarežģītākām tulkošanas sistēmas.

Google ir izmantojusi līdzīgu pieeju - milzīgo skaitļošanas jaudu, kaudzes datus un statistiku - risināt citas sarežģītas problēmas. In 2007, piemēram, tas sāka piedāvāt 800-GOOG-411, bez katalogs palīdzības dienests, kas interpretē valodas pieprasījumiem. Tas ļāva Google vākt balsis miljoniem cilvēku, lai tā varētu labāk, atzīstot, runā angļu valodā.

Gadu vēlāk, Google izlaidusi meklēšanas pa balss sistēmu, kas bija tik labi, kā tiem, kas piedalījušies citu uzņēmumu gadus, lai izveidotu.

Un vēlu pagājušajā gadā, Google ieviesa pakalpojumu sauc Goggles, ka analīzes Mobilais fotogrāfijas, saskaņojot tos ar datu bāzi par vairāk nekā miljardu online attēlus, ieskaitot fotogrāfijas, ielu, kas pieņemti tās Street View pakalpojumu.

Mr och atzina, ka Google tulkošanas sistēma joprojām nepieciešami uzlabojumi, bet viņš teica, ka kļūst labāk ātri. "Pašreizējā kvalitātes uzlabošanas līkne joprojām ir diezgan stāvas," viņš teica.

Oriģinālais raksts ...