News article herdruk van The New York Times koerant.
In 'n vergadering by Google in 2004, draai die gesprek na' n e-pos wat die maatskappy ontvang het van 'n fan in Suid-Korea. Sergey Brin, 'n stigter van Google, het hy die boodskap deur' n outomatiese vertaling dat die maatskappy het gelisensieer.
Die boodskap het gesê Google was 'n gunsteling soekenjin, maar die resultaat te lees: "die gesnyde rou vis skoene wat dit wil. Google groen uie ding! "
Mnr. Brin gesê Google behoort in staat te wees om beter te doen. Ses jaar later, hanteer sy gratis diens Google Translate 52 tale, meer as enige soortgelyke stelsel, en mense gebruik dit honderde miljoene keer per week webblaaie en ander teks te vertaal.
"Wat jy sien op Google Translate is state of the art" rekenaar vertalings wat nie beperk tot 'n bepaalde vak gebied, het gesê Alon Lavie,' n mede-professor in die Instituut vir die Language Technologies aan die Carnegie Mellon Universiteit.
Google se pogings om uit te brei as Soek op die web ontmoet het met gemengde sukses. Die digitale boeke-projek is opgehang in die hof, en die bekendstelling van sy sosiale netwerk, alarm, wat privaatheid vrese. Die patroon dui daarop dat dit soms kan misstap wanneer dit probeer om sake tradisies en kulturele konvensies uit te daag.
Maar Google se vinnige aanleiding tot die top-echelons van die vertaling besigheid is 'n herinnering van wat kan gebeur wanneer Google ontsluit sy brute krag rekenkracht op komplekse probleme.
Die netwerk van data-sentrums dat dit gebou is vir die Internet soektogte kan nou toe, wanneer vasgemaak saam die wêreld se grootste rekenaar. Google is die gebruik van die masjien om die grense op die vertaling tegnologie te stoot. Verlede maand, byvoorbeeld, het gesê dit is besig om sy vertaling instrument te kombineer met beeldanalyse, sodat 'n persoon aan, sê,' n selfoon foto van 'n spyskaart in Duits en' n oomblik Engelse vertaling kry.
"Masjien vertaling is een van die beste voorbeelde wat toon Google se strategiese visie," sê Tim O'Reilly, stigter en uitvoerende hoof van die tegnologie publisher O'Reilly Media. "Dit is nie iets wat iemand anders is baie ernstig te neem. Maar Google verstaan iets oor data wat niemand anders verstaan, en dit is bereid om van die beleggings wat nodig is om hierdie soort van komplekse probleme voor die mark aan te pak te maak. "
Die skep van 'n vertaling masjien is lank reeds beskou as een van die moeilikste uitdagings in kunsmatige intelligensie. Vir dekades, rekenaar wetenskaplikes probeer om met behulp van 'n reëls-gebaseerde benadering - die onderrig van die rekenaar in die taalkundige reëls van die twee tale en gee dit die nodige woordeboeke.
Maar in die middel van die die jaar 1990, het navorsers begin ten gunste van 'n sogenaamde statistiese benadering. Hulle het bevind dat indien hulle die rekenaar duisende of miljoene van die gange en hulle mens-gegenereerde vertalings gevoer het, dit kon leer om akkurate raaiskote te maak oor hoe om nuwe tekste te vertaal.
Dit blyk dat hierdie tegniek, wat vereis groot hoeveelhede data en baie van rekenaarwetenskap perdekrag, is reg op Google se stegie.
"Ons infrastruktuur is baie goed geskik vir hierdie nie," het Vic Gundotra, 'n vise-president vir Ingenieurswese by Google, gesê. "Ons kan benaderings wat ander kan nie eens droom van."
Outomatiese vertaling is ver van volmaak, en selfs dié van Google sal nie menslike vertalers van 'n werk altyd gou. Kenners sê dit is uiters moeilik vir 'n rekenaar om' n sin te breek in dele, dan vertaal en dit weer aanmekaar.
Maar Google se diens is goed genoeg om die essensie van 'n nuwe artikel oor te dra, en dit het geword' n vinnige bron vir die vertalings van miljoene mense. "As jy 'n rowwe-en-gereed vertaling, dis die plek om te gaan," het Philip Resnik,' n masjien vertaling deskundige en mede-professor van Linguistiek by die Universiteit van Maryland, Kollege Park gesê.
Soos sy mededingers in die veld, het veral Microsoft en IBM, Google sy vertaling enjin met transkripsies van die Verenigde Nasies se verrigtinge, wat deur mense in ses tale vertaal is, en dié van die Europese Parlement, wat vertaal word in 23 gevoed. Hierdie grondstof gebruik word om stelsels op te lei vir die mees algemene taal.
Maar Google het geskuur om die teks van die Web, sowel as die data van sy boek skandering projek en ander bronne, om te beweeg na daardie tale. Vir meer duister tale, het dit 'n "tool kit" wat gebruikers help met vertalings en dan voeg hierdie teks op die databasis vrygestel.
Google se offer kon 'n duik in die verkope van korporatiewe vertaling sagteware van maatskappye soos IBM Maar outomatiese vertaling is nooit waarskynlik tot' n groot wins lid te wees, ten minste nie deur die standaarde van Google se advertensie-maatskappy. Tog, kan Google se pogings om op verskeie maniere betaal.
Omdat Google se advertensies is die alomteenwoordige aanlyn, enigiets wat dit makliker vir mense om te gebruik op die web voordele wat die maatskappy maak. En die stelsel kan lei tot interessante nuwe aansoeke. Verlede week het die maatskappy gesê dit sal spraakherkenning gebruik om die onderskrifte te genereer vir die Engelse-taal YouTube video's, wat in 50 ander tale kan dan vertaal word.
"Hierdie tegnologie kan maak om die taalgrens weg te gaan," sê Franz Ag, 'n belangrike wetenskaplike by Google wat die maatskappy se masjienvertaling span lei. "Dit sal toelaat dat enigiemand om te kommunikeer met iemand anders."
Mnr. Ag, 'n Duitse navorser wat voorheen werksaam by die Universiteit van Suid-Kalifornië, het gesê hy was aanvanklik huiwerig om Google aan te sluit, gevrees dat dit vertaling sou hanteer as' n kant-projek. Larry Page, Google se ander stigter, geroep om hom gerus te stel.
"Hy het basies gesê dat dit is iets wat baie belangrik is vir Google," het mnr Ag teruggeroep onlangs. Mnr. Ag onderteken in 2004 en was gou kan mnr Page se belofte aan die toets te sit.
Terwyl baie vertaling stelsels soos Google se gebruik tot 'n miljard woorde van die teks om' n model van 'n taal te skep, Google het veel groter:' n paar honderd miljard Engelse woorde. "Die modelle word beter en beter hoe meer teks wat jy verwerk nie," het mnr. Ag gesê.
Die poging om af te betaal. 'N Jaar later, Google' n regering-kompetisie wat gesofistikeerde vertaling stelsels toetse gewen het.
Google gebruik het om 'n soortgelyke benadering - enorme rekenkracht, hope van data en statistieke - ander komplekse probleme op te los. In 2007, byvoorbeeld, het dit begin met die 800-GOOG-411, van 'n gratis gids hulp diens wat gepraat versoeke interpreteer. Dit het toegelaat dat Google die stemme van miljoene mense in te samel sodat dit beter kon kry op die erkenning van gesproke Engels.
'N Jaar later, Google' n soektog-by-stem-stelsel wat was so goed soos dié wat ander maatskappye jare om te bou vrygestel.
En laat verlede jaar, Google 'n diens genoem Goggles wat ontleed selfoon foto's, wat ooreenstem met hulle na' n databasis van meer as 'n miljard aanlyn beelde, insluitende foto's van strate geneem vir sy Street View.
Mnr. Ag erken dat Google se vertaling nog verbetering nodig, maar hy het gesê dit was beter vinnig. "Die huidige verbetering van die gehalte kurwe is redelik steil," het hy gesê.
Oorspronklike artikel ...