brubros
09-03-10, 18:43
News artikulo na reprinted mula sa New York Times pahayagan.
Sa isang pulong sa Google noong 2004, ang talakayan ay lumipat sa isang e-mail na mensahe na ang kumpanya ay may natanggap mula sa isang tagahanga sa South Korea. Sergey Brin, isang founder ng Google, tumakbo ang mga mensahe sa pamamagitan ng isang awtomatikong serbisyo ng pagsasalin na ang kumpanya ay lisensiyado.
Ang mensahe ay sinabi Google ay isang paboritong search engine, ngunit ang resulta basahin: "Ang hiwa raw sapatos ng isda na ito kagustuhan. Google berdeng sibuyas bagay! "
Mr Brin ay sinabi ng Google ala na magagawa upang gawin mas mahusay. Anim na taon mamaya, libre Google Isalin ang serbisyo humahawak ng 52 mga wika, higit pa kaysa sa anumang katulad na sistema, at itong gamitin ng mga tao daan-daang mga milyon-milyong mga beses sa isang linggo upang isalin ang mga pahina ng Web at iba pang teksto.
"Ano ang nakikita mo sa Google Translate ang estado ng art" sa mga pagsasalin ng computer na hindi limitado sa isang partikular na lugar ng paksa, sinabi Alon Lavie, isang iugnay propesor ng pananaliksik sa Wika Technologies Institute sa Carnegie Mellon University.
Ang pagsisikap ng Google upang palawakin lampas sa paghahanap sa Web ay may matugunan na may halo-halong tagumpay. Nito sa mga digital na libro na proyekto ay Hung up sa hukuman, at ang pagpapakilala ng social network nito, Buzz, ay itinaas ng takot privacy. Ang pattern ay nagmumungkahi na ang minsan magkamali kapag sinusubukang i-hamon ang mga tradisyon ng negosyo at kultura balarila.
Ngunit ang mabilis na tumaas ng Google sa tuktok echelons ng negosyo ng pagsasalin ay isang paalala ng kung ano ang maaaring mangyari kapag ang Google unleashes nito astig-lakas computing kapangyarihan sa mga komplikadong problema.
Ang network ng mga sentro ng data na ito ay binuo para sa paghahanap Web ay maaaring ngayon, kapag lashed magkasama, ang pinakamalaking computer sa mundo. Ang Google ay gumagamit na machine upang itulak ang mga limitasyon sa teknolohiya ng pagsasalin. Noong nakaraang buwan, halimbawa, sinabi ito ay nagtatrabaho upang pagsamahin ang kanyang translation tool sa pagtatasa ng imahe, na nagpapahintulot sa isang tao sa, sabihin nating, kumuha ng cellphone na larawan ng isang menu sa Aleman at makakuha ng isang instant Ingles na pagsasalin.
"Ang Machine translation ay isa sa ang pinakamahusay na halimbawa na nagpapakita ng madiskarteng pananaw ng Google," sabi ni Tim O'Reilly, ang founder at chief executive ng teknolohiya publisher O'Reilly Media. "Ito ay hindi isang bagay na sinuman ay tumatagal sineseryoso. Subalit Google naiintindihan ang isang bagay tungkol sa mga data na walang ibang naiintindihan, at ito ay handa upang gawin ang mga pamumuhunan kinakailangan upang pansing ang mga ganitong uri ng mga komplikadong mga problema maaga ng merkado. "
Paglikha ng pagsasalin machine ay mahaba ay makikita bilang isa sa mga toughest hamon sa artipisyal katalinuhan. Para sa mga dekada, ang mga computer siyentipiko sinubukan gamit ang isang patakaran-based na diskarte - pagtuturo sa computer ang mga lingguwistika tuntunin ng dalawang wika at pagbibigay ng ito ang mga kinakailangan na dictionaries.
Ngunit sa ang kalagitnaan-1990s, ang mga mananaliksik ay nagsimulang favoring isang tinatawag na statistical diskarte. Natagpuan nila na kung sila fed ang mga libu-libo ng computer o milyun-milyong ng mga passages at ang kanilang mga tao-generated na mga pagsasalin, maaaring malaman upang gumawa ng mga tumpak na guesses tungkol sa kung paano upang isalin ang mga bagong teksto.
Ito ay lumiliko out na ito pamamaraan, na nangangailangan ng malaking halaga ng data at maraming ng computing horspawer, ay karapatan up ng Google eskina.
"Ang aming imprastraktura ay masyadong mahusay na angkop na ito," Vic Gundotra, isang vice president para sa engineering sa Google, sinabi. "Maaari naming gawin ang mga pamamaraan na iba ay hindi maaari kahit na managinip ng."
Automated translation system ay malayo mula sa perpekto, at kahit ng Google ay hindi ilagay ang tao tagasalin out ng isang trabaho sa anumang oras sa lalong madaling panahon. Eksperto sa sabihin ito ay lubha mahirap para sa isang computer upang masira ang isang pangungusap sa bahagi, pagkatapos isalin at buuing muli ang mga ito.
Ngunit ang service ng Google ay mabuti sapat na upang ihatid ang kakanyahan ng isang artikulo ng balita, at ito ay maging isang mabilis na source para sa pagsasalin para sa mga milyon-milyong ng mga tao. "Kung kailangan mo ng isang magaspang-at-handa na pagsasalin, ito ay ang lugar upang pumunta," sabi ni Philip Resnik, isang dalubhasa ng makina pagsasalin at iugnay ang propesor ng mga lingguwistika sa University of Maryland, College Park.
Tulad nito mga rivals sa patlang, pinaka-kapansin-pansin Microsoft at IBM, ang Google ay fed sa pagsasalin engine nito sa mga transcript ng Estados paglilitis Nations, na kung saan ay isinalin ng mga tao sa anim na wika, at ng mga European Parlamento, kung saan ay isinalin sa 23. Ang raw materyal na ito ay ginagamit sa tren ang mga sistema para sa mga pinaka-karaniwang wika.
Subalit Google ay scoured ang teksto ng Web, pati na rin ang data mula sa pag-scan ng aklat ng proyekto at iba pang mga pinagkukunan, upang ilipat na lampas sa mga wikang iyon. Para sa higit pang nakatago wika, ito ay inilabas ng isang "tool kit" na tumutulong sa mga gumagamit na may mga pagsasalin at pagkatapos ay nagdadagdag ng mga teksto sa ang database.
Ay nag-aalok ng Google ay maaaring maglagay ng isang kuping sa mga benta ng corporate pagsasalin software mula sa mga kumpanya tulad ng IBM Ngunit ang awtomatikong pagsasalin ay hindi malamang na maging isang malaki moneymaker, hindi bababa sa hindi sa pamamagitan ng mga pamantayan ng negosyong advertising ng Google. Pa, ang pagsisikap ng Google ay maaaring bayaran sa maraming paraan.
Dahil ng mga ad ng Google ay nasa lahat ng pook online, anumang bagay na ginagawang mas madali para sa mga tao upang gamitin ang mga pakinabang ng Web ng kumpanya. At ng sistema ang maaaring humantong sa mga kagiliw-giliw na bagong application. Noong nakaraang linggo, ang kumpanya sinabi ito ay gamitin ang pagsasalita pagkilala upang bumuo ng mga caption para sa Ingles-wika YouTube video, na maaaring pagkatapos ay isinalin sa 50 iba pang mga wika.
"Ang teknolohiya na ito ay maaaring gumawa ng ang wika barrier umalis," sabi ni Franz Och, isang punong-guro na siyentipiko sa Google na leads machine translation ng kumpanya koponan. "Mas payagan ang sinuman na makipag-usap sa sinuman."
Mr Och, isang Aleman researcher na dati ay nagtrabaho sa University of Southern California, sinabi siya ay una nag-aatubili upang sumali sa Google, takot ito ay ituturing pagsasalin bilang bahagi ng isang proyekto. Larry Page, ang iba pang mga founder ng Google, na tinatawag na upang muling magbigay-tiwala sa kanya.
"Sinabi niya talaga na ito ay isang bagay na ay napakahalaga para sa Google," Mr Och recalled kamakailan. Mr Och-sign sa sa 2004 at noon ay madaling ma-ilagay ang Mr Page pangako ay sa pagsubok.
Habang ang maraming mga sistema ng pagsasalin tulad ng Google ay gumamit ng hanggang isang bilyong mga salita ng teksto upang lumikha ng isang modelo ng isang wika, ang Google ay nagpunta magkano ang mas malaking: ilang daang bilyong mga salitang Ingles. "Ang mga modelong maging mas mahusay at mas mahusay na mas marami ang text proseso," Mr Och sinabi.
Pagsisikap Ang bayad off. Isang taon mamaya, ang Google ay nanalo ng pamahalaan-magpatakbo ng kumpetisyon na pagsubok ng mga sopistikadong sistema pagsasalin.
Ang Google ay ginagamit ng isang katulad na diskarte - napakalawak na computing kapangyarihan, ang mga tambak ng mga data at mga istatistika-pansing ang iba pang mga kumplikadong problema. Noong 2007, halimbawa, ay nagsimulang aalok ng 800-GOOG-411, isang libreng serbisyo sa tulong ng direktoryo na kahulugan ng mga ginagamit kahilingan. Ito pinapayagan Google upang mangolekta ang mga tinig ng mga milyon-milyong ng mga tao upang ito ay maaaring makakuha ng mas mahusay Kinikilala ginagamit Ingles.
Isang taon mamaya, ang Google ay inilabas ng isang search-by-voice system na bilang mabuting bilang mga na kinuha ng iba pang mga kumpanya taon upang bumuo.
At ang huli nakaraang taon, ang Google nagpasimula ng isang serbisyo na tinatawag na Goggles na pinag-aaralan ng mga cellphone mga larawan, pagtutugma ang mga ito sa isang database ng higit pa sa isang bilyong mga online na mga imahe, kabilang ang mga larawan ng mga kalye na kinuha para sa Street View serbisyo.
Mr Och kinikilala na ang pagsasalin ng sistema ng Google pa rin kailangan ng pagpapabuti, ngunit sinabi niya ito ay nakakakuha ng mas mahusay na mabilis. "Ang kasalukuyang pagpapabuti ng kalidad ng curve ay pa rin medyo matarik," siya sinabi.
Orihinal na artikulo ... (Http://www.nytimes.com/2010/03/09/technology/09translate.html?hp)
Sa isang pulong sa Google noong 2004, ang talakayan ay lumipat sa isang e-mail na mensahe na ang kumpanya ay may natanggap mula sa isang tagahanga sa South Korea. Sergey Brin, isang founder ng Google, tumakbo ang mga mensahe sa pamamagitan ng isang awtomatikong serbisyo ng pagsasalin na ang kumpanya ay lisensiyado.
Ang mensahe ay sinabi Google ay isang paboritong search engine, ngunit ang resulta basahin: "Ang hiwa raw sapatos ng isda na ito kagustuhan. Google berdeng sibuyas bagay! "
Mr Brin ay sinabi ng Google ala na magagawa upang gawin mas mahusay. Anim na taon mamaya, libre Google Isalin ang serbisyo humahawak ng 52 mga wika, higit pa kaysa sa anumang katulad na sistema, at itong gamitin ng mga tao daan-daang mga milyon-milyong mga beses sa isang linggo upang isalin ang mga pahina ng Web at iba pang teksto.
"Ano ang nakikita mo sa Google Translate ang estado ng art" sa mga pagsasalin ng computer na hindi limitado sa isang partikular na lugar ng paksa, sinabi Alon Lavie, isang iugnay propesor ng pananaliksik sa Wika Technologies Institute sa Carnegie Mellon University.
Ang pagsisikap ng Google upang palawakin lampas sa paghahanap sa Web ay may matugunan na may halo-halong tagumpay. Nito sa mga digital na libro na proyekto ay Hung up sa hukuman, at ang pagpapakilala ng social network nito, Buzz, ay itinaas ng takot privacy. Ang pattern ay nagmumungkahi na ang minsan magkamali kapag sinusubukang i-hamon ang mga tradisyon ng negosyo at kultura balarila.
Ngunit ang mabilis na tumaas ng Google sa tuktok echelons ng negosyo ng pagsasalin ay isang paalala ng kung ano ang maaaring mangyari kapag ang Google unleashes nito astig-lakas computing kapangyarihan sa mga komplikadong problema.
Ang network ng mga sentro ng data na ito ay binuo para sa paghahanap Web ay maaaring ngayon, kapag lashed magkasama, ang pinakamalaking computer sa mundo. Ang Google ay gumagamit na machine upang itulak ang mga limitasyon sa teknolohiya ng pagsasalin. Noong nakaraang buwan, halimbawa, sinabi ito ay nagtatrabaho upang pagsamahin ang kanyang translation tool sa pagtatasa ng imahe, na nagpapahintulot sa isang tao sa, sabihin nating, kumuha ng cellphone na larawan ng isang menu sa Aleman at makakuha ng isang instant Ingles na pagsasalin.
"Ang Machine translation ay isa sa ang pinakamahusay na halimbawa na nagpapakita ng madiskarteng pananaw ng Google," sabi ni Tim O'Reilly, ang founder at chief executive ng teknolohiya publisher O'Reilly Media. "Ito ay hindi isang bagay na sinuman ay tumatagal sineseryoso. Subalit Google naiintindihan ang isang bagay tungkol sa mga data na walang ibang naiintindihan, at ito ay handa upang gawin ang mga pamumuhunan kinakailangan upang pansing ang mga ganitong uri ng mga komplikadong mga problema maaga ng merkado. "
Paglikha ng pagsasalin machine ay mahaba ay makikita bilang isa sa mga toughest hamon sa artipisyal katalinuhan. Para sa mga dekada, ang mga computer siyentipiko sinubukan gamit ang isang patakaran-based na diskarte - pagtuturo sa computer ang mga lingguwistika tuntunin ng dalawang wika at pagbibigay ng ito ang mga kinakailangan na dictionaries.
Ngunit sa ang kalagitnaan-1990s, ang mga mananaliksik ay nagsimulang favoring isang tinatawag na statistical diskarte. Natagpuan nila na kung sila fed ang mga libu-libo ng computer o milyun-milyong ng mga passages at ang kanilang mga tao-generated na mga pagsasalin, maaaring malaman upang gumawa ng mga tumpak na guesses tungkol sa kung paano upang isalin ang mga bagong teksto.
Ito ay lumiliko out na ito pamamaraan, na nangangailangan ng malaking halaga ng data at maraming ng computing horspawer, ay karapatan up ng Google eskina.
"Ang aming imprastraktura ay masyadong mahusay na angkop na ito," Vic Gundotra, isang vice president para sa engineering sa Google, sinabi. "Maaari naming gawin ang mga pamamaraan na iba ay hindi maaari kahit na managinip ng."
Automated translation system ay malayo mula sa perpekto, at kahit ng Google ay hindi ilagay ang tao tagasalin out ng isang trabaho sa anumang oras sa lalong madaling panahon. Eksperto sa sabihin ito ay lubha mahirap para sa isang computer upang masira ang isang pangungusap sa bahagi, pagkatapos isalin at buuing muli ang mga ito.
Ngunit ang service ng Google ay mabuti sapat na upang ihatid ang kakanyahan ng isang artikulo ng balita, at ito ay maging isang mabilis na source para sa pagsasalin para sa mga milyon-milyong ng mga tao. "Kung kailangan mo ng isang magaspang-at-handa na pagsasalin, ito ay ang lugar upang pumunta," sabi ni Philip Resnik, isang dalubhasa ng makina pagsasalin at iugnay ang propesor ng mga lingguwistika sa University of Maryland, College Park.
Tulad nito mga rivals sa patlang, pinaka-kapansin-pansin Microsoft at IBM, ang Google ay fed sa pagsasalin engine nito sa mga transcript ng Estados paglilitis Nations, na kung saan ay isinalin ng mga tao sa anim na wika, at ng mga European Parlamento, kung saan ay isinalin sa 23. Ang raw materyal na ito ay ginagamit sa tren ang mga sistema para sa mga pinaka-karaniwang wika.
Subalit Google ay scoured ang teksto ng Web, pati na rin ang data mula sa pag-scan ng aklat ng proyekto at iba pang mga pinagkukunan, upang ilipat na lampas sa mga wikang iyon. Para sa higit pang nakatago wika, ito ay inilabas ng isang "tool kit" na tumutulong sa mga gumagamit na may mga pagsasalin at pagkatapos ay nagdadagdag ng mga teksto sa ang database.
Ay nag-aalok ng Google ay maaaring maglagay ng isang kuping sa mga benta ng corporate pagsasalin software mula sa mga kumpanya tulad ng IBM Ngunit ang awtomatikong pagsasalin ay hindi malamang na maging isang malaki moneymaker, hindi bababa sa hindi sa pamamagitan ng mga pamantayan ng negosyong advertising ng Google. Pa, ang pagsisikap ng Google ay maaaring bayaran sa maraming paraan.
Dahil ng mga ad ng Google ay nasa lahat ng pook online, anumang bagay na ginagawang mas madali para sa mga tao upang gamitin ang mga pakinabang ng Web ng kumpanya. At ng sistema ang maaaring humantong sa mga kagiliw-giliw na bagong application. Noong nakaraang linggo, ang kumpanya sinabi ito ay gamitin ang pagsasalita pagkilala upang bumuo ng mga caption para sa Ingles-wika YouTube video, na maaaring pagkatapos ay isinalin sa 50 iba pang mga wika.
"Ang teknolohiya na ito ay maaaring gumawa ng ang wika barrier umalis," sabi ni Franz Och, isang punong-guro na siyentipiko sa Google na leads machine translation ng kumpanya koponan. "Mas payagan ang sinuman na makipag-usap sa sinuman."
Mr Och, isang Aleman researcher na dati ay nagtrabaho sa University of Southern California, sinabi siya ay una nag-aatubili upang sumali sa Google, takot ito ay ituturing pagsasalin bilang bahagi ng isang proyekto. Larry Page, ang iba pang mga founder ng Google, na tinatawag na upang muling magbigay-tiwala sa kanya.
"Sinabi niya talaga na ito ay isang bagay na ay napakahalaga para sa Google," Mr Och recalled kamakailan. Mr Och-sign sa sa 2004 at noon ay madaling ma-ilagay ang Mr Page pangako ay sa pagsubok.
Habang ang maraming mga sistema ng pagsasalin tulad ng Google ay gumamit ng hanggang isang bilyong mga salita ng teksto upang lumikha ng isang modelo ng isang wika, ang Google ay nagpunta magkano ang mas malaking: ilang daang bilyong mga salitang Ingles. "Ang mga modelong maging mas mahusay at mas mahusay na mas marami ang text proseso," Mr Och sinabi.
Pagsisikap Ang bayad off. Isang taon mamaya, ang Google ay nanalo ng pamahalaan-magpatakbo ng kumpetisyon na pagsubok ng mga sopistikadong sistema pagsasalin.
Ang Google ay ginagamit ng isang katulad na diskarte - napakalawak na computing kapangyarihan, ang mga tambak ng mga data at mga istatistika-pansing ang iba pang mga kumplikadong problema. Noong 2007, halimbawa, ay nagsimulang aalok ng 800-GOOG-411, isang libreng serbisyo sa tulong ng direktoryo na kahulugan ng mga ginagamit kahilingan. Ito pinapayagan Google upang mangolekta ang mga tinig ng mga milyon-milyong ng mga tao upang ito ay maaaring makakuha ng mas mahusay Kinikilala ginagamit Ingles.
Isang taon mamaya, ang Google ay inilabas ng isang search-by-voice system na bilang mabuting bilang mga na kinuha ng iba pang mga kumpanya taon upang bumuo.
At ang huli nakaraang taon, ang Google nagpasimula ng isang serbisyo na tinatawag na Goggles na pinag-aaralan ng mga cellphone mga larawan, pagtutugma ang mga ito sa isang database ng higit pa sa isang bilyong mga online na mga imahe, kabilang ang mga larawan ng mga kalye na kinuha para sa Street View serbisyo.
Mr Och kinikilala na ang pagsasalin ng sistema ng Google pa rin kailangan ng pagpapabuti, ngunit sinabi niya ito ay nakakakuha ng mas mahusay na mabilis. "Ang kasalukuyang pagpapabuti ng kalidad ng curve ay pa rin medyo matarik," siya sinabi.
Orihinal na artikulo ... (Http://www.nytimes.com/2010/03/09/technology/09translate.html?hp)