Erthygl Newyddion ailargraffwyd o bapur newydd The New York Times.
Mewn cyfarfod yn Google yn 2004, y drafodaeth droi at neges e-bost y cwmni wedi derbyn oddi wrth ffan yn Ne Korea. Sergey Brin yn rhedeg, yn sylfaenydd Google, y neges drwy wasanaeth cyfieithu awtomatig bod y cwmni wedi trwyddedig.
Y neges Dywedodd Google yn hoff chwilotwr, ond darllenwch y canlyniad: "Mae wedi ei sleisio esgidiau pysgod amrwd y mae'n dymuno. Google beth winwnsyn gwyrdd! "
Dywedodd Mr Brin Google dylai fod yn gallu gwneud yn well. Chwe blynedd yn ddiweddarach, mae ei rhad ac am ddim Google Translate gwasanaeth ymdrin â 52 o ieithoedd, yn fwy nag unrhyw system debyg, ac mae pobl yn ei ddefnyddio gannoedd o filiynau o weithiau'r wythnos i gyfieithu tudalennau gwe a thestun eraill.
"Yr hyn a welwch ar Google Translate yn modern" mewn cyfieithiadau cyfrifiadurol nad ydynt yn gyfyngedig i faes pwnc arbennig, dywedodd Alon Lavie, yn athro ymchwil cysylltiol yn y Sefydliad Technolegau Iaith ym Brifysgol Carnegie Mellon.
Google ymdrechion i ymestyn y tu hwnt i chwilio'r We wedi cwrdd â llwyddiant cymysg. Mae ei lyfrau digidol prosiect wedi cael ei hongian i fyny yn y llys, a chyflwyno ei rwydwaith cymdeithasol, Buzz, codi ofnau preifatrwydd. Mae'r patrwm yn awgrymu y gall weithiau misstep pan fydd yn ceisio herio traddodiadau busnes a chonfensiynau diwylliannol.
Ond mae Google yn codi gyflym i haenau uchaf y busnes cyfieithu yn ein hatgoffa o'r hyn y gall ddigwydd pan fydd Google unleashes ei bŵer cyfrifiadurol 'n Ysgrublaidd-rym ar broblemau cymhleth.
Efallai y bydd y rhwydwaith o ganolfannau ddata ei bod yn adeiladu ar gyfer chwiliadau We awr, pan fydd rhwymo at ei gilydd, cyfrifiadur mwyaf y byd. Mae Google yn defnyddio'r peiriant i wthio i'r terfynau ar dechnoleg cyfieithu. Y mis diwethaf, er enghraifft, ei bod yn gweithio i gyfuno ei teclyn cyfieithu gyda dadansoddiad ddelwedd, caniatáu i berson, dyweder, cymryd llun cellphone o bwydlen mewn Almaeneg a chael chyfieithiad Saesneg yn syth.
"Peiriant cyfieithu yn un o'r enghreifftiau gorau sy'n dangos Google gweledigaeth strategol," meddai Tim O'Reilly, sylfaenydd a phrif weithredwr y cyhoeddwr dechnoleg O'Reilly Media. "Nid yw'n rhywbeth y unrhyw un arall yn cymryd o ddifrif. Ond mae Google yn deall rhywbeth am ddata a neb arall yn deall, ac mae'n barod i wneud y buddsoddiadau angenrheidiol i fynd i'r afael â'r mathau o broblemau cymhleth o flaen y farchnad. "
Creu peiriant cyfieithu ers tro weld fel un o'r heriau anoddaf yn deallusrwydd artiffisial. Ers degawdau, mae gwyddonwyr wedi ceisio cyfrifiadur gan ddefnyddio dull sy'n seiliedig ar reolau - addysgu'r y cyfrifiadur y rheolau ieithyddol dwy iaith ac yn ei roi i'r geiriaduron angenrheidiol.
Ond yng nghanol y 1990au-, dechreuodd ymchwilwyr ffafrio dull hyn a elwir yn ystadegol. Maent yn gweld bod os ydynt yn cael eu bwydo i'r miloedd cyfrifiadur neu miliynau o ddarnau a'u dynol-gynhyrchir cyfieithiadau, gallai dysgu gwneud ddyfalu gywir am sut i gyfieithu testunau newydd.
Mae'n ymddangos bod y dechneg hon, sy'n gofyn llawer iawn o ddata a llawer o marchnerth cyfrifiadureg, yn gywir hyd Google ale.
"Mae ein seilwaith yn dda iawn-addas ar gyfer hyn," meddai Vic Gundotra, is-lywydd ar gyfer peirianneg ar Google,. "Gallwn gymryd ymagweddau na all pobl eraill hyd yn oed yn freuddwyd o."
Systemau cyfieithu awtomataidd yn bell o fod yn berffaith, ac ni fydd hyd yn oed yn rhoi Google cyfieithwyr dynol allan o waith ar unrhyw adeg cyn bo hir. Mae arbenigwyr yn dweud ei bod yn eithriadol o anodd i gyfrifiadur i dorri dedfryd i mewn i rannau, yna cyfieithu ac ailosod nhw.
Ond mae Google gwasanaeth yn ddigon da i gyfleu hanfod yr erthygl newyddion, ac mae wedi dod yn ffynhonnell cyflym ar gyfer cyfieithiadau i filiynau o bobl. "Os oes angen cyfieithiad bras-a-yn barod, dyma'r lle i fynd," meddai Philip Resnik, peiriant cyfieithu arbenigwr ac athro cyswllt o ieithyddiaeth ym Mhrifysgol Maryland, Coleg y Parc.
Fel ei gystadleuwyr yn y maes, yn fwyaf nodedig Microsoft ac IBM, Google wedi bwydo ei beiriant cyfieithu â thrawsgrifiadau o'r Cenhedloedd Unedig achosion, sy'n cael eu cyfieithu gan bobl i mewn i chwe iaith, a'r rhai o Senedd Ewrop, sy'n cael eu cyfieithu i'r 23. Mae'r deunydd crai yn cael ei ddefnyddio i hyfforddi systemau ar gyfer yr ieithoedd mwyaf cyffredin.
Ond mae Google wedi sgwrio'r testun y We, yn ogystal â data gan ei sganio lyfr brosiect a ffynonellau eraill, i symud y tu hwnt yr ieithoedd hynny. Am fwy o ieithoedd aneglur, mae wedi rhyddhau "tool kit" sy'n helpu defnyddwyr gyda chyfieithiadau ac yna ychwanegu rhai testunau at ei gronfa ddata.
Gallai Google cynnig rhoi tolc yng ngwerthiant meddalwedd cyfieithu corfforaethol gan gwmnïau fel IBM Ond byth awtomataidd cyfieithu yn debygol o fod yn moneymaker fawr, o leiaf nid gan y safonau busnes hysbysebion Google. Still, gallai Google ymdrechion dwyn ffrwyth mewn sawl ffordd.
Gan fod Google ads ar-lein ym mhobman, unrhyw beth sy'n ei gwneud yn haws i bobl ddefnyddio'r We manteision i'r cwmni. A gallai system arwain at geisiadau newydd diddorol. Yr wythnos diwethaf, mae'r cwmni yn dweud y byddai'n defnyddio adnabod llais i gynhyrchu capsiynau ar gyfer Saesneg fideos YouTube, y gellid wedyn yn cael ei gyfieithu i 50 o ieithoedd eraill.
"Gall hyn dechnoleg wneud y rhwystr iaith yn mynd i ffwrdd," meddai Franz Och, gwyddonydd prif ar Google sy'n arwain y cwmni peiriant tîm cyfieithu. "Byddai'n galluogi unrhyw un i gyfathrebu gydag unrhyw un arall."
Dywedodd Mr Och, ymchwilydd Almaeneg a fu'n gweithio ym Mhrifysgol Southern California, roedd yn cychwyn yn amharod i ymuno â Google, gan ofni y byddai'n trin cyfieithu fel prosiect ochr. O'r enw Larry Page, Google sylfaenydd eraill, i roi sicrwydd iddo.
"Roedd y bôn Dywedodd fod hyn yn rhywbeth sy'n bwysig iawn i Google," meddai Mr Och yn ddiweddar. Lofnodwyd Mr Och ymlaen yn 2004 ac roedd yn fuan yn gallu rhoi addewid Mr Dudalen i'r prawf.
Er bod llawer o systemau cyfieithu fel Google ddefnyddio hyd at un biliwn o eiriau o destun i greu model o iaith, Google aeth llawer mwy: ychydig 100,000,000,000 geiriau Saesneg. "Mae'r modelau yn dod yn well ac yn well y testun yn fwy rydych broses," meddai Mr Och.
Mae'r ymdrech talu ar ei ganfed. Flwyddyn yn ddiweddarach, mae Google yn ennill cystadleuaeth y llywodraeth sy'n cael ei rhedeg y profion systemau cyfieithu soffistigedig.
Mae Google wedi defnyddio dull tebyg - bŵer cyfrifiadurol enfawr, tomenni o ddata ac ystadegau - i fynd i'r afael â phroblemau cymhleth eraill. Yn 2007, er enghraifft, mae'n cynnig dechreuodd 800-411-GOOG, gwasanaeth cyfeiriadur cymorth rhad ac am ddim sy'n dehongli ceisiadau llafar. Mae'n caniatáu i gasglu Google lleisiau miliynau o bobl fel y gallai wella eu dull o adnabod Saesneg llafar.
Flwyddyn yn ddiweddarach, mae Google yn rhyddhau system chwilio yn ôl-lais a oedd cystal â'r rhai a gymerodd flynyddoedd cwmnïau eraill i adeiladu.
Ac yn hwyr y llynedd, mae Google yn cyflwyno gwasanaeth o'r enw Gogls sy'n dadansoddi lluniau cellphone, cyfateb i gronfa ddata o fwy na biliwn o ddelweddau ar-lein, gan gynnwys lluniau o strydoedd a gymerir ar gyfer ei wasanaeth View Street.
Cydnabu Mr Och y system gyfieithu Google ei angen yn dal i wella, ond dywedodd ei bod yn gwella yn gyflym. "Mae'r gromlin gwella ansawdd ar hyn o bryd yn dal yn eithaf serth," meddai.
Erthygl gwreiddiol ...