Новини статия, препечатана от вестник The New York Times.
По време на срещата в Google през 2004 г., дискусията се обърна към имейл съобщение на компанията е получил от фенове в Южна Корея. Сергей Брин, един от основателите на Google, се кандидатира на съобщение чрез автоматични преводачески услуги, които компанията е лицензирана.
Съобщение, че Google е предпочитаната от вас търсачка, но резултатът се чете: "нарязани сурови обувки риба, желае. Google зелен лук нещо! "
Г-н Брин каза, че Google би трябвало да бъде в състояние да се справят по-добре. Шест години по-късно, свободното му Услугата Google Translate може да работи с 52 езика, повече от всяка подобна система, и хората, които използват стотици милиони пъти на седмица, за да преведат на уеб страници и други текстови.
"Това, което виждате на Google Translate, е състоянието на изкуството" в областта на компютърните преводи, които не са ограничени до определена тематика, каза Алон Lavie, асоцииран професор по изследвания в Института за езикови технологии в университета "Карнеги Мелън".
Усилията на Google да разшири отвъд търсене в интернет са се срещали с променлив успех. Дигитален проект книги е бил обесен в съда, и въвеждането на социалната си мрежа, Бъз, вдигна личния живот страхове. Моделът предполага, че понякога може да греша, когато тя се опитва да оспори бизнес традициите и културните конвенции.
Но бързо покачване на Google към висшите ешелони на превода бизнес е напомняне за това какво може да се случи, когато Google отприщва груба сила изчислителна мощност на сложни проблеми.
Мрежа от центрове за данни, че я е построил за уеб търсения, вече може да бъде, когато завързани заедно, най-голямата в света компютър. Google използва тази машина, за да разширят границите на превод технология. Миналия месец, например, той заяви, че е работил да комбинира своите инструмент за превод с анализ на изображението, което позволява на човек, да речем, да вземе мобилния телефон снимка на меню на немски език и да получите моментален превод на английски език.
"Машинния превод е един от най-добрите примери, които показват, стратегическа визия на Google", казва Тим О'Райли, основател и главен изпълнителен директор на технологията издателство O'Reilly Media. "Това не е нещо, че някой друг е много сериозно. Но Google разбира нещо за данни, които никой друг не разбира и е готов да направи инвестициите, необходими за справяне с тези видове сложни проблеми, които предстоят на пазара. "
Създаване на машинен превод отдавна се разглежда като един от най-трудните предизвикателства в изкуствения интелект. В продължение на десетилетия, компютърни учени се опитват с помощта на основан на правила подход - преподаване на компютъра на езиковите правила на два езика и като необходимите речници.
Но в средата на 1990-те години, изследователите започнаха да благоприятства т.нар. Статистически подход. Те открили, че ако те хранят компютърни хиляди или милиони на пасажи и техните човешки генерирани преводи, тя може да се научат да правят точни предположения за това как да се преведат нови текстове.
Оказва се, че тази техника, която изисква огромни количества данни и много изчислителни конски сили, е точно до алеята на Google.
"Нашата инфраструктура е много подходящ за това", каза Вик Gundotra, вицепрезидент за инженеринг в Google. "Ние можем да се подходи, които другите не могат дори да мечтаят."
Автоматизирани системи за превод са далеч от перфектен, и дори Google няма да постави човешките преводачи на работа в скоро време. Експертите казват, че е изключително трудно за компютъра, за да се разчупи изречение на части, а след това превежда и да ги сглоби.
Но услугата на Google е достатъчно добър, за да изрази същността на новини статия, и тя се превърна в бърз източник за преводи за милиони хора. "Ако имате нужда от груб и готов за превод, това е мястото да отида", каза Филип Resnik, машинен превод, експерт и асоцииран професор по лингвистика в университета на Мериленд, Колидж Парк.
Подобно на своите конкуренти в областта, най-вече Microsoft и IBM, Google хранят превод на двигателя с преписи на производство на Организацията на обединените нации, които са преведени от човека на шест езика, както и тези на Европейския парламент, които са преведени на 23. Тази суровина се използва за обучение на системи за най-разпространените езици.
Но Google е изварени текста на Web, както и данни от проект за сканиране на книгата и други източници, за да се придвижим отвъд тези езици. За по-неизвестни езици, той е освободен "комплект с инструменти", която помага на потребителите с преводите и след това добавя тези текстове до своята база данни.
Предлагане на Google може да доведе до пробив в продажбите на корпоративен софтуер за превод от компании като IBM, Но автоматизиран превод никога не е вероятно да бъде голям сметкаджия, поне не по стандартите на рекламния бизнес на Google. Все пак, усилията на Google може да плати по няколко начина.
Тъй като рекламите на Google, са навсякъде онлайн, всичко, което го прави по-лесно на хората да използват уеб предимствата на компанията. А системата може да доведе до интересни нови приложения. Миналата седмица, компанията заяви, че ще използва речта признаване, за генериране на надписи за английски език видео YouTube, която може след това да бъдат преведени на 50 други езика.
"Тази технология може да направи езиковата бариера си отиде", каза Франц OCH, главен учен в Google, който ръководи екипа за превод на машината на компанията. "Това ще позволи на никого да комуникира с някой друг."
Г-н OCH, немски изследовател, който преди това е работил в Университета на Южна Калифорния, каза, че първоначално е не желаят да се присъединят към Google, страхувайки се, че ще третира превода като страничен проект. Според Лари Пейдж, основател на Google, наречена за да го успокои.
"Основно Той каза, че това е нещо, което е много важно за Google," г-н OCH припомни наскоро. Г-н OCH подписан през 2004 г. и скоро може да сложи обещание на г-н страницата на тест.
Въпреки че много системи за превод, като на Google се използват до един милиард думи на текста, за да се създаде модел на езика, Google отива много по-голям: няколко стотин милиарда английски думи. "Моделите стават по-добри и по-добре повече текст, който обработваме", каза г-н OCH.
Усилие се изплаща. Една година по-късно, Google печели правителството конкуренция, която тества сложни системи за превод.
Google е използвала подобен подход - огромна изчислителна мощ, купищата данни и статистика - за справяне с други сложни проблеми. През 2007 г. например, тя започна да предлага 800-GOOG-411, безплатна услуга директория помощ, която интерпретира говори искания. Тя позволява на Google да събира гласовете на милиони хора, така че да получите по-добро признаване говоримо английски език.
Една година по-късно, Google пусна търсене по гласова система, която е толкова добър, колкото тези, че други години фирми, за да се изгради.
И в края на миналата година, Google въвежда услуга, наречена очила, който анализира телефони снимки, да ги съвпадение с база данни на повече от един милиард онлайн изображения, включително снимки на улици, взети за Улица Преглед услуга.
Г-н OCH призна, че система за превод на Google все още е необходимо подобрение, но той заяви, че е все по-добре бързо. "Кривата на подобряване на качеството все още е доста стръмен," каза той.
Оригиналната статия ...