Новости Статья перепечатана из нью-йоркской газете Times.
На встрече в Google в 2004 году, дискуссия превратилась в сообщение электронной почты, компания получила от вентилятора в Южной Корее. Сергей Брин, основатель Google, побежал сообщение через службу автоматического перевода, что компания лицензирована.
Говорится в сообщении Google был любимый поисковик, но результат следующего содержания: "нарезанный сырой рыбы обувь своему усмотрению. Google зеленый лук вещь! "
Г-н Брин говорит Google должны быть в состоянии сделать лучше. Шесть лет спустя, его свободное Google Translate служба обрабатывает 52 языках, больше чем любая подобная система, и люди используют его сотни миллионов раз в неделю для перевода веб-страниц и другого текста.
"То, что вы видите на Google Translate является состояние искусства» в компьютерных переводов, которые не ограничиваются областью конкретной темы, говорит Алон Лави, доцент исследования в Институте языка технологий Университета Карнеги-Меллона.
Усилия Google по расширению за пределы поиска веб встретились с переменным успехом. Его проект цифрового книг была повесил в суде, а введение его социальной сети, Buzz, поднял конфиденциальности страхи. Картина позволяет предположить, что это может иногда оплошности, когда он пытается оспорить бизнеса традиций и культурных конвенций.
Но быстрый рост компании Google в высших эшелонах перевод бизнеса является напоминанием того, что может произойти, когда Google выпустила свою грубой силы вычислительной мощности по сложным проблемам.
Сеть центров обработки данных, что построил для веб-поиска может теперь быть, когда обрушился вместе, крупнейший в мире компьютер. Google использует эту машину, чтобы отодвинуть границы на технологии перевода. В прошлом месяце, например, он сказал, что это рабочее совместить его перевод инструмент анализа изображений, что позволяет человеку, скажем, взять сотовый телефон фото из меню на немецком языке и получить мгновенный английским переводом.
"Машинный перевод является одним из лучших примеров, который показывает стратегическое видение компании Google", сказал Тим О'Рейли, основатель и исполнительный директор технологии издателя O'Reilly Media. "Это не то, что кто-либо принимает всерьез. Но Google понимает кое-что о данных, которые больше никто не понимает, и он готов сделать инвестиции, необходимые для решения такого рода сложные проблемы впереди рынка ".
Создание машинного перевода уже давно рассматривается как один из самых сложных задач в области искусственного интеллекта. На протяжении десятилетий ученые-компьютерщики попытался с помощью основанной на правилах подход - обучение компьютера лингвистические правила двух языков и придания ей необходимых словарей.
Но в середине 1990-х годов исследователи начали в пользу так называемого статистического подхода. Они обнаружили, что если они кормят компьютере тысячи или миллионы проходов и их человеческого генерируемых переводы, он может научиться делать точные предположения о том, как перевести новые тексты.
Оказывается, что эта техника, которая требует огромных объемов данных и большим количеством вычислительной мощности, является правильным аллее Google.
"Наша инфраструктура очень хорошо подходит к этому," Вик Гандотра, вице-президент по инженерии Google, говорит. "Мы можем взять подходы, которые другие не могут даже мечтать."
Автоматизированные системы перевода далеки от совершенства, и даже Google не поставит человека переводчиков без работы в ближайшее время. Эксперты говорят, что это чрезвычайно трудно для компьютера разбить предложение на части, затем перевести и собрать их.
Но службы Google, достаточно хорош, чтобы передать суть новости, статьи, и она стала быстро источником переводы для миллионов людей. "Если вам нужно грубо-и-готовый перевод, это место, чтобы пойти", сказал Филипп Резник, эксперт машинного перевода и адъюнкт-профессор лингвистики в Университете штата Мэриленд, Колледж Парк.
Как и его конкуренты в области, в первую очередь Microsoft и IBM, Google накормил его перевод двигателя с стенограммы Организации Объединенных Наций разбирательства, которые переводятся людьми на шесть языков, а те, Европейского парламента, которые переведены на 23. Это сырье используется для обучения системы для наиболее распространенных языков.
Но Google уже рыскали текст в Интернете, а также данные из своей книги проекта сканирования и других источников, выйти за рамки этих языков. Для более неясными языках, она выпустила «инструментарий», который помогает пользователям с переводами, а затем добавляет эти тексты в базу данных.
Предлагают компании Google может поставить брешь в продаже корпоративного программного обеспечения перевода таких компаний, как IBM Но автоматический перевод никогда не может быть большой прибыльное дело, по крайней мере по меркам рекламного бизнеса Google. Тем не менее, усилия Google, может окупиться в нескольких направлениях.
Потому что объявления Google, повсеместно в сети, все, что делает его легче для людей, чтобы использовать преимущества веб компании. И система может привести к интересным новым приложениям. На прошлой неделе компания заявила, что будет использовать распознавание речи для генерации подписи для английского языка видео YouTube, которые затем могли бы быть переведены на 50 других языках.
"Эта технология может сделать языковой барьер уйти", сказал Франц Оч, главный ученый Google возглавляющий машинного перевода компании команде. "Это позволило бы кто-нибудь общаться с кем-либо еще".
Г-н Ох, немецкий исследователь, который ранее работал в Университете Южной Калифорнии, сказал, что он сначала неохотно присоединиться к Google, опасаясь, что будет рассматривать перевод как сайд-проект. Ларри Пейдж, другой основатель Google, назвал его успокоить.
"Он в основном говорил, что это то, что очень важно для Google", г-н Och напомнил недавно. Г-н Och подписан в 2004 году и вскоре был в состоянии поставить обещание г-на Пейджа на испытания.
Хотя многие системы переводов, как Google, используют до миллиарда словами текст, чтобы создать модель языка, Google пошел гораздо больше: несколько сто млрд английских слов. "Модели становятся все лучше и лучше, чем больше текста, процесс", г-н Och сказал.
Усилия окупились. Год спустя, Google выиграл в ведении государства конкуренции, что тесты сложные системы перевода.
Google использует аналогичный подход - огромная вычислительная мощность, кучи данных и статистика - для решения других сложных проблем. В 2007 году, например, он начал предлагать 800-GOOG-411, бесплатный сервис помощи каталога, который интерпретирует говорил запросов. Это позволило Google собирать голоса миллионов людей, поэтому он может лучше на признание разговорного английского языка.
Через год, Google выпустил поиска по голосовой системы, которая была так хорошо, как те, которые имели другие годы компании, чтобы построить.
И в конце прошлого года компания Google представила сервис под названием очки, которое анализирует фотографии мобильного телефона, соответствие их данных о более чем миллиарда онлайн-изображения, включая фотографии улиц, принятых для его службы Street View.
Г-н Och признал, что системы перевода Google еще нуждается в улучшении, но он сказал, что это все лучше быстро. "Кривой тока улучшения качества все еще довольно крутой," сказал он.
Оригинал статьи ...