News article przedrukowany z The New York Times.
W spotkaniu w Google w 2004 roku, dyskusji zwrócił się do wiadomości e-mail, że firma otrzymała od fana w Korei Południowej. Sergey Brin, twórcy Google, prowadził wiadomości przez usługę automatycznego tłumaczenia, że spółka miała licencję.
Komunikat że Google był ulubioną wyszukiwarkę, ale wynik otrzymuje brzmienie: "plasterki surowej ryby buty chce. Google cebula co zielone! "
Pan powiedział Brin Google powinien być w stanie to zrobić lepiej. Sześć lat później, jego swobodny Google Translate usługa obsługuje 52 języków, więcej niż jakikolwiek podobny system, a ludzie korzystają setki milionów razy w tygodniu do tłumaczenia stron internetowych i inne teksty.
"To co widzisz na Google Translate jest stan techniki" w tłumaczeniu komputera, które nie są ograniczone do danego obszaru tematycznego, powiedział Alon Lavie, profesor badawczy w Instytucie Języka Technologies w Carnegie Mellon University.
Google zmierzające do rozwoju poza przeszukiwanie Internetu spotkały się z mieszanym powodzeniem. Jego projekt cyfrowych książek został zawieszony w sądzie, a wprowadzenie jej sieci społecznych,, Buzz zaniepokojenie, prywatności. Wzór sugeruje, że może czasami fałszywy krok, gdy próbuje się wyzwanie tradycji biznesowych i kulturowych.
Ale szybki wzrost Google na górę sferach działalności tłumaczenie jest przypomnieniem tego, co może się zdarzyć, gdy Google zaprezentował brute-force mocy obliczeniowej na złożone problemy.
Sieci centrów danych, które myślą o wyszukiwanie w sieci, może być teraz, gdy przymocowane razem, największego na świecie komputera. Google korzysta z tego komputera, aby skłonić ograniczenia technologii tłumaczenia. W ubiegłym miesiącu, na przykład, to powiedział, że pracuje nad połączyć swoje narzędzie do tłumaczenia z analizą obrazu, dzięki czemu osoba, powiedzmy, wziąć telefon zdjęcie menu w języku niemieckim i uzyskać natychmiastowe tłumaczenie na angielski.
"Tłumaczenie maszynowe jest jednym z najlepszych przykładów, który pokazuje strategicznej wizji Google", powiedział Tim O'Reilly, założyciel i prezes wydawnictwa technologicznego O'Reilly Media. "To nie jest coś, że ktoś poważnie traktuje to. Ale Google rozumie coś o danych, które nikt inny nie rozumie, i jest skłonny do inwestycji niezbędnych do walki z tego rodzaju złożonych problemów przed rynku. "
Tworzenie tłumaczenia maszynowego długo był uważany za jeden z najtrudniejszych wyzwań w dziedzinie sztucznej inteligencji. Przez dziesiątki lat naukowcy próbowali za pomocą komputera oparty na zasadach podejście - nauczanie komputera reguł językowych dwóch języków i nadanie jej niezbędnych słowników.
Ale w połowie lat 1990, naukowcy zaczęli sprzyjanie tzw statystycznych. Okazało się, że jeśli karmione tysięcy komputera lub miliony fragmentów i ich ludzkich generowane tłumaczenia, może nauczyć się dokładnego zgadywania, jak przetłumaczyć nowych tekstów.
Okazuje się, że ta technika, która wymaga ogromnych ilości danych i dużo mocy obliczeniowej, jest prawo do alei Google.
"Nasza infrastruktura jest bardzo dobrze nadaje się do tego," Vic Gundotra, wiceprezes ds. inżynierii w Google, powiedział. "Możemy podejść że inni nie mogą nawet marzyć."
Zautomatyzowane systemy tłumaczenia są dalekie od doskonałości, a nawet Google nie zniosą człowieka tłumaczy się z pracy w najbliższym czasie. Eksperci twierdzą, że niezmiernie trudno jest dla komputera do złamania zdanie na części, a następnie przetłumaczyć i złożyć im.
Ale usługa Google jest wystarczająco dobre, aby przekazać istotę artykułu, i stało się szybkie źródło tłumaczenia dla milionów ludzi. "Jeśli potrzebujesz spartański tłumaczenie, to miejsce, aby przejść", powiedział Philip Resnik, ekspert w dziedzinie tłumaczenia maszynowego i profesor lingwistyki na University of Maryland, College Park.
Podobnie jak jego rywale w dziedzinie, w szczególności Microsoft i IBM, Google ma dość jego silnik tłumaczenia zapisy ONZ postępowania, które są tłumaczone przez ludzi w sześciu językach, i tych, Parlamentu Europejskiego, które są tłumaczone na 23. Surowiec ten jest wykorzystywany do szkolenia systemy do najważniejszych językach.
Ale Google ma odtłuszczone tekst Web, jak również dane z projektu skanowania książek i innych źródeł, wyjść poza te języki. Dla bardziej niejasne językach, wydała "zestaw narzędzi", które pomaga użytkownikom z tłumaczeniami, a następnie dodaje te teksty do jego bazy danych.
Oferuje Google mogłoby stanowić wyłom w sprzedaży oprogramowania korporacyjnego tłumaczenie takich firm jak IBM Ale tłumaczenie automatyczne nigdy nie może być duży moneymaker, przynajmniej nie na standardy branży reklamowej Google. Mimo to, Google wysiłki mogą opłacać na kilka sposobów.
Ponieważ Google reklamy są wszechobecne online, niczego, co ułatwia ludzi do korzystania z zalet sieci firmy. I system może prowadzić do interesujących nowych aplikacji. W ubiegłym tygodniu firma zapowiedziała, że korzystać z rozpoznawania mowy do generowania podpisów w języku angielskim filmów z YouTube, które mogłyby być tłumaczone na 50 innych języków.
"Ta technologia może sprawić, że bariera językowa odejść," powiedział Franz Och, główny naukowiec w Google, który prowadzi firmę zespół tłumaczenia maszynowego. "Pozwoliłoby to ktoś do komunikowania się z kimś innym."
Pan Och, niemiecki badacz, który wcześniej pracował w University of Southern California, powiedział, że początkowo niechętna przystąpieniu do Google, obawiając się, że tłumaczenie traktować jako side project. Larry Page, założyciel innymi Google, o nazwie uspokoić go.
"On po prostu powiedział, że jest to coś, co jest bardzo ważne dla Google," Pan Och przypomniał niedawno. Pan Och podpisana w 2004 r. i wkrótce stanie umieścić Strona Pan obietnicy testu.
Podczas gdy wiele systemów tłumaczenia jak Google użyć do miliardy słów tekstu, aby stworzyć model języka, Google poszedł znacznie większe: kilka setek miliardów angielskie słowa. "Modele się coraz lepiej im więcej tekstu, proces" Pan Och powiedział.
Wysiłek się opłacił. Rok później, Google wygrał rządowego konkurencji, że testy zaawansowanych systemów tłumaczenia.
Google wykorzystuje podobne podejście - ogromną moc obliczeniową, stosy danych i statystyk - do rozwiązywania innych złożonych problemów. W 2007 roku, na przykład, że zaczęła oferować 800-GOOG-411, bezpłatną usługę pomocy katalogu, który interpretuje wypowiedziane życzenia. Pozwoliło to Google zbierać głosy milionów ludzi, więc może lepiej na uznając mówionego języka angielskiego.
W rok później Google wydało search-by-głos system, który został tak dobre jak te, które miały inne firmy lat na budowę.
A pod koniec ubiegłego roku, firma Google wprowadziła usługę o nazwie Gogle, który analizuje telefon zdjęcia, dopasowując je do bazy danych ponad miliard obrazki on-line, w tym zdjęcia ulic podjętych w celu ich usługi Street View.
Pan Och przyznał, że w systemie Google tłumaczenie nadal potrzebne poprawy, ale on powiedział, że coraz lepiej szybko. "Obecny krzywej poprawy jakości jest nadal dość strome," powiedział.
Artykuł oryginalny ...