Článok Novinky sú prevzaté z knihy The New York Times noviny.
Pri stretnutí na Google v roku 2004, diskusie sa obrátil k e-mailovej správy spoločnosti dostal od fanúšika v Južnej Kórei. Sergey Brin, zakladateľ Google, bežal správu cez prekladateľskú službu, ktorá mala spoločnosť licenciu.
Správa hovorí Google je obľúbený vyhľadávač, ale výsledok znie: "plátky surové ryby topánky si praje. Google zelená cibuľka vec! "
Pán Brin povedal, Google by mal byť schopný robiť lepšie. O šesť rokov neskôr, na ich slobodnú Google Translate služba spracováva 52 jazykoch, viac než akýkoľvek podobný systém, a ľudia využiť stovky miliónov týždenne prekladať webové stránky a ďalší text.
"To, čo vidíte na Google Translate, je stav techniky" v počítačovej preklady, ktoré nie sú obmedzené na určitú oblasť, uviedol Alon Lavie, pridruženým profesorom v Ústave jazykovej technológie na Carnegie Mellon University.
Google snahu expandovať vyhľadávania na webe sa stretol so striedavými úspechmi. Jeho digitálny knihy bol projekt zavesil na súde, a zavedenie svoje sociálne siete, Buzz, zvýšila obavy o súkromie. Schéma ukazuje, že to niekedy môže chybný krok, keď sa pokúša napadnúť obchodné tradície a kultúrne konvencie.
Ale Google je rýchly vzostup na najvyšších poschodiach prekladateľstva je pripomienkou toho, čo sa môže stať, keď Google vypustí svoje brute-force výpočtový výkon na zložité problémy.
Sieť dátových centier, ktorá je postavená na webové vyhľadávanie môže byť teraz, keď pripútajú dohromady, najväčší svetový počítač. Google používa, že stroj tlačiť limity na prekladové technológiu. Minulý mesiac sa napríklad, že povedal, že pracuje na preklade spojiť svoje nástroje s analýzou obrazu, umožňujúci osobu, povedzme si mobil fotografie menu v nemčine a získať okamžitý preklad do angličtiny.
"Strojový preklad je jedným z najlepších príkladov ukazuje, že Google je strategickú víziu," povedal Tim O'Reilly, zakladateľ a výkonný riaditeľ techniky Vydavateľ O'Reilly Media. "To nie je niečo, čo niekto berie veľmi vážne. Ale Google rozumie niečo dát, ktoré nikto iný chápe a je ochotný urobiť potrebné investície na riešenie týchto druhov zložitých problémov pred trhom. "
Vytvorenie preklade stroj už dlho považované za jeden z najťažších úloh v oblasti umelej inteligencie. Po desaťročia sa vedci snažili pomocou počítača založeného na pravidlách prístup - výučba počítačových jazykových pravidiel dvoch jazykov, a dávať to treba slovníky.
Ale v polovici 1990, výskumníci začali uprednostňovať tzv štatistický prístup. Zistili, že keď sa kŕmia počítača tisíce alebo milióny ciest a ich ľuďmi vytvorené preklady, mohlo by to naučiť sa robiť presné odhady o tom, ako prekladať nové texty.
Ukazuje sa, že táto technika, ktorá vyžaduje obrovské množstvo dát a mnoho výpočtový výkon, je až uličkou Google.
"Naša infraštruktúra je veľmi dobre hodí k tomu" Vic Gundotra, viceprezident pre inžinierstvo spoločnosti Google, uviedol. "Môžeme si vziať prístupy, ktoré ostatní nemôžu ani vo sne."
Automatický preklad systémy sú ďaleko k dokonalosti, a dokonca aj Google nebude dať ľudského prekladateľa z práce v dohľadnej dobe. Odborníci hovoria, že je mimoriadne ťažké pre počítač rozbiť vetu na časti, potom preložiť a znovu je.
Ale Google so službou je dosť dobré vysvetliť podstatu novinový článok, a to sa stalo rýchly zdroj pre preklady pre milióny ľudí. "Ak potrebujete hrubý preklad, je to miesto, kam ísť," povedal Philip Resnik, strojový preklad expert a profesor lingvistiky na University of Maryland, College Park.
Rovnako ako jeho súperi v tejto oblasti, najmä Microsoft a IBM, Google sa kŕmia jeho preklad motor s prepisy rokovaní Organizácie Spojených národov, ktoré sa premietajú do ľudí do šiestich jazykov, a tie, Európskeho parlamentu, ktoré sú preložené do 23. Táto surovina sa používa na vlaku systémov pre väčšinu bežných jazykov.
Ale Google má prehľadali text na webe, rovnako ako údaje z projektu skenovanie kníh a iných zdrojov, k pohybu za týmito jazykmi. Pre viac temný jazykov, ako sa vydala za "sadu nástrojov", ktorá pomáha používateľom s prekladmi a pridá tie texty k databáze.
Google ponúka mohol dať dieru do predaja firemných prekladový softvér od spoločností ako IBM, ale automatického prekladu nie je nikdy pravdepodobne veľké terno, aspoň nie podľa merítok reklame spoločnosti Google. Napriek tomu sa Google úsilie vyplatí niekoľkými spôsobmi.
Vzhľadom k tomu, Google reklamy sú všadeprítomné online, všetko, čo uľahčuje ľuďom využívať výhody webu spoločnosti. A systém by mohol viesť k novej zaujímavé aplikácie. Minulý týždeň firma uviedla, že použitie rozpoznávania reči na vytvorenie titulkov pre anglické videa YouTube, ktorý by potom mohol byť preložený do 50 cudzích jazykov.
"Táto technológia môže jazyková bariéra preč," povedal Franz Och, vedúci vedec v spoločnosti Google, ktorý vedie spoločnosť strojového prekladu tímu. "Bolo by možné, aby niekto komunikovať s nikým iným."
Pán Och, nemecký bádateľ, ktorý predtým pôsobil na University of Southern California, povedal, že bol spočiatku neochotný vstúpiť Google, sa obávať, že by sa považovať preklad ako vedľajší projekt. Larry Page, zakladateľ Google je iný, nazvaný sa ho upokojiť.
"On v podstate hovorí, že to je niečo, čo je veľmi dôležité pre Google," povedal pán Och spomínal nedávno. Pán Och podpísaná v roku 2004 a bol čoskoro schopný dať pánovi stránky sľub test.
Zatiaľ čo mnoho prekladateľských systémov, ako je Google používať až miliardy slov textu k vytvoreniu modelu jazyka, Google išiel oveľa väčšie: niekoľko sto miliárd anglických slov. "Modely sa lepší a lepší text viac procesov," povedal pán Och.
Snaha sa vyplatila. O rok neskôr získal Google vládou riadenej konkurencie, že testy zložitejšie prekladové systémy.
Google používa podobný prístup - obrovský výpočtový výkon, hromady dát a štatistiky - k riešeniu ďalších zložitých problémov. V roku 2007 sa napríklad, že začala ponúkať 800-GOOG-411, bezplatné telefónne asistencie služba, ktorá interpretuje hovorí požiadavky. To dovolilo Google zbierať hlasy miliónov ľudí, takže by to mohlo dostať lepšie rozpoznávať hovorenej angličtiny.
O rok neskôr, Google vydala hľadať podľa jednotlivých hlasový systém, ktorý bol rovnako dobre ako tie, ktoré sa ostatné podniky rokoch stavať.
A koncom minulého roka, Google predstavil službu s názvom Okuliare, ktorá analyzuje mobil fotografií, ich porovnaním s databázou viac ako miliardu on-line obrázky, fotografie ulíc vziať za svoje služby Street View.
Pán Och uznal, že Google je prekladový systém treba ešte zlepšiť, ale on hovoril, že to bolo stále lepšie rýchlo. "Súčasné zvyšovanie kvality krivka je stále ešte dosť prudký," povedal.
Pôvodný článok ...