נייַעס אַרטיקל איבערגעדרוקט פון די New York Times צייַטונג.
אין אַ זיצונג בייַ Google אין 2004, די דיסקוסיע געקערט צו אַ E-פּאָסט בריוול די פירמע האט באקומען פון אַ פאָכער אין דרום קארעע. סערגיי ברין, אַ Google גרינדער, געלאפן דער אָנזאָג דורך אַ אָטאַמאַטיק איבערזעצונג דינען אַז די פירמע האט לייסאַנסט.
דער אָנזאָג געזאגט Google געווען אַ באַליבט זוכן מאָטאָר, אָבער דער רעזולטאַט לייענען: "די סלייסט רוי פיש שיכלעך עס וויל. Google גרין ציבעלע זאַך! "
הער ברין געזאגט Google דארף צו קענען צו טאָן בעסער. זעקס יאר שפּעטער, זייַן פּאָטער Google זעץ דינען כאַנדאַלז 52 שפּראַכן, מער ווי קיין ענלעך סיסטעם, און מען נוצן עס הונדערטער פון מיליאַנז פון מאל אַ וואָך צו איבערזעצן וועב זייַטלעך און אנדערע טעקסט.
"וואָס איר זען אויף Google זעץ איז שטאַט פון די קונסט" אין קאָמפּיוטער איבערזעצונגען וואס זיינען נישט באגרענעצט צו אַ באַזונדער ונטערטעניק געגנט, האט אַלאָן לאַווי, אַ מיטאַרבעטער פאָרשונג פּראָפעסאָר אין די שפּראַך טעטשנאָלאָגיעס אינסטיטוט בייַ קאַרנאַגי מעלאַן אוניווערסיטעט.
Google ס השתדלות צו יקספּאַנד ווייַטער פון שאַרף די וועב האָבן באגעגנט מיט געמישט הצלחה. זייַן דיגיטאַל ספרים פּרויעקט איז געהאנגען אַרויף אין הויף, און די הקדמה פון זייַן געזעלשאַפטלעך נעץ, באַז, אויפשטיין פּריוואַטקייט פירז. דער מוסטער סאַגדזשעסץ אַז עס קענען מאל מיססטעפּ ווען עס פרוווט צו אַרויסרופן געשעפט טראדיציעס און קולטור קאַנווענשאַנז.
אבער Google ס שנעל העכערונג צו די שפּיץ עשאַלאַנז פון דער איבערזעצונג געשעפט איז אַ דערמאָנונג פון וואָס קענען פּאַסירן ווען Google אַנלישיז זייַן ברוט-קראַפט קאַמפּיוטינג מאַכט אויף קאָמפּלעקס פּראָבלעמס.
די נעץ פון דאַטן סענטערס אַז עס געבויט פֿאַר וועב אָנפֿרעגן קען איצט זיין, ווען לאַשט צוזאַמען, די וועלט ס גרעסטן קאָמפּיוטער. Google איז ניצן אַז מאַשין צו שטופּן די לימאַץ אויף איבערזעצונג טעכנאָלאָגיע. לעצטע חודש, פֿאַר משל, עס האט עס איז ארבעטן צו פאַרבינדן זייַן איבערזעצונג געצייַג מיט בילד אַנאַליסיס, אַלאַוינג אַ מענטש צו, זאָגן, נעמען אַ סעלפאָון פאָטאָ פון אַ מעניו אין דייַטש און באַקומען אַ רעגע ענגליש איבערזעצונג.
"מאַשין איבערזעצונג איז איינער פון די בעסטער ביישפילן וואס ווייזט Google ס סטראַטידזשיק זעאונג," האט טים אָוריילי, גרינדער און ראָש יגזעקיאַטיוו פון דער טעכנאָלאָגיע אַרויסגעבער אָוריילי מעדיאַ. "עס איז ניט עפּעס אַז ווער עס יז אַנדערש איז גענומען זייער עמעס. אבער Google פארשטייט עפּעס וועגן דאַטע אַז קיינער אַנדערש פארשטייט, און עס איז גרייט צו מאַכן דעם ינוועסטמאַנץ נייטיק צו מאַכנ זיך די מינים פון קאָמפּלעקס פּראָבלעמס פאָרויס פון דער מאַרק. "
שאפן אַ איבערזעצונג מאַשין האט לאַנג שוין געזען ווי איינער פון די טאַפאַסט טשאַלאַנדזשיז אין קינסטלעך סייכל. פֿאַר דעקאַדעס, קאָמפּיוטער סייאַנטיס געפרואווט ניצן אַ כּללים-באזירט צוגאַנג - לערערייַ די קאָמפּיוטער די לינגגוויסטיק כּללים פון צוויי שפּראַכן און געבן עס די נייטיק דיקשאַנעריז.
אבער אין דער מיטן 1990ס, ריסערטשערז אנגעהויבן פייווערינג אַ אַזוי גערופענע סטאַטיסטיש צוגאַנג. זיי געפינען אַז אויב זיי פאסטעכער די קאָמפּיוטער טויזנטער אָדער מיליאַנז פון פּאַסאַדזשאַז און זייער מענטשלעך-דזשענערייטאַד איבערזעצונגען, עס קען לערן צו מאַכן פּינטלעך געסאַז וועגן ווי צו איבערזעצן נייַ טעקסץ.
עס טורנס אויס אַז דעם טעכניק, וואָס ריקווייערז ריזיק אַמאַונץ פון דאַטע און גורל פון קאַמפּיוטינג כאָרספּאַוער, איז רעכט אַרויף Google ס אַלייע.
"אונדזער ינפראַסטראַקטשער איז זייער געזונט-סוטאַד צו דעם," וויק גונדאָטראַ, אַ וויצע פּרעזידענט פֿאַר ינזשעניעריע בייַ Google, געזאגט. "מיר קענען נעמען אַפּראָוטשיז אַז אנדערע קענען נישט אפילו חלום פון."
אַוטאָמאַטעד איבערזעצונג סיסטעמס זענען ווייַט פון גאנץ, און אפילו Google ס וועט נישט שטעלן מענטשלעך טראַנסלייטערז אויס פון אַ שטעלע עניטיים באַלד. עקספּערץ זאָגן עס איז יקסידינגלי שווער פֿאַר אַ קאָמפּיוטער צו ברעכן אַ זאַץ אין פּאַרץ, דעמאָלט איבערזעצן און ריאַסעמבאַל זיי.
אבער Google ס דינסט איז גוט גענוג צו קאַנוויי די עסאַנס פון אַ נייַעס אַרטיקל, און עס האט ווערן אַ שנעל מקור פֿאַר איבערזעצונגען פֿאַר מיליאַנז פון מענטשן. "אויב איר דאַרפֿן אַ פּראָסט, און-גרייט איבערזעצונג, עס ס דער אָרט צו גיין," האט פיליפוס רעסניק, אַ מאַשין איבערזעצונג מומחה און מיטאַרבעטער פּראָפעסאָר פון לינגגוויסטיקס בייַ דעם אוניווערסיטעט פון מאַרילאַנד, קאַלידזש פּאַרק.
ווי זייַן רייוואַלז אין דעם פעלד, רובֿ נאָוטאַבלי מיקראָסאָפט און יבם, Google האט פאסטעכער זייַן איבערזעצונג מאָטאָר מיט טראַנסקריפּץ פון אמעריקאנער נאַטיאָנס פאַרהאַנדלונג, וואָס זענען איבערגעזעצט דורך כיומאַנז אין זעקס שפּראַכן, און די פון דער אייראפעישער פּאַרליאַמענט, וואָס זענען איבערגעזעצט אין 23. דעם רוי מאַטעריאַל איז געניצט צו באַן סיסטעמס פֿאַר די מערסט פּראָסט שפּראַכן.
אבער Google האט סקאַוערד די טעקסט פון די וועב, ווי ווויל ווי דאַטע פון זייַן בוך סקאַנינג פּרויעקט און אנדערע קוואלן, צו רירן ווייַטער פון די שפּראַכן. פֿאַר מער דיק שפּראַכן, עס האט באפרייט אַ "געצייַג ינווענטאַר" אַז העלפט ניצערס מיט איבערזעצונגען און דעמאָלט מוסיף יענע טעקסץ צו זייַן דייטאַבייס.
Google ס קרבן געקענט לייגן אַ קאַרב אין פארקויפונג פון פֿירמע איבערזעצונג סאָפטווער פון קאָמפּאַניעס ווי יבם אבער אָטאַמייטיד איבערזעצונג איז קיינמאָל מסתּמא צו זיין אַ גרויס מאַנימייקער, לפּחות ניט דורך דעם סטאַנדאַרדס פון Google ס גאַנצע געשעפט. נאָך, Google ס השתדלות קען צאָלן אַוועק אין עטלעכע וועגן.
ווייַל Google ס אַדס זענען ומעטומיק אָנליין, עפּעס וואס מאכט עס גרינגער פֿאַר מענטשן צו נוצן דעם וועב בענעפיץ די פירמע. און דער סיסטעם קען פירן צו טשיקאַווע נייַ אַפּלאַקיישאַנז. לעצטע וואָך, די פירמע האט עס וואָלט נוצן רעדע דערקענונג צו דזשענערייט קאַפּשאַנז פֿאַר ענגליש, לשון יאָוטובע ווידיאס, וואָס קען דעמאָלט זיין איבערגעזעצט אין 50 אנדערע שפּראַכן.
"דאס טעכנאָלאָגיע קענען מאַכן די שפּראַך שלאַבאַן גיין אַוועק," האט פראַנז אָטש, אַ הויפּט געלערנטער בייַ Google וואס פירט די געסט ס מאַשין איבערזעצונג קאָלעקטיוו. "עס וואָלט לאָזן ווער עס יז צו יבערגעבן מיט ווער עס יז אַנדערש."
הער אָטש, אַ דייַטש פאָרשער וואס ביז אַהער געארבעט בייַ דער אוניווערסיטעט פון סאָוטהערן קאַליפאָרניאַ, האט ער איז געווען טכילעס רילאַקטאַנט צו פאַרבינדן Google, מורא עס וואָלט מייַכל איבערזעצונג ווי אַ זייַט פּרויעקט. לערי Page, Google ס אנדערע גרינדער, גערופן צו ווידער פאַרזיכערן אים.
"ער בייסיקלי געזאגט אַז דעם איז עפּעס וואס איז זייער וויכטיק פֿאַר Google," הער אָטש ריקאָלד לעצטנס. הער אָטש געחתמעט אויף אין 2004 און איז באַלד קענען צו לייגן הער Page ס צוזאָג צו די פּראָבע.
בשעת פילע איבערזעצונג סיסטעמס ווי Google ס נוצן אַרויף צו אַ ביליאָן ווערטער פון טעקסט צו שאַפֿן אַ מאָדעל פון אַ שפּראַך, Google זענען פיל ביגער: אַ ביסל 100000000000 ענגליש ווערטער. "די מאָדעלס ווערן בעסער און בעסער די מער טעקסט איר פּראָצעס," הער אָטש געזאגט.
די מי באַצאָלט אַוועק. א יאָר שפּעטער, Google וואַן אַ רעגירונג-לויפן פאַרמעסט אַז טעסץ סאַפיסטאַקייטיד איבערזעצונג סיסטעמס.
Google האט געוויינט אַ ענלעך צוגאַנג - גוואַלדיק קאַמפּיוטינג מאַכט, הויפנס פון דאַטע און סטאַטיסטיק - צו מאַכנ זיך אנדערע קאָמפּלעקס פּראָבלעמס. אין 2007, פֿאַר משל, עס אנגעהויבן קרבן 800-גאָאָג-411, אַ פֿרייַ וועגווייַזער הילף דינען אַז ינטערפּראַץ גערעדט ריקוועס. עס געלאזט Google צו זאַמלען די קולות פון מיליאַנז פון מענטשן אַזוי עס קען באַקומען בעסער בייַ רעקאַגנייזינג גערעדט ענגליש.
א יאָר שפּעטער, Google באפרייט אַ זוכן-דורך-קול סיסטעם אַז איז ווי גוט ווי יענע וואס האבן אנדערע קאָמפּאַניעס יאָרן צו בויען.
און שפּעט לעצט יאָר, Google באַקענענ אַ דינסט גערופן גאָגגלעס אַז אַנאַליזעס סעלפאָון פאָטאָס, וואָס ריכטן זיך זיי צו אַ דייטאַבייס פון מער ווי אַ ביליאָן אָנליין בילדער, אַרייַנגערעכנט פאָטאָס פון גאסן גענומען פֿאַר זייַן סטריט View דינסט.
הער אָטש יקנאַלידזשד אַז Google ס איבערזעצונג סיסטעם נאָך דארף פֿאַרבעסערונג, אָבער ער האט עס איז געטינג בעסער שנעל. "די קראַנט קוואַליטעט פֿאַרבעסערונג ויסבייג איז נאָך שיין אַראָפאַנג," ער געזאגט.
אָריגינעל אַרטיקל ...