brubros
09-03-10, 18:43
समाचार न्यूयॉर्क टाइम्स अखबार से reprinted लेख.
2004 में गूगल पर एक बैठक में चर्चा कंपनी दक्षिण कोरिया में एक प्रशंसक से प्राप्त किया था एक ई - मेल संदेश में बदल गया. सेर्गेई ब्रिन, एक गूगल के संस्थापक, एक स्वचालित अनुवाद सेवा है कि कंपनी का लाइसेंस था के माध्यम से संदेश भागा.
संदेश ने कहा कि गूगल एक पसंदीदा खोज इंजन था, लेकिन नतीजा पढ़ें: "कटा कच्ची मछली जूते चाहे. Google हरी प्याज बात! "
श्री ब्रिन ने कहा कि गूगल के लिए बेहतर करने में सक्षम होना चाहिए. छह साल बाद, अपने मुफ़्त Google अनुवाद सेवा 52 भाषाओं, किसी भी इसी तरह की प्रणाली की तुलना में अधिक संभालती है, और लोग इसका इस्तेमाल बार एक हफ्ते के लाखों लोगों के सैकड़ों के लिए वेब पेज और अन्य पाठ का अनुवाद.
कंप्यूटर अनुवाद है कि एक विशेष विषय क्षेत्र के लिए सीमित नहीं हैं "क्या आप Google अनुवाद पर देख कला का राज्य है", Alon Lavie, कार्नेगी मेलॉन विश्वविद्यालय में एक भाषा टेक्नोलॉजीज संस्थान में एक सहयोगी अनुसंधान प्रोफेसर ने कहा.
Google वेब खोज से परे विस्तार करने के प्रयासों को मिश्रित सफलता के साथ मुलाकात की है. इसकी डिजिटल किताबें परियोजना अदालत में रख दिया दिया गया है, और अपनी सामाजिक नेटवर्क, बज़, की शुरूआत गोपनीयता भय उठाया. पैटर्न पता चलता है कि यह कभी कभी जब यह व्यापार परंपराओं और सांस्कृतिक सम्मेलनों को चुनौती देने की कोशिश करता है misstep कर सकते हैं.
लेकिन गूगल के अनुवाद में व्यवसाय के शीर्ष नेताओं को जल्दी वृद्धि क्या जब गूगल जटिल समस्याओं पर अपने जानवर बल कंप्यूटिंग शक्ति unleashes हो सकता है की एक अनुस्मारक है.
अब डेटा केंद्रों के नेटवर्क है कि यह वेब खोजों के लिए बनाया हो, जब एक साथ जमकर बरसे, दुनिया का सबसे बड़ा कंप्यूटर हो सकता है. गूगल है कि मशीन का उपयोग कर रहा है अनुवाद प्रौद्योगिकी पर सीमा धक्का. पिछले महीने, उदाहरण के लिए, यह कहा कि यह छवि विश्लेषण के साथ अपनी अनुवाद उपकरण गठबंधन करने के लिए काम कर रहा था, एक व्यक्ति को कहते हैं, जर्मन में एक मेनू के सेलफोन फोटो लेने के लिए और एक पल अंग्रेजी अनुवाद प्राप्त करने की अनुमति.
"मशीन अनुवाद एक सबसे अच्छा उदाहरण है कि Google सामरिक दृष्टि से पता चलता है है," टिम O'Reilly, संस्थापक और प्रौद्योगिकी प्रकाशक O'Reilly मीडिया के मुख्य कार्यकारी ने कहा. "यह कुछ है कि किसी को बहुत गंभीरता से ले रहा है नहीं है. लेकिन गूगल के बारे में डेटा है कि और कोई नहीं समझता कुछ समझता है, और यह जटिल बाजार की आगे की समस्याओं के इन प्रकार से निपटने के लिए आवश्यक निवेश करने को तैयार है. "
अनुवाद मशीन बनाना लंबे समय से कृत्रिम बुद्धि में सबसे कठिन चुनौतियों में से एक के रूप में देखा गया है. कंप्यूटर शिक्षण दो भाषाओं के भाषाई नियमों और यह आवश्यक शब्दकोशों देने है - दशकों के लिए, कंप्यूटर वैज्ञानिकों ने एक नियम आधारित दृष्टिकोण का उपयोग करने की कोशिश की.
लेकिन 1990 के दशक के मध्य में, शोधकर्ताओं ने एक तथाकथित सांख्यिकीय दृष्टिकोण पक्ष शुरू किया. उन्होंने पाया कि अगर वे कंप्यूटर हजारों या लाखों मार्ग और उनके मानव जनित अनुवाद के खिलाया, यह कैसे नए ग्रंथों का अनुवाद करने के लिए के बारे में सटीक अनुमान करना सीख सकता है.
यह पता चला है कि इस तकनीक है, जो डेटा और कंप्यूटिंग अश्वशक्ति के बहुत सारे के भारी मात्रा की आवश्यकता होती है गूगल की गली तक सही है.
"हमारा बुनियादी ढांचा इस के लिए बहुत अच्छी तरह से अनुकूल है" विक Gundotra, इंजीनियरिंग के लिए एक गूगल पर उपाध्यक्ष ने कहा. "हम दृष्टिकोण है कि दूसरों को भी नहीं सपना देख सकते हैं ले जा सकते हैं."
स्वचालित अनुवाद प्रणाली दूर से परिपूर्ण हैं, और भी गूगल मानव अनुवादकों नहीं डाल एक नौकरी से बाहर कभी भी जल्द ही होगा. विशेषज्ञों का कहना है कि यह कंप्यूटर भागों में एक वाक्य को तोड़ने के लिए बेहद मुश्किल है, तो अनुवाद और उन्हें पुनः.
लेकिन Google सेवा है काफी अच्छा समाचार लेख का सार संप्रेषित है, और यह लाखों लोगों के लिए अनुवाद के लिए एक त्वरित स्रोत बन गया है. "यदि आप किसी न किसी और तैयार एक अनुवाद की जरूरत है, यह जाने के लिए जगह है," फिलिप Resnik, एक मशीन अनुवाद विशेषज्ञ और मैरीलैंड विश्वविद्यालय, कॉलेज पार्क में भाषा विज्ञान के एसोसिएट प्रोफेसर ने कहा.
क्षेत्र में अपने प्रतिद्वंद्वियों की तरह, सबसे विशेष रूप से माइक्रोसॉफ्ट और आईबीएम, गूगल, संयुक्त राष्ट्र कार्यवाही का टेप, जो छह भाषाओं में मनुष्य द्वारा अनुवादित कर रहे हैं, और यूरोपीय संसद के उन जो 23 में अनुवाद कर रहे हैं के साथ अपने अनुवाद इंजन खिलाया है. यह कच्चे माल के लिए सबसे आम भाषाओं के लिए सिस्टम को प्रशिक्षित करने के लिए प्रयोग किया जाता है.
लेकिन Google वेब का पाठ घूमते है, के रूप में के रूप में अच्छी तरह से अपनी पुस्तक स्कैनिंग परियोजना और अन्य स्रोतों से डेटा, उन भाषाओं से परे ले जाने. और अधिक अस्पष्ट भाषाओं के लिए, यह एक "टूल किट" है कि अनुवाद के साथ उपयोगकर्ताओं को मदद मिलती है और फिर अपने डेटाबेस के लिए उन ग्रंथों को कहते हैं जारी है.
गूगल की पेशकश आईबीएम लेकिन स्वचालित अनुवाद करने के लिए एक बड़ा धनी है, कम से कम गूगल के विज्ञापन व्यवसाय के मानकों के द्वारा नहीं, कभी नहीं की संभावना है जैसी कंपनियों से कॉर्पोरेट अनुवाद सॉफ्टवेयर के बिक्री में सेंध लगा सकता है. फिर भी, गूगल के प्रयासों से कई मायनों में भुगतान कर सकते हैं.
क्योंकि गूगल के विज्ञापन सर्वव्यापी ऑनलाइन, कुछ भी है कि लोगों को वेब लाभ कंपनी का उपयोग करने के लिए यह आसान बनाता है. प्रणाली दिलचस्प नए अनुप्रयोगों के लिए नेतृत्व सकता है. पिछले हफ्ते, कंपनी ने कहा कि यह वाक् पहचान का उपयोग करने के लिए अंग्रेजी भाषा के यूट्यूब वीडियो है, जो तब 50 अन्य भाषाओं में अनुवादित किया जा सकता है है के लिए कैप्शन उत्पन्न होता है.
"कर सकते हैं, इस तकनीक भाषा बाधा दूर जाना" फ्रांज OCH, गूगल पर एक प्रमुख वैज्ञानिक, जो कंपनी के मशीनी अनुवाद टीम को जाता है ने कहा. "यह किसी को भी किसी और के साथ संवाद करने की अनुमति होगी."
श्री OCH, एक जर्मन शोधकर्ता, जो पहले दक्षिणी कैलिफोर्निया विश्वविद्यालय में काम किया, ने कहा कि वह शुरू में गूगल में शामिल होने के लिए अनिच्छुक था, डर से यह एक पक्ष परियोजना के रूप में अनुवाद का इलाज करेंगे. लैरी पेज, गूगल अन्य संस्थापक, उसे आश्वस्त करने के लिए कहा जाता है.
"वह मूल रूप से कहा कि यह कुछ है कि गूगल के लिए बहुत महत्वपूर्ण है," श्री OCH हाल ही में याद करते हैं. श्री OCH 2004 में हस्ताक्षर किए हैं और जल्द ही श्री पृष्ठ के परीक्षण के लिए वादा डाल करने में सक्षम था.
जबकि गूगल जैसे कई अनुवाद प्रणाली पाठ के लिए एक भाषा का एक मॉडल बनाने के एक अरब शब्दों के उपयोग, गूगल बहुत बड़ा चला गया: कुछ सौ अरब अंग्रेजी शब्दों. "मॉडल बेहतर और अधिक पाठ आप इस प्रक्रिया बेहतर हो" श्री OCH कहा.
प्रयास बंद का भुगतान किया. एक साल बाद, गूगल सरकार चलाने कि परिष्कृत अनुवाद प्रणाली का परीक्षण एक प्रतियोगिता जीता.
विशाल कंप्यूटिंग शक्ति, डेटा और आंकड़ों के ढेर - Google एक समान दृष्टिकोण का उपयोग किया है अन्य जटिल समस्याओं से निपटने. 2007 में, उदाहरण के लिए, यह 800-GOOG-411, एक मुक्त निर्देशिका सहायता सेवा है कि बात अनुरोध की व्याख्या की पेशकश करना शुरू किया. यह गूगल लोगों के लाखों लोगों की आवाज को इकट्ठा करने के लिए तो यह बात अंग्रेजी को पहचानने में बेहतर मिल सकता है की अनुमति दी.
एक साल बाद, गूगल एक प्रणाली खोज द्वारा आवाज है कि के रूप में उन है कि अन्य कंपनियों के साल का निर्माण करने के लिए ले लिया के रूप में अच्छा था जारी किया.
और देर पिछले साल, गूगल एक सेवा चश्में बुलाया है कि सेलफोन तस्वीरों का विश्लेषण शुरू की है, उन्हें एक अरब से अधिक अपनी सड़क दृश्य सेवा के लिए ले जाया सड़कों की तस्वीरें ऑनलाइन छवियों, सहित के एक डेटाबेस के लिए मिलान.
श्री OCH स्वीकार किया कि गूगल अनुवाद प्रणाली अभी भी सुधार की जरूरत है, लेकिन उन्होंने कहा कि यह बेहतर तेजी से हो रही थी. "वर्तमान गुणवत्ता में सुधार वक्र अभी भी बहुत तेजी से," उन्होंने कहा.
मूल लेख ... (Http://www.nytimes.com/2010/03/09/technology/09translate.html?hp)
2004 में गूगल पर एक बैठक में चर्चा कंपनी दक्षिण कोरिया में एक प्रशंसक से प्राप्त किया था एक ई - मेल संदेश में बदल गया. सेर्गेई ब्रिन, एक गूगल के संस्थापक, एक स्वचालित अनुवाद सेवा है कि कंपनी का लाइसेंस था के माध्यम से संदेश भागा.
संदेश ने कहा कि गूगल एक पसंदीदा खोज इंजन था, लेकिन नतीजा पढ़ें: "कटा कच्ची मछली जूते चाहे. Google हरी प्याज बात! "
श्री ब्रिन ने कहा कि गूगल के लिए बेहतर करने में सक्षम होना चाहिए. छह साल बाद, अपने मुफ़्त Google अनुवाद सेवा 52 भाषाओं, किसी भी इसी तरह की प्रणाली की तुलना में अधिक संभालती है, और लोग इसका इस्तेमाल बार एक हफ्ते के लाखों लोगों के सैकड़ों के लिए वेब पेज और अन्य पाठ का अनुवाद.
कंप्यूटर अनुवाद है कि एक विशेष विषय क्षेत्र के लिए सीमित नहीं हैं "क्या आप Google अनुवाद पर देख कला का राज्य है", Alon Lavie, कार्नेगी मेलॉन विश्वविद्यालय में एक भाषा टेक्नोलॉजीज संस्थान में एक सहयोगी अनुसंधान प्रोफेसर ने कहा.
Google वेब खोज से परे विस्तार करने के प्रयासों को मिश्रित सफलता के साथ मुलाकात की है. इसकी डिजिटल किताबें परियोजना अदालत में रख दिया दिया गया है, और अपनी सामाजिक नेटवर्क, बज़, की शुरूआत गोपनीयता भय उठाया. पैटर्न पता चलता है कि यह कभी कभी जब यह व्यापार परंपराओं और सांस्कृतिक सम्मेलनों को चुनौती देने की कोशिश करता है misstep कर सकते हैं.
लेकिन गूगल के अनुवाद में व्यवसाय के शीर्ष नेताओं को जल्दी वृद्धि क्या जब गूगल जटिल समस्याओं पर अपने जानवर बल कंप्यूटिंग शक्ति unleashes हो सकता है की एक अनुस्मारक है.
अब डेटा केंद्रों के नेटवर्क है कि यह वेब खोजों के लिए बनाया हो, जब एक साथ जमकर बरसे, दुनिया का सबसे बड़ा कंप्यूटर हो सकता है. गूगल है कि मशीन का उपयोग कर रहा है अनुवाद प्रौद्योगिकी पर सीमा धक्का. पिछले महीने, उदाहरण के लिए, यह कहा कि यह छवि विश्लेषण के साथ अपनी अनुवाद उपकरण गठबंधन करने के लिए काम कर रहा था, एक व्यक्ति को कहते हैं, जर्मन में एक मेनू के सेलफोन फोटो लेने के लिए और एक पल अंग्रेजी अनुवाद प्राप्त करने की अनुमति.
"मशीन अनुवाद एक सबसे अच्छा उदाहरण है कि Google सामरिक दृष्टि से पता चलता है है," टिम O'Reilly, संस्थापक और प्रौद्योगिकी प्रकाशक O'Reilly मीडिया के मुख्य कार्यकारी ने कहा. "यह कुछ है कि किसी को बहुत गंभीरता से ले रहा है नहीं है. लेकिन गूगल के बारे में डेटा है कि और कोई नहीं समझता कुछ समझता है, और यह जटिल बाजार की आगे की समस्याओं के इन प्रकार से निपटने के लिए आवश्यक निवेश करने को तैयार है. "
अनुवाद मशीन बनाना लंबे समय से कृत्रिम बुद्धि में सबसे कठिन चुनौतियों में से एक के रूप में देखा गया है. कंप्यूटर शिक्षण दो भाषाओं के भाषाई नियमों और यह आवश्यक शब्दकोशों देने है - दशकों के लिए, कंप्यूटर वैज्ञानिकों ने एक नियम आधारित दृष्टिकोण का उपयोग करने की कोशिश की.
लेकिन 1990 के दशक के मध्य में, शोधकर्ताओं ने एक तथाकथित सांख्यिकीय दृष्टिकोण पक्ष शुरू किया. उन्होंने पाया कि अगर वे कंप्यूटर हजारों या लाखों मार्ग और उनके मानव जनित अनुवाद के खिलाया, यह कैसे नए ग्रंथों का अनुवाद करने के लिए के बारे में सटीक अनुमान करना सीख सकता है.
यह पता चला है कि इस तकनीक है, जो डेटा और कंप्यूटिंग अश्वशक्ति के बहुत सारे के भारी मात्रा की आवश्यकता होती है गूगल की गली तक सही है.
"हमारा बुनियादी ढांचा इस के लिए बहुत अच्छी तरह से अनुकूल है" विक Gundotra, इंजीनियरिंग के लिए एक गूगल पर उपाध्यक्ष ने कहा. "हम दृष्टिकोण है कि दूसरों को भी नहीं सपना देख सकते हैं ले जा सकते हैं."
स्वचालित अनुवाद प्रणाली दूर से परिपूर्ण हैं, और भी गूगल मानव अनुवादकों नहीं डाल एक नौकरी से बाहर कभी भी जल्द ही होगा. विशेषज्ञों का कहना है कि यह कंप्यूटर भागों में एक वाक्य को तोड़ने के लिए बेहद मुश्किल है, तो अनुवाद और उन्हें पुनः.
लेकिन Google सेवा है काफी अच्छा समाचार लेख का सार संप्रेषित है, और यह लाखों लोगों के लिए अनुवाद के लिए एक त्वरित स्रोत बन गया है. "यदि आप किसी न किसी और तैयार एक अनुवाद की जरूरत है, यह जाने के लिए जगह है," फिलिप Resnik, एक मशीन अनुवाद विशेषज्ञ और मैरीलैंड विश्वविद्यालय, कॉलेज पार्क में भाषा विज्ञान के एसोसिएट प्रोफेसर ने कहा.
क्षेत्र में अपने प्रतिद्वंद्वियों की तरह, सबसे विशेष रूप से माइक्रोसॉफ्ट और आईबीएम, गूगल, संयुक्त राष्ट्र कार्यवाही का टेप, जो छह भाषाओं में मनुष्य द्वारा अनुवादित कर रहे हैं, और यूरोपीय संसद के उन जो 23 में अनुवाद कर रहे हैं के साथ अपने अनुवाद इंजन खिलाया है. यह कच्चे माल के लिए सबसे आम भाषाओं के लिए सिस्टम को प्रशिक्षित करने के लिए प्रयोग किया जाता है.
लेकिन Google वेब का पाठ घूमते है, के रूप में के रूप में अच्छी तरह से अपनी पुस्तक स्कैनिंग परियोजना और अन्य स्रोतों से डेटा, उन भाषाओं से परे ले जाने. और अधिक अस्पष्ट भाषाओं के लिए, यह एक "टूल किट" है कि अनुवाद के साथ उपयोगकर्ताओं को मदद मिलती है और फिर अपने डेटाबेस के लिए उन ग्रंथों को कहते हैं जारी है.
गूगल की पेशकश आईबीएम लेकिन स्वचालित अनुवाद करने के लिए एक बड़ा धनी है, कम से कम गूगल के विज्ञापन व्यवसाय के मानकों के द्वारा नहीं, कभी नहीं की संभावना है जैसी कंपनियों से कॉर्पोरेट अनुवाद सॉफ्टवेयर के बिक्री में सेंध लगा सकता है. फिर भी, गूगल के प्रयासों से कई मायनों में भुगतान कर सकते हैं.
क्योंकि गूगल के विज्ञापन सर्वव्यापी ऑनलाइन, कुछ भी है कि लोगों को वेब लाभ कंपनी का उपयोग करने के लिए यह आसान बनाता है. प्रणाली दिलचस्प नए अनुप्रयोगों के लिए नेतृत्व सकता है. पिछले हफ्ते, कंपनी ने कहा कि यह वाक् पहचान का उपयोग करने के लिए अंग्रेजी भाषा के यूट्यूब वीडियो है, जो तब 50 अन्य भाषाओं में अनुवादित किया जा सकता है है के लिए कैप्शन उत्पन्न होता है.
"कर सकते हैं, इस तकनीक भाषा बाधा दूर जाना" फ्रांज OCH, गूगल पर एक प्रमुख वैज्ञानिक, जो कंपनी के मशीनी अनुवाद टीम को जाता है ने कहा. "यह किसी को भी किसी और के साथ संवाद करने की अनुमति होगी."
श्री OCH, एक जर्मन शोधकर्ता, जो पहले दक्षिणी कैलिफोर्निया विश्वविद्यालय में काम किया, ने कहा कि वह शुरू में गूगल में शामिल होने के लिए अनिच्छुक था, डर से यह एक पक्ष परियोजना के रूप में अनुवाद का इलाज करेंगे. लैरी पेज, गूगल अन्य संस्थापक, उसे आश्वस्त करने के लिए कहा जाता है.
"वह मूल रूप से कहा कि यह कुछ है कि गूगल के लिए बहुत महत्वपूर्ण है," श्री OCH हाल ही में याद करते हैं. श्री OCH 2004 में हस्ताक्षर किए हैं और जल्द ही श्री पृष्ठ के परीक्षण के लिए वादा डाल करने में सक्षम था.
जबकि गूगल जैसे कई अनुवाद प्रणाली पाठ के लिए एक भाषा का एक मॉडल बनाने के एक अरब शब्दों के उपयोग, गूगल बहुत बड़ा चला गया: कुछ सौ अरब अंग्रेजी शब्दों. "मॉडल बेहतर और अधिक पाठ आप इस प्रक्रिया बेहतर हो" श्री OCH कहा.
प्रयास बंद का भुगतान किया. एक साल बाद, गूगल सरकार चलाने कि परिष्कृत अनुवाद प्रणाली का परीक्षण एक प्रतियोगिता जीता.
विशाल कंप्यूटिंग शक्ति, डेटा और आंकड़ों के ढेर - Google एक समान दृष्टिकोण का उपयोग किया है अन्य जटिल समस्याओं से निपटने. 2007 में, उदाहरण के लिए, यह 800-GOOG-411, एक मुक्त निर्देशिका सहायता सेवा है कि बात अनुरोध की व्याख्या की पेशकश करना शुरू किया. यह गूगल लोगों के लाखों लोगों की आवाज को इकट्ठा करने के लिए तो यह बात अंग्रेजी को पहचानने में बेहतर मिल सकता है की अनुमति दी.
एक साल बाद, गूगल एक प्रणाली खोज द्वारा आवाज है कि के रूप में उन है कि अन्य कंपनियों के साल का निर्माण करने के लिए ले लिया के रूप में अच्छा था जारी किया.
और देर पिछले साल, गूगल एक सेवा चश्में बुलाया है कि सेलफोन तस्वीरों का विश्लेषण शुरू की है, उन्हें एक अरब से अधिक अपनी सड़क दृश्य सेवा के लिए ले जाया सड़कों की तस्वीरें ऑनलाइन छवियों, सहित के एक डेटाबेस के लिए मिलान.
श्री OCH स्वीकार किया कि गूगल अनुवाद प्रणाली अभी भी सुधार की जरूरत है, लेकिन उन्होंने कहा कि यह बेहतर तेजी से हो रही थी. "वर्तमान गुणवत्ता में सुधार वक्र अभी भी बहुत तेजी से," उन्होंने कहा.
मूल लेख ... (Http://www.nytimes.com/2010/03/09/technology/09translate.html?hp)