บทความข่าวพิมพ์จากใหม่หนังสือพิมพ์นิวยอร์กไทม์

ในการประชุมที่ Google ในปี 2004, การสนทนาหันไปข้อความ e - mail บริษัท ฯ ได้รับจากแฟน ๆ ในเกาหลีใต้ Sergey Brin, ผู้ก่อตั้งของ Google, วิ่งข้อความผ่านบริการแปลภาษาโดยอัตโนมัติว่า บริษัท ได้รับใบอนุญาต

ข้อความที่กล่าวว่า Google เป็นเครื่องมือค้นหาที่ชื่นชอบ แต่ผลที่ได้อ่าน :"หั่นรองเท้าปลาดิบประสงค์ Google สิ่งที่หอม!"

นายบรินกล่าวว่า Google ควรจะสามารถที่จะทำดี หกปีต่อมาฟรีจาก Google บริการของแปลเป็ นภาษา 52 การจัดการมากกว่าระบบที่คล้ายกันใด ๆ และผู้คนที่ใช้งานได้หลายร้อยล้านครั้งต่อสัปดาห์เพื่อแปลหน้าเว็บและข้อความอื่น ๆ

"สิ่งที่คุณเห็นใน Google แปลเป็ นรัฐของศิลปะ"ในการแปลภาษาคอมพิวเตอร์ที่ไม่ถูก จำกัด เรื่องพื้นที่เฉพาะ Alon Lavie, อาจารย์การวิจัยที่เชื่อมโยงในภาษาสถาบันเทคโนโลยีที่ Carnegie Mellon University กล่าวว่า

ความพยายามของ Google เพื่อขยายเกินการค้นหาเว็บได้พบกับความสำเร็จผสม โครงการหนั งสือดิจิตอลที่ได้รับการแขวนขึ้นในศาลและการแนะนำของเครือข่ายทางสังคมของ Buzz, ยกความกลัวความเป็นส่วนตัว รูปแบบที่แสดงให้เห็นว่ามันอาจจะผิดพลาดเมื่อพยายามที่จะท้าทายประเพณีทางธุรกิจและการประชุมทางวัฒนธรรม

แต่เพิ่มขึ้นอย่างรวดเร็วของ Google ที่ echelons ด้านบนสุดของธุรกิจการแปลเป็ นเครื่องเตือนใจในสิ่งที่สามารถเกิดขึ้นได้เมื่อ Google ปลดปล่อยพลังในการคำนวณของเดียรัจฉานบังคับเกี่ยวกับปัญหาที่ซับซ้อน

เครือข่ายของศูนย์ข้อมูลที่สร้างขึ้นสำหรับการค้นหาเว็บตอนนี้อาจจะเมื่อ lashed ร่วมกันคอมพิวเตอร์ที่ใหญ่ที่สุดของโลก Google จะใช้เครื่องที่จะผลักดันข้อ จำกัด เกี่ยวกับเทคโนโลยีการแปล Last month, ตัวอย่างเช่นก็กล่าวว่ามันได้ทำงานในการรวมเครื่องมือแปลกับการวิเคราะห์ภาพที่ช่วยให้บุคคลที่จะกล่าวว่าจะใช้ภาพโทรศัพท์มือถือของเมนูในภาษาเยอรมันและได้รับการแปลเป็ นภาษาอังกฤษทันที

"เครื่องแปลภาษาเป็นหนึ่งในตัวอย่างที่ดีที่สุดที่แสดงให้เห็นถึงวิสัยทัศน์เชิงกลยุทธ์ของ Google"Tim O'Reilly, ผู้ก่อตั้งและผู้บริหารระดับสูงของเทคโนโลยีการเผยแพร่สื่อ O'Reilly กล่าวว่า "มันไม่ใช่สิ่งที่คนอื่นคือการเป็นอย่างมาก แต่ Google มีความเข้าใจในบางสิ่งบางอย่างเกี่ยวกับข้อมูลที่คนอื่นเข้าใจและยินดีที่จะทำการลงทุนที่จำเป็นในการที่จะแก้ไขปัญหาเหล ่านี้ชนิดของปัญหาที่ซับซ้อนไปข้างหน้าของตลาด."

การสร้างเครื่องแปลได้รับการมองว่าเป็นหนึ่งในความท้าทายที่ยากที่สุดในด้านปัญญาประดิษฐ์ สำหรับทศวรรษที่ผ่านมานักวิทยาศาสตร์คอมพิวเตอร์พยายามใช้วิธีการตามกฎ -- การเรียนการสอนคอมพิวเตอร์กฎทางภาษาศาสตร์ของภาษาที่สองและให้มันพจนานุกรมที่จำเป็น

แต่ในกลางปี 1990, นักวิจัยเริ่มนิยมที่เรียกว่าวิธีการทางสถิติ พวกเขาพบว่าหากพวกเขาเลี้ยงหลายพันเครื่องคอมพิวเตอร์หรือล้านของทางเดินและการแปลของมนุษย์ที่สร้างขึ้นของพวกเขาก็สามารถเรียนรู้ที่จะทำให้การคาดเดาที่ถูกต้องเกี่ยวกับวิธีการแปลข้อความใหม่

ปรากฎว่าเทคนิคนี้ซึ่งต้องใช้ข้อมูลจำนวนมากและจำนวนมากของคอมพิวเตอร์แรงม้าเป็นทางขวาขึ้นของ Google ซอย

"โครงสร้างพื้นฐานของเราเป็นอย่างดีเหมาะกับการนี ้"Vic Gundotra รองประธานฝ่ายวิศวกรรมที่ Google กล่าวว่า "เราสามารถใช้วิธีที่คนอื่นไม่สามารถแม้แต่จะฝันของ."

ระบบการแปลอัตโนมัติจะห่างไกลจากที่สมบูรณ์แบบและแม้กระทั่งของ Google จะไม่ทำให้มนุษย์แปลออกจากงานได้ตลอดเวลาเร็ว ๆ นี้ ผู้เชี่ยวชาญกล่าวว่ามันเป็นเรื่องยากเหลือเกินสำหรับคอมพิวเตอร์ที่จะทำลายประโยคเป็นส่วนแล้วแปลและพวกเขารวมกันอีกครั้ง

แต่บริการของ Google ดีพอที่จะถ่ายทอดสาระสำคัญของบทความข่าวและมันได้กลายเป็นแหล่งที่มาอย่างรวดเร็วสำหรับการแปลสำหรับผู้คนนับล้าน "ถ้าคุณจำเป็นต้องมีการแปลเป็ นหยาบและพร้อมที่จะเป็นสถานที่ที่จะไป"ฟิลิป Resnik, ผู้เชี่ยวชาญด้านการแปลภาษาด้วยเครื่องและศาสตราจารย์ด้านภาษาศาสตร์ที่มหาวิทยาลัยแมรี่แลนด์, คอลเลจพาร์คกล่าวว่า

เช่นเดียวกับคู่แข่งในเขตข้อมูลส่วนใหญ่ยวด Microsoft และ IBM, Google มีเครื่องมือการแปลที่เลี้ยงด้วยใบรายงานผลการดำเนินการของสหสหประชาชาติซึ่งมีการแปลโดยมนุษย์เป็นหกภาษาและบรรดาของรัฐสภายุโรปซึ่งมีการแปลเป็ น 23 นี้วัตถุดิบที่จะใช้ในการฝึกอบรมระบบสำหรับภาษาที่พบบ่อยที่สุด

แต่ Google มี scoured ข้อความของเว็บเช่นเดียวกับข้อมูลจากการสแกนของโครงการหนั งสือและแหล่งข้อมูลอื่น ๆ ที่จะย้ายที่อยู่นอกเหนือภาษาเหล่านั้น สำหรับภาษาที่คลุมเครือมากขึ้น แต่ก็มีเปิดตัว"ชุดเครื่องมือ"ที่จะช่วยให้ผู้ใช้ที่มีการแปลแล้วเพิ่มข้อความเหล่านั้นไปยังฐานข้อมูลของ

เสนอของ Google สามารถใส่บุ๋มในการขายของซอฟต์แวร์การแปลขององค์กรจาก บริษัท เช่น IBM แต่การแปลอัตโนมัติจะไม่น่าจะเป็น moneymaker ขนาดใหญ่อย่างน้อยไม่ได้ตามมาตรฐานของธุรกิจโฆษณาของ Google ยังคงความพยายามของ Google อาจจะจ่ายออกในหลายวิธี

เนื่องจากโฆษณาของ Google กำลังออนไลน์แพร่หลายอะไรที่ทำให้มันง่ายสำหรับคนที่จะใช้ประโยชน์ในเว็บ บริษัท และระบบที่อาจนำไปสู่ การใช้งานใหม่ที่น่าสนใจ สัปดาห์ที่แล้วของ บริษัท ดังกล่าวก็จะใช้ speech recognition เพื่อสร้างคำอธิบายสำหรับภาษาอังกฤษวิดีโอ YouTube แล้วซึ่งอาจจะแปลเป็ น 50 ภาษาอื่น ๆ

"เทคโนโลยีนี้สามารถทำให้อุปสรรคทางภาษาไปออกไป"Franz เอมโอช, เป็นนักวิทยาศาสตร์หลักที่ Google ที่นำทีมแปลของ บริษัท ฯ กล่าวว่าเครื่อง "มันจะช่วยให้ทุกคนในการสื่อสารกับคนอื่น."

นายเอมโอชนักวิจัยเยอรมันที่ก่อนหน้านี้ทำงานที่ University of Southern California, กล่าวว่าเขาเริ่มลังเลที่จะเข้าร่วม Google กลัวว่ามันจะรักษาแปลเป็ นโครงการด้าน Larry Page, ผู้ก่อตั้งอื่น ๆ ของ Google ที่เรียกว่าเพื่อสร้างความมั่นใจให้เขา

"เขากล่าวว่าโดยทั่วไปนี้เป็นสิ่งที่มีความสำคัญมากสำหรับ Google"นายเอมโอชเรียก recently นายเอมโอชลงนามเมื่อวันในปี 2004 และได้เร็ว ๆ นี้สามารถที่จะนำสัญญาของนายที่จะทดสอบ

ในขณะที่ระบบการแปลจำนวนมากเช่นของ Google ใช้งานได้ถึงพันล้านคำของข้อความที่จะสร้างรูปแบบของภาษา, Google ก็ใหญ่มาก : เพียงไม่กี่แสนล้านคำในภาษาอังกฤษ "รุ่นที่กลายเป็นดีและดีกว่าข้อความที่คุณดำเนินการมากขึ้น"นายเอมโอชกล่าวว่า

ความพยายามที่จ่ายออก ปีต่อมา Google ได้รับรางวัลการแข่งขันรัฐบาลเรียกว่าการทดสอบระบบการแปลภาษาที่มีความซับซ้อน

Google ได้ใช้วิธีการคล้าย -- กำลังประมวลผลอันยิ่งใหญ่, กองของข้อมูลและสถิติ -- เพื่อรับมือกับปัญหาที่ซับซ้อนอื่น ๆ ในปี 2007 เช่นนั้นเริ่มให้ 800 - GOOG - 411, ไดเรกทอรีที่บริการฟรีให้ความช่วยเหลือที่ตีความการร้องขอการพูด จะอนุญาตให้ Google เพื่อที่จะรวบรวมเสียงของคนหลายล้านคนดังนั้นจึงได้รับดีกว่าที่ตระหนักถึงการพูดภาษาอังกฤษ

ปีต่อมา, Google เปิดตัวระบบการค้นหาโดยใช้เสียงที่ถูกที่ดีเป็นผู้ที่เอาปี บริษัท อื่น ๆ เพื่อสร้าง

และปลายปีที่ Google ได้แนะนำบริการที่เรียกว่าแว่นตาที่ช่วยวิเคราะห์ภาพถ่ายโทรศัพท์มือถือจับคู่พวกเขาไปยังฐานข้อมูลของมากกว่าหนึ่งพันล้านภาพออนไลน์รวมทั้งภาพถ่ายของถนนที่ดำเนินการสำหรับถนนบริการดู

เอมโอชนายได้รับการยอมรับว่าระบบการแปลของ Google จึงยังคงมีการปรับปรุง แต่เขากล่าวว่าได้รับรวดเร็วดีกว่า "เส้นโค้งที่มีคุณภาพในปัจจุบันยังคงมีการปรับปรุงชันสวย"เขากล่าวว่า

... บทความต้นฉบับ