Berita artikel yang dicetak semula daripada akhbar The New York Times.
Dalam satu mesyuarat di Google pada tahun 2004, perbincangan beralih kepada mesej e-mel syarikat itu telah diterima daripada peminat di Korea Selatan. Sergey Brin, pengasas Google, berlari mesej melalui perkhidmatan terjemahan automatik bahawa syarikat itu telah dilesenkan.
Mesej berkata Google adalah enjin carian kegemaran, tetapi keputusan itu berbunyi: "ikan dihiris kasut mentah yang ia mahu. Google hijau bawang perkara! "
Encik Brin berkata Google sepatutnya boleh melakukan yang lebih baik. Enam tahun kemudian, Google secara percuma Translate perkhidmatan mengendalikan 52 bahasa, lebih daripada mana-mana sistem yang serupa, dan orang menggunakan beratus-ratus juta kali seminggu untuk menterjemahkan laman web dan teks lain.
"Apa yang anda lihat di Google Translate adalah keadaan seni" dalam terjemahan komputer yang tidak terhad kepada kawasan mata pelajaran tertentu, kata Alon Lavie, profesor penyelidikan bersekutu di Institut Bahasa Technologies di Carnegie Mellon University.
Usaha Google untuk berkembang di luar mencari Web telah bertemu dengan kejayaan bercampur. Projek buku-buku digital yang telah digantung di mahkamah, dan pengenalan rangkaian sosial, Buzz, menaikkan kebimbangan privasi. Corak tersebut telah membuat andaian bahawa ia kadang-kadang boleh membuat kesalahan apabila ia cuba untuk mencabar tradisi perniagaan dan konvensyen kebudayaan.
Tetapi kenaikan cepat Google echelons atas perniagaan terjemahan peringatan apa yang boleh berlaku apabila Google melepaskan kuasa pengkomputeran tenaga kasar mengenai masalah-masalah yang kompleks.
Rangkaian pusat-pusat data yang dibina untuk carian Web kini boleh, apabila membidas bersama-sama, komputer terbesar di dunia. Google menggunakan mesin itu untuk menekan batas teknologi terjemahan. Bulan lepas, sebagai contoh, ia berkata ia sedang berusaha untuk menggabungkan alat terjemahan dengan analisis imej, membenarkan seseorang, berkata, mengambil gambar telefon bimbit menu di Jerman dan mendapatkan terjemahan bahasa Inggeris yang segera.
"Terjemahan Mesin adalah salah satu contoh terbaik yang menunjukkan wawasan strategik Google," kata Tim O'Reilly, pengasas dan ketua eksekutif teknologi penerbit O'Reilly Media. "Ia bukan sesuatu yang orang lain sedang serius. Tetapi Google memahami sesuatu tentang data yang tiada orang lain memahami, dan ia bersedia untuk membuat pelaburan yang perlu untuk menangani pelbagai masalah kompleks di hadapan pasaran. "
Mencipta mesin terjemahan ini telah lama dilihat sebagai salah satu cabaran paling sukar dalam kecerdasan buatan. Selama beberapa dekad, para saintis komputer cuba menggunakan pendekatan yang berasaskan peraturan - mengajar komputer kaedah-kaedah linguistik dua bahasa dan memberikan kamus yang perlu.
Tetapi pada pertengahan tahun 1990-an, penyelidik mula memihak kepada pendekatan statistik kononnya. Mereka mendapati bahawa jika mereka diberi makan beribu-ribu komputer atau berjuta-juta petikan dan terjemahan manusia yang dihasilkan mereka, ia boleh belajar untuk membuat tekaan yang tepat tentang bagaimana untuk menterjemahkan ayat-ayat yang baru.
Ia menukar bahawa teknik ini, yang memerlukan sejumlah besar data dan banyak kuasa kuda pengkomputeran, sehingga lorong Google.
"Infrastruktur kami sangat sesuai untuk ini," Vic Gundotra, naib presiden bagi kejuruteraan di Google, katanya. "Kita boleh mengambil pendekatan yang lain tidak boleh impian."
Sistem terjemahan automatik jauh dari sempurna, dan walaupun Google tidak akan meletakkan penterjemah manusia keluar dari pekerjaan pada bila-bila masa tidak lama lagi. Pakar-pakar berkata ia amat sukar untuk komputer untuk memecahkan hukuman kepada bahagian-bahagian, kemudian menterjemahkan dan pasang semula.
Tetapi perkhidmatan Google cukup baik untuk menyampaikan intipati artikel berita, dan ia telah menjadi sumber yang cepat untuk terjemahan untuk berjuta-juta orang. "Jika anda memerlukan terjemahan kasar dan bersedia, ia adalah tempat untuk pergi," kata Philip Resnik, terjemahan mesin pakar dan profesor bersekutu linguistik di Universiti Maryland, College Park.
Seperti pesaing-pesaingnya dalam bidang, terutama Microsoft dan IBM, Google telah diberi makan enjin terjemahan transkrip prosiding Bangsa-Bangsa Bersatu, yang diterjemahkan oleh manusia ke dalam enam bahasa, dan orang-orang Parlimen Eropah, yang telah diterjemahkan ke dalam 23. Bahan mentah ini digunakan untuk melatih sistem untuk bahasa-bahasa yang paling biasa.
Namun, Google telah membaca seluruh teks Web, serta data dari projek pengimbasan buku dan sumber-sumber lain, untuk bergerak di luar orang-orang bahasa. Untuk bahasa yang lebih kabur, ia telah dibebaskan "kit alat" yang membantu pengguna dengan terjemahan dan kemudian menambah teks-teks kepada pangkalan data.
Menawarkan Google boleh meletakkan penyok jualan perisian terjemahan korporat daripada syarikat-syarikat seperti IBM Tetapi terjemahan automatik tidak mungkin untuk menjadi yg mendatangkan banyak uang yang besar, sekurang-kurangnya tidak oleh piawaian perniagaan pengiklanan Google. Namun, usaha Google boleh membayar dalam beberapa cara.
Kerana iklan Google yang online di mana-mana, apa-apa yang membuat ia lebih mudah bagi orang ramai untuk menggunakan manfaat web syarikat. Dan sistem itu boleh membawa kepada permohonan baru yang menarik. Minggu lalu, syarikat itu berkata ia akan menggunakan pengiktirafan ucapan untuk menjana kapsyen bahasa Inggeris YouTube video, yang kemudiannya boleh diterjemahkan kepada 50 bahasa lain.
"Teknologi ini boleh membuat halangan bahasa pergi," kata Franz och, seorang saintis utama di Google yang mengetuai pasukan terjemahan mesin syarikat. "Ia akan membolehkan sesiapa sahaja untuk berkomunikasi dengan orang lain."
En och, seorang penyelidik Jerman yang sebelum ini bekerja di University of Southern California, berkata beliau pada mulanya enggan untuk menyertai Google, takut ia akan merawat terjemahan sebagai projek sampingan. Larry Page, pengasas Google yang lain, yang dipanggil untuk memberi jaminan kepada beliau.
"Beliau pada dasarnya berkata bahawa ini adalah sesuatu yang sangat penting bagi Google," Encik och teringat baru-baru ini. Encik och ditandatangani pada tahun 2004 dan tidak lama lagi dapat meletakkan janji Page Mr. Untuk menguji.
Walaupun banyak sistem penterjemahan seperti Google menggunakan satu bilion kata-kata teks untuk mewujudkan satu model bahasa, Google pergi lebih besar: perkataan Inggeris beberapa ratus bilion. "Model menjadi lebih baik dan lebih baik lebih banyak teks yang anda proses," Encik och berkata.
Usaha yang telah dibayar. Setahun kemudian, Google memenangi pertandingan yang dikendalikan oleh kerajaan yang menguji sistem penterjemahan yang canggih.
Google telah menggunakan pendekatan yang sama - kuasa pengkomputeran yang besar, timbunan data dan statistik untuk menangani masalah-masalah kompleks yang lain. Pada tahun 2007, sebagai contoh, ia mula menawarkan 800-GOOG-411, perkhidmatan bantuan direktori percuma yang menafsirkan bercakap permintaan. Ia membenarkan Google untuk mengumpul suara berjuta-juta orang sehingga ia boleh menjadi lebih baik menyedari Bahasa Inggeris bercakap.
Setahun kemudian, Google telah mengeluarkan satu sistem carian-oleh-suara yang baik sebagai orang-orang yang mengambil tahun syarikat-syarikat untuk membina.
Dan akhir tahun lepas, Google telah memperkenalkan perkhidmatan yang dipanggil Goggle yang menganalisis gambar telefon bimbit, yang hampir sama mereka kepada pangkalan data yang lebih daripada satu bilion imej dalam talian, termasuk foto jalan-jalan yang diambil untuk perkhidmatan Paparan Jalan.
Encik och mengakui bahawa sistem terjemahan Google masih memerlukan penambahbaikan, tetapi beliau berkata, ia menjadi lebih baik cepat. "Lengkung peningkatan kualiti semasa masih cukup curam," katanya.
Rencana asal ...