Berita artikel yang dicetak ulang dari surat kabar New York Times.
Dalam pertemuan di Google pada tahun 2004, diskusi beralih ke pesan e-mail perusahaan telah menerima dari seorang penggemar di Korea Selatan. Sergey Brin, pendiri Google, berlari pesan melalui layanan terjemahan otomatis bahwa perusahaan telah berlisensi.
Pesan mengatakan Google adalah mesin pencari favorit, tapi hasilnya baca: "Sepatu ikan diiris mentah itu keinginan. Google hijau bawang hal! "
Mr Brin mengatakan Google harus mampu untuk berbuat lebih baik. Enam tahun kemudian, gratis Google Translate menangani layanan 52 bahasa, lebih daripada sistem yang sama, dan orang-orang menggunakannya ratusan juta kali seminggu untuk menerjemahkan halaman web dan teks lainnya.
"Apa yang Anda lihat di Google Translate adalah keadaan seni" dalam terjemahan komputer yang tidak terbatas pada suatu subyek tertentu, kata Alon Lavie, seorang profesor asosiasi penelitian di Institut Teknologi Bahasa di Carnegie Mellon University.
Upaya Google untuk memperluas luar pencarian Web telah bertemu dengan keberhasilan yang beragam. Digital buku proyek telah digantung di pengadilan, dan pengenalan jaringan sosial, Buzz, menimbulkan kekhawatiran privasi. Pola menunjukkan bahwa kadang-kadang bisa salah langkah ketika mencoba untuk menantang tradisi bisnis dan konvensi budaya.
Tapi kenaikan yang cepat Google ke eselon atas dari bisnis terjemahan adalah pengingat apa yang bisa terjadi ketika Google merilis brute force daya komputasi pada masalah yang kompleks.
Jaringan pusat data yang dibangun untuk pencarian Web sekarang mungkin, saat diikat, komputer terbesar di dunia. Google menggunakan mesin itu untuk mendorong batas teknologi penerjemahan. Bulan lalu, misalnya, mengatakan pihaknya sedang bekerja untuk menggabungkan alat terjemahan dengan analisis citra, yang memungkinkan seseorang untuk, misalnya, mengambil foto dari menu ponsel di Jerman dan mendapatkan terjemahan bahasa Inggris instan.
"Terjemahan Mesin adalah salah satu contoh terbaik yang menunjukkan visi strategis Google," kata Tim O'Reilly, pendiri dan kepala eksekutif teknologi penerbit O'Reilly Media. "Ini bukan sesuatu yang orang lain sedang sangat serius. Tapi Google mengerti sesuatu tentang data yang orang lain mengerti, dan bersedia untuk membuat investasi yang diperlukan untuk mengatasi jenis-jenis masalah yang kompleks di depan pasar. "
Membuat mesin penerjemahan telah lama dipandang sebagai salah satu tantangan terberat dalam kecerdasan buatan. Selama beberapa dekade, ilmuwan komputer mencoba menggunakan pendekatan berbasis peraturan - mengajar komputer aturan linguistik dari dua bahasa dan memberikan kamus yang diperlukan.
Tapi di pertengahan 1990-an, para peneliti mulai mendukung pendekatan yang disebut statistik. Mereka menemukan bahwa jika mereka makan ribuan komputer atau jutaan bagian dan manusia yang dihasilkan terjemahan mereka, bisa belajar untuk membuat dugaan yang akurat tentang bagaimana menerjemahkan teks-teks baru.
Ternyata teknik ini, yang membutuhkan data dalam jumlah besar dan banyak tenaga kuda komputasi, yang benar sampai gang Google.
"Infrastruktur kami sangat cocok untuk ini," kata Vic Gundotra, wakil presiden untuk teknik di Google,. "Kita bisa mengambil pendekatan yang lain bahkan tidak bisa bermimpi."
Sistem terjemahan otomatis jauh dari sempurna, dan bahkan Google tidak akan menempatkan penerjemah manusia keluar dari pekerjaan waktu dekat. Para ahli mengatakan itu adalah sangat sulit bagi komputer untuk memecahkan sebuah kalimat menjadi beberapa bagian, kemudian menerjemahkan dan berkumpul kembali mereka.
Tetapi layanan Google cukup baik untuk menyampaikan esensi dari artikel berita, dan telah menjadi sumber terjemahan cepat untuk bagi jutaan orang. "Jika Anda membutuhkan terjemahan kasar-dan-siap, itu adalah tempat untuk pergi," kata Philip Resnik, terjemahan mesin ahli dan profesor linguistik di University of Maryland, College Park.
Seperti para pesaingnya di lapangan, terutama Microsoft dan IBM, Google telah diberi mesin terjemahan dengan transkrip persidangan PBB, yang diterjemahkan oleh manusia ke dalam enam bahasa, dan orang-orang dari Parlemen Eropa, yang diterjemahkan ke dalam 23. Ini bahan baku digunakan untuk melatih sistem untuk bahasa yang paling umum.
Tapi Google telah menjelajahi teks dari Web, serta data dari proyek pemindaian buku dan sumber-sumber lain, bergerak melampaui bahasa-bahasa. Untuk bahasa jelas lebih, telah merilis sebuah "tool kit" yang membantu pengguna dengan terjemahan dan kemudian menambahkan teks-teks ke database.
Menawarkan Google dapat menempatkan penyok dalam penjualan perangkat lunak penerjemahan perusahaan dari perusahaan seperti IBM Tapi terjemahan otomatis tidak pernah mungkin menjadi penghasil uang yang besar, setidaknya tidak oleh standar bisnis iklan Google. Namun, upaya Google bisa membayar dalam beberapa cara.
Karena iklan Google sedang online di mana-mana, apa yang membuatnya mudah bagi orang untuk menggunakan manfaat web perusahaan. Dan sistem dapat menyebabkan aplikasi baru yang menarik. Pekan lalu, perusahaan mengatakan akan menggunakan pengenalan suara untuk menghasilkan keterangan untuk bahasa Inggris video YouTube, yang kemudian bisa diterjemahkan ke dalam 50 bahasa lain.
"Teknologi ini dapat membuat kendala bahasa pergi," kata Franz Och, seorang ilmuwan utama di Google yang memimpin tim terjemahan mesin perusahaan. "Ini akan memungkinkan orang untuk berkomunikasi dengan orang lain."
Mr Och, seorang peneliti Jerman yang sebelumnya bekerja di University of Southern California, mengatakan dia awalnya enggan untuk bergabung dengan Google, karena khawatir hal itu akan memperlakukan penerjemahan sebagai proyek sampingan. Larry Page, pendiri lain Google, dipanggil untuk meyakinkannya.
"Dia pada dasarnya mengatakan bahwa ini adalah sesuatu yang sangat penting bagi Google," kenang Mr Och baru. Mr Och ditandatangani pada tahun 2004 dan segera mampu menempatkan janji Mr Page untuk menguji.
Sementara sistem penerjemahan banyak seperti Google menggunakan hingga satu miliar kata dari teks untuk menciptakan model bahasa, Google menjadi lebih besar: beberapa ratus miliar kata bahasa Inggris. "Model-model menjadi lebih baik dan lebih baik teks semakin Anda proses," kata Mr Och.
Upaya terbayar. Setahun kemudian, Google memenangkan kompetisi yang dikelola oleh pemerintah bahwa tes sistem penerjemahan yang canggih.
Google telah menggunakan pendekatan yang sama - daya komputasi besar, tumpukan data dan statistik - untuk mengatasi masalah kompleks lainnya. Pada 2007, misalnya, mulai menawarkan 800-GOOG-411, sebuah bantuan layanan direktori gratis yang menafsirkan permintaan diucapkan. Hal ini memungkinkan Google untuk mengumpulkan suara jutaan orang sehingga bisa lebih baik mengenali bahasa Inggris lisan.
Setahun kemudian, Google merilis sebuah sistem pencarian-oleh-suara yang sebagus mereka yang mengambil perusahaan lain tahun untuk membangun.
Dan akhir tahun lalu, Google memperkenalkan layanan yang disebut Goggles yang menganalisis foto ponsel, pencocokan mereka ke database lebih dari satu miliar gambar online, termasuk foto-foto jalan-jalan yang diambil untuk layanan Street View.
Mr Och mengakui bahwa sistem terjemahan Google masih perlu perbaikan, tetapi ia mengatakan itu menjadi lebih baik cepat. "Kurva peningkatan kualitas saat ini masih cukup curam," katanya.
Artikel Asli ...