뉴욕 타임즈 신문에서 reprinted 뉴스 기사.
2004 년 구글 모임에서 토론은이 회사가 한국에서 팬에서받은 전자 메일 메시지로 변해. 세르게이 브린, 구글의 설립자가 회사가 허가를했다는 자동 번역 서비스를 통해 메시지를 실행.
메시지 구글이 좋아하는 검색 엔진이라고,하지만 결과는 읽기 : "그것이 소원 생선회 생선 신발. 구글 녹색 양파 것! "
씨 브린은 구글이 더 잘 할 수있어 야지했다. 6 년 후, 자사의 무료 Google 번역 서비스가 어떤 유사한 시스템보다 52 언어를, 처리하고, 사람들은 웹 페이지 및 기타 텍스트를 번역하는 그것을 회 수백만의 수백을 사용합니다.
특정 주제 영역에 국한되지 않은 컴퓨터 번역의 "당신이 Google 번역에서 보는 것은 예술의 상태입니다"알론 Lavie, 카네기 멜론 대학에서 언어 기술 연구소의 연관 연구 교수는 말했다.
웹 검색 이상의 확장을위한 Google의 노력은 혼합 성공을 만난. 디지털 도서 프로젝트는 법정에 끊었하며, 소셜 네트워크, 버즈의 소개 개인 정보 보호 두려움을 제기했습니다. 패턴은 비즈니스 전통과 문화 컨벤션에 도전하려고 할 때 그것이 때로는 발을 헛디딥니다 수 있습니다 제안합니다.
그러나 번역 사업의 상단 echelons Google의 빠른 상승은 Google이 복잡한 문제에 미치는 짐승 - 강제로 컴퓨팅 파워를 unleashes 때 어떤 일이 벌어 지는지의 알림입니다.
함께 세계 최대의 컴퓨터를 해놓구 때 웹 검색을위한 내장 데이터 센터의 네트워크는 지금 수 있습니다. 구글 번역 기술의 한계를 밀어 그 기계를 사용하고 있습니다. 지난 달, 예를 들면, 그것은 사람이 말하고, 독일어의 메뉴의 핸드폰 사진을 가지고 즉시 영어 번역을 수 있도록, 이미지 분석의 번역 도구를 결합하기 위해 노력했다.
"기계 번역 구글의 전략적 비전을 보여주는 최고의 사례 중 하나입니다"팀 오라 일리의 기술 출판사 오라 일리 미디어의 설립자이자 CEO 인 말했다. "그것은 다른 사람이 매우 심각하게 받아들이는 것을 것이 아닙니다. 그러나 구글은 아무도 이해하지 못하는 데이터에 대한 무언가를 이해하고, 그것은 앞서 시장의 복잡한 문제에 이러한 종류의를 해결하기 위해 필요한 투자를 할 용의가있다. "
번역 기계를 만드는 것은 긴 인공 지능에서 가장 힘든 도전 중 하나로 볼 수있다. 두 언어의 언어 규칙에 컴퓨터를 가르치고 그것을 필요한 사전을 제공 - 수십 년 동안, 컴퓨터 과학자들은 규칙 기반 접근법을 사용 했어요.
그러나 1990 년대 중반, 연구자들은 소위 통계적 접근 방식을 좋아하는했다. 그들은 컴퓨터 수천 또는 통로 및 인간 생성된 번역 수백만 먹이면, 새로운 텍스트를 번역하는 방법에 대한 정확한 추측을 배울 수있는 것으로 나타났습니다.
그것은 데이터 및 컴퓨팅 마력의 많은 거대한 양의가 필요합니다이 기술은, 바로 구글의 취향이있다 더라구요.
"우리의 인프라는 매우 이것을 잘 적합,"빅 Gundotra, 구글의 엔지니어링 담당 부사 장인 고 말했다. "우리는 다른 사람도 갖을 수없는 방법이 걸릴 수 있습니다."
자동 번역 시스템은 완벽함과 거리가 멀었 있으며, 심지어 구글은 조만간 직장 인간의 번역을 두지 않습니다. 전문가들은이 부분에 문장을 망가뜨릴 수있는 컴퓨터에 대한 매우 어렵습니다라고, 그때 번역 그들을 재조 립.
그러나 구글의 서비스는 뉴스 기사의 본질을 전달하기 위해 충분하고, 그것은 수백만의 사람에 대한 번역에 대한 간단한 소스가되었습니다. "당신은 졸속 번역이 필요하면, 그것이 갈 수있는 장소,"필립 레즈닉, 메릴랜드 대학, 대학 공원에서 기계 번역 전문가와 언어학의 부교수는 말했다.
분야에서 경쟁사와 마찬가지로, 특히 마이크로 소프트와 IBM, 구글 23로 번역 아르 6 개 언어로 인간이 번역하고, 유럽 의회의 견해 유엔 절차의 사본,과의 번역 엔진을 공급하고 있습니다. 이 원료는 가장 일반적인 언어에 대한 시스템을 훈련하는 데 사용됩니다.
그러나 구글은 웹의 텍스트를 발견할만큼 커다란뿐만 아니라 자사의 도서 스캔 프로젝트 및 기타 소스에서 데이터를 해당 언어로 극복한다. 더 모호한 언어, 그것은 번역과 사용자가 도움이 후 해당 데이터베이스에 이러한 텍스트를 추가하는 "도구 키트"를 발표했다.
Google의 제공 IBM은 그러나 자동 번역은 적어도 구글의 광고 사업의 기준으로, 큰 건이 될 가능성이 결코 같은 회사에서 기업 번역 소프트웨어의 판매에 구멍을 내버릴 수 있습니다. 하지만, 구글의 노력은 여러 가지 방법으로 돈을 지불 수 있습니다.
Google의 광고는 유비 쿼터스 온라인, 쉽게 사람들이 웹 혜택에게 회사를 사용할 수있게 아무것도 때문에. 그리고 시스템은 흥미로운 새로운 애플 리케이션을 초래할 수 있습니다. 지난 주, 회사는 다음 50 다른 언어로 번역될 수있는 영어 YouTube 동영상에 대한 캡션을 생성하는 음성 인식을 사용하는 것이라고 말했다.
"이 기술은 언어의 장벽을 무마시킬 수있다"프란츠 루시 회사의 기계 번역 팀을 이끌고 구글 교장 과학자는 말했다. "그것은 누구나 다른 사람과 의사 소통을 할 수있게합니다."
씨 루시 이전 남부 캘리포니아 대학에서 근무 독일의 연구자들은, 그것이 사이드 프로젝트로 번역을 취급 것이 두려워, 그는 구글에 합류 처음에 꺼려했다. 래리 페이지, 구글의 또 다른 창업자인 그를 안심했다.
"그는 기본적으로이 구글에 매우 중요한 뭔가가 있다고 말했다"씨 루시 최근 소환. 루시 씨는 2004에서 서명하고 곧 테스트 씨 페이지의 약속을 넣어 수있었습니다.
구글과 같은 많은 번역 시스템은 언어의 모델을 만들려면 텍스트 억 단어를 사용할지만, 구글은 훨씬 더 큰 간 : 억원에서 수백 영어 단어를. "모델은 더 나은 당신이 과정을 더 나은 텍스트가"씨 루시 고 말했다.
노력은 결실을. 년 후, 구글은 정교한 번역 시스템을 테스트하는 정부 실행 경쟁을 수상했습니다.
다른 복잡한 문제를 해결하기 위해 - 엄청난 컴퓨팅 파워, 데이터 및 통계 힙스 - 구글은 유사한 접근 방식을 사용하고 있습니다. 2007 년, 예를 들어, 800 - GOOG - 411, 음성 요청을 해석하는 무료 전화 번호 안내 서비스를 제공하기 시작했다. 그것이 말한 영어를 인식에서 더 얻을 수 있도록 구글은 사람들의 수백만의 목소리를 수집하는있었습니다.
년 후, 구글은 다른 건설 회사 년이 걸렸습니다 이들만큼 좋았 검색별로 음성 시스템을 발표했다.
그리고 지난 해, 구글은 스트리트 뷰 서비스를위한 이동 거리의 사진을 포함하여 이상 억 온라인 이미지의 데이터베이스를 일치, 핸드폰 사진을 분석하여 서비스 고글을 호출을 소개했다.
씨 루시는 Google의 번역 시스템이 여전히 개선을 필요하다고 인정하지만, 그는 더 빨리지고 있다고 밝혔다. "현재의 품질 향상 곡선 아직도 꽤 가파른있다"고 말했다.
원본 기사 ...