重要:此页面会使用Cookie (cookies). 使用本网站不关闭浏览器中的cookie,即表示您同意使用它。
-
Google的计算能力的改善翻译工具
从纽约时报的新闻文章转载。
在谷歌2004年的会议,讨论了在韩国的粉丝,该公司已收到一个电子邮件。 ,谷歌创始人谢尔盖布林,跑了的消息,该公司已获得通过自动翻译服务。
消息说,谷歌是一个喜爱的搜索引擎,但结果写着:“生鱼片的鞋子它希望。谷歌葱花的东西!“
布林先生表示,谷歌应该可以做的更好。六年后,其免费的谷歌翻译服务处理52种语言,超过任何类似的系统,和人们使用它亿万次,每周翻译网页和其他的文字。
Lavie,卡内基 - 梅隆大学的教授在语言技术研究所副研究员,阿龙说:“你在谷歌翻译上看到的是最先进的”,不局限于某一学科领域的计算机翻译。
曾与谷歌的努力扩大搜索网页之外成败参半。在法庭上,已经挂了它的数字图书项目引进其社会网络,巴斯,提出了隐私的担忧。研究结果显示,它有时会失误,当它试图挑战商业传统和文化习俗。
但Google的快速崛起的翻译业务的高层提醒谷歌释放蛮力计算能力上的复杂问题时,会发生什么。
内置网络搜索的数据中心的网络,它现在可能时抨击在一起,世界上最大的的计算机。谷歌正在使用该机器翻译技术,推动限制。上个月,例如,它说,它正在与图像分析相结合的翻译工具,可以让一个人,比方说,在德国的手机的菜单照片,并获得即时的英语翻译。
“机器翻译是一个最好的例子,显示了谷歌的战略眼光,技术出版商O'Reilly媒体创始人兼首席执行官Tim O'Reilly说。” “这不是其他人正在非常认真。但是,谷歌了解有关的数据,没人能理解的东西,它愿意作出必要的投资,以解决各种复杂的问题,未来的市场这些。“
创建一个翻译机一直被看作是人工智能中最严峻的挑战之一。几十年来,计算机科学家试图用一个以规则为基础的方法 - 计算机教学的两种语言的语言规则,并给予必要的字典。
但在20世纪90年代中期,研究人员开始偏袒所谓的统计方法。他们发现,如果美联储的计算机数千或数百万的通道和人类产生的翻译,它可以学习有关如何翻译新的文本准确的猜测。
事实证明了这种技术,这需要巨额的数据和大量的计算能力,谷歌的胡同。
“,在谷歌工程副总裁,维克Gundotra说:”我们的基础设施是非常非常适合这个。 “我们可以采取的办法,别人无法连做梦。”
自动翻译系统是远远不够完善,甚至Google不会把工作的翻译人员很快。专家说,这是极为困难的一台电脑,一个句子分成若干部分,然后翻译和重组。
但Google的服务是不够好,传达新闻文章的精髓,它已成为千百万人的翻译快速源。 “如果你需要一个粗略的和准备翻译,它的地方去,雷斯尼克,机器翻译专家和马里兰大学学院公园的语言学副教授说:”菲利普。
最显着的微软和IBM,谷歌在该领域它的竞争对手一样,美联储联合国诉讼笔录,这是翻译成六种语言的人,和欧洲议会的,这是翻译成23的翻译引擎。使用这种原料是最常见的语言培训系统。
但是,谷歌已经冲刷的Web文本,以及从它的图书扫描项目和其他来源的数据,超越这些语言。对于比较模糊的语言,它已经发布的“工具箱”,帮助与翻译的用户,然后将这些文本添加到它的数据库。
Google提供的翻译软件企业的销售公司,如IBM,但自动翻译是决不可能是一个大的摇钱树,至少不是由谷歌广告业务的标准,可以把一个凹痕。尽管如此,谷歌的努力可以还清在几个方面。
由于Google的广告无处不在网上,任何事情,更容易为人们使用网络的好处,公司。系统可能导致有趣的新应用。上周,该公司说,它将使用语音识别,生成英语YouTube视频,然后可以翻译成50个其他语言的字幕。
“这项技术可以使语言上的障碍消失,OCH”弗兰兹说,在谷歌的首席科学家,导致该公司的机器翻译团队。 “这将允许任何人以与其他人沟通。”
OCH,德国研究人员曾在南加州大学工作,先生说,他起初不愿意加入谷歌,担心这会当作一个侧面项目的翻译。拉里佩奇,谷歌的另一位创始人,被称为向他保证。
“他基本上说,这是为谷歌,这是非常重要的东西,OCH先生回忆说:”最近。 OCH先生签署于2004年,很快就能把测试页的先生承诺。
虽然很多像谷歌的翻译系统使用多达一亿字的文本来创建一个语言模型,谷歌去更大的:几千亿英语单词。 OCH先生说:“模型成为好您要处理的文字更”。
这一努力得到了回报。一年后,谷歌赢得了政府的运行测试先进的翻译系统的竞争。
谷歌已经使用了类似的方法 - 巨大的计算能力,数据和统计资料的堆 - 解决其他复杂的问题。例如,在2007年,它开始提供800 - GOOG - 411,一个免费目录援助服务,解释发言的请求。它允许谷歌收集的数百万人民的声音,所以它可以更好地认识到英语口语。
一年后,谷歌推出语音搜索系统,是为其他公司经过多年建设好。
而去年年底,谷歌推出了一个服务叫护目镜,分析手机照片,将它们匹配到一个多亿美元的在线图像,包括其街景服务采取的街道照片的数据库。
OCH先生承认,Google的翻译系统仍需改进,但他说这是变得更好的快。 “他说,”目前的质量改进曲线仍然是相当陡峭。
原来的文章...
-
米哈尔Podbielski(vBET员工)
好文章
-
-
-
-
此主题的标签
发帖权限
- 您 可能不会 发表新主题
- 您 可能不会 发表回复
- 您 可能不会 上传附件
- 您 可能不会 编辑您的文章
-
论坛