Google的机器翻译

Sharing is 汽车ing!

像Google这样的搜索引擎面临的挑战之一是,要使其在全球范围内有用,就必须为会说多种不同语言的受众群体提供搜索服务。

It’因此,毫不奇怪,搜索引擎已经深入研究了许多语言,甚至提供翻译服务– 谷歌翻译,以及一项允许您搜索其他语言的翻译单词和短语的服务– Google语言工具.

Google还提供了一个Google Translate小工具,您可以将其放在页面上,以允许访问者将页面翻译成他们的语言。

Google还致力于通过使其机器翻译服务移动化 在iPhone上可用.

In addition to an 汽车mated translation system, Google looks like they are starting a translation service, the Google翻译中心,这似乎仅适用于“trusted testers” at this point.

Google 博客 oscoped在标题为的帖子中有更多详细信息 Google翻译中心, a New Human 翻译 Service in the Making,这似乎集中在 人工翻译 rather than 汽车mated ones.

Google的专利申请描述了Google Translate的一个方面–服务使用者可能不太同意Google提供的翻译时,如何提供替代翻译。 Google官方博客文章, 建议更好的翻译 告知我们此功能可以在2007年3月向Google提供有关翻译的反馈。

机器翻译专利申请’s的发明人告诉我们,由于其他在线翻译服务的某些缺点,因此需要在专利申请中提供此类翻译反馈:

但是,此类网站通常无法为用户提供轻松提供有关翻译质量的反馈的手段。例如,如果用户发现翻译不正确或在文化上令人反感,通常他们唯一的选择就是向网站运营商发送电子邮件,该网站运营商可能会也可能不会将邮件路由给适当的人。

此外,该消息可能会省略文本的源语言版本,有争议的翻译或翻译的正确版本。这使得分析翻译错误和提高基于用户反馈的机器翻译的质量变得异常困难。

专利文件还提供了一些有关Google Translate中机器翻译系统和用户界面如何工作以及如何从提供给Google Translate的反馈中过滤掉垃圾邮件和拼写错误的见解。

机器翻译反馈
Jeffrey Chin和Daniel Daniel发明
美国专利申请20080195372
2008年8月14日发布
归档:2007年2月14日

专利申请告诉我们,机器翻译服务可以通过多种方式被服务的用户改进。

One is the ability for users of 谷歌翻译 to suggest a better translation, which is available on 谷歌翻译 now. How does Google handle those suggested alternative translations? The patent filing provides some details on how it might use 汽车mated filters, and then manual review to look at those user-supplied alternatives.

该专利还描述了允许服务用户进行以下操作的可能性:“使用星级评定或其他评分机制来评估翻译的质量,正确性或有用性。 ”

谷歌翻译用户的书面评论也是可能的,并且可以将翻译标记为在文化上不合适。

机器翻译服务可以从先前翻译的文本中学习,并使用基于单词和单词组合的概率的语言模型来提供翻译。

该专利申请还提供了一些有关如何翻译网页以及所涉及的用户界面的详细信息。

筛选和查看用户反馈以进行机器翻译

尽管用户反馈对于诸如Google Translate之类的服务可能真的很有帮助,’s the possibility that people might abuse the ability to offer feedback for one reason or another. A combination of 汽车mated filters and manual review could be used to try to ensure quality translations.

An 汽车mated filter might look at user-provided alternate translations, and filter them if:

  1. 替代翻译为空白或与原始翻译相同
  2. 备用翻译包含淫秽语言
  3. 用户是可疑的(专利申请没有’明确定义单词的使用“suspect” for us here)
  4. 用户在给定时间内提交了超过给定数量的备用翻译
  5. 用户有提交垃圾邮件的历史记录
  6. 根据机器翻译系统,替代翻译在目标语言中出现的可能性低,或者;
  7. 备用翻译包含多余的单词。

Other filters might also be used, such as one that 汽车matically corrects misspellings in the alternate translation.

The user-supplied alternate translations that are not filtered out may then 汽车matically be sent to a trusted individual to evaluate the translation or to a community-based review process which allows people to vote on whether they approve of the alternate translation.

在阅读专利申请时,我想知道Google可能在哪里找到“trusted individuals”或评估翻译的社区。 Google翻译中心的翻译人员库可能会提供审阅者的一种来源。

Sharing is 汽车ing!

关于16条想法“Google的机器翻译”

  1. 非常有趣的帖子,Google似乎利用了人们的反馈(也在Google图片中),’改善产品(免费)的好方法。

  2. 如果facebook将冲浪者用作翻译者,那么谷歌当然可以使用它们。

    脸书 发布了一个新界面,可将Facebook翻译成许多其他语言。他们创建了一个名为“Translations”允许用户将其翻译为任何语言。使用此工具可以对短语进行投票,以帮助正确纠正最常用的短语。

  3. 嗨,伊丹,

    感谢您指出Facebook如何使用户提供翻译。我没有’没看到那个特定的应用程序,但这听起来很有趣。

    Google专利文件描述了一种让人们看到替代翻译的方法,以便他们可以对它们进行投票。我不’不知道他们是否会开发,但是编写应用程序的人已经考虑过这一点。

  4. 嗨,巴勃罗,

    It’看到Google尝试收集用户反馈的不同方式也很有趣。我确实发现用于图像的方法非常有趣。

    Google Image Labeler充当游戏来帮助注释图像。它’是根据卡内基梅隆大学的ESP游戏制作的。卡内基·梅隆(Carnegie Mellon)似乎也添加了一些新游戏。

  5. 其实’论坛站点的工作方式。根据用户的不同,他们可以从中受益。人们上传一些东西,其他人下载那些东西并留下反馈。那些上传的用户开始收集这些反馈而获得声誉。论坛站点所有者是唯一通过此次交易赚钱的人。聪明的谷歌…

  6. 嗨,MGA,

    好点子。根据反馈信任答案,对反馈的评分可以衡量声誉。它 ’这是一种搜索引擎也可以衡量当某人对图像,视频或网站留下评论或注释或标签时注释的效果的方法。

    这样做的危险是有时收视率不高’t基于注释或翻译的价值,而是基于社区成员的受欢迎程度,基于个性而不是翻译或注释的质量的评级可以提供’t very good.

  7. 是的,语言是搜索引擎的王者。语言结构以及对语言的正确使用和理解是在搜索引擎领域保持竞争力和相关性的关键。

    “诗人,牧师和政客对他们的立场表示感谢。”
    — Sting, The Police

    对于搜索引擎领导者也可以这样说。

  8. 有趣的是,People Finder。

    我有时发现自己对搜索引擎如何能够捕获某些短语背后的意图和含义感到惊讶,或者至少尝试从单词组合成的短语中理解概念,这些单词赋予了它们全新的含义。

    了解语言的结构和正确用法很重要,但这必须是一项艰巨的任务。

    我们用我们的语言所拥有的一些最伟大的单词以及最有趣的句子和情感都故意忽略了正确的结构和正确的用法,然而人们却被歌曲,诗歌,散文所吸引,从而打破了这些规则。

    搜索引擎在进行翻译时面临的挑战之一是成语和其他与文化相关的陈述,其含义可能与构成它们的单词的字面意思有所不同。或者这可能意味着在不同的上下文中完全不同的事情。

  9. 嗨比尔

    我一直想知道是否可以在Google中进行翻译?例如,导致必须成为语言知识平台的资源。如果他们要用中文翻译。他们怎么做?我不’真的觉得’可能吗?除非他们要做字典来输入它。但是仍然会有问题。当人们使用它时。例如,如果我是美国人。我不小心将浏览器更改为中文,将其切换回英语时会遇到很多问题。中文单词在世界上也具有非常深刻的意义。它包含正式汉语,简单汉语和深刻汉语,但最好的之一仍然是韩语评英。但是您或用户将需要像中国人一样熟悉语言,然后才能使用它。因此,如果我要使用Google搜索Google网站。即使使用翻译服务,您也找不到适合它的商品吗?
    我认为无论哪种方式都行不通。除非它是基于用户的更专业的方法。

  10. 嗨,爱德华,

    该专利申请描述了在其使用的机器翻译过程中超出词典的内容。使用一种语言模型,该模型依赖于先前的翻译以及对这些翻译的人工输入,以及在网络上使用的语言,称为机器翻译系统(MTS)。

    Google在他们的系统中提供了有关系统的更多信息 常见问题页面 在Google翻译上。

  11. Google提供了多种印度语言,但缺少一种主要的语言oriya。因此,我希望google也提供oriya语言的服务。

  12. Pingback:SEO每日阅读-第98期«Internet Marketing 博客
  13. 有关Google翻译的重要信息。

    它显示了拥有此资源的重要性,但维护它的困难。一世’当翻译中不可避免地失去意义时,我不确定是否有解决方案。也许我们只需要接受一个翻译的单词或短语可能会有多个结果。

  14. 嗨拉奎尔,

    谢谢。 Google在Google Translate上花费大量时间和资源是很有意义的,并且他们正在以有趣的方式使用所学的知识。例如,一个翻译的单词或短语可能有多个结果这一事实是Google用来学习同义词的东西。他们’过去描述了他们如何使用英语术语,例如“car mechanic”并将其翻译成法语,然后再翻译回英语,并获得一些不错的翻译,例如“car mechanic” and “auto mechanic.”由于两个术语都有一个共同的后缀(机械的),因此’这是一个很好的机会“car” and “auto” are synonyms.

    因此,Google能够更好地将一种语言翻译成另一种语言,它们也变得更好。

  15. 嗨,乔什,

    那’s something that you’我可能要问Google而不是我。在过去的5年中,他们在翻译服务中加入了许多语言,’如果他们正在努力增加更多数量,这就不足为奇了。

评论被关闭。