有了Wavii,Google是否获得了网络搜索的未来?

分享是关怀!

Google收购了该公司 瓦维 四月份的价格略高于3,000万美元。有人猜测,Wavii试图与Yahoo匹敌’购买Summly,该摘要汇总了来自网络的新闻。

关于wavii域的部分公告,内容涉及Google的收购。

瓦维应用程序确实做到了这一点– 获得和汇总的新闻 从网络上。当瓦维 从隐身模式出现,它被吹捧为基于主题而非关键字的个性化新闻聚合器。该应用已被Google关闭’收购该公司,而不是提供新闻聚合服务,该技术似乎将助推Google Now,Google’根据上面链接的TechCrunch文章,其知识库和Google Glass。

那是什么技术呢?

Oren Etzioni在他最初于2011年在《自然》杂志上发表的一篇文章中暗示瓦维 性质 当他撰写有关Google,Bing和Wolphram Alpha的局限性(pdf)以及搜索的未来时。搜索的未来意味着什么?该视频简要介绍了:

我喜欢与Google和Google的比较’视频和声明中的知识图:

我们的目标是建立下一代搜索引擎。

我检查了一下,Wavii在Google收购时拥有哪些专利,而且似乎描述了Web上公开信息提取(pdf)的一项专利已分配给Wavii

授予的专利和后续专利申请是:

从Web开放信息提取 (授予的原始版本)
从Web开放信息提取 (跟进继续专利申请,有新的权利要求部分)

由Michael J. Cafarella,Michele Banko和Oren Etzioni发明
通过其商业化中心分配给:华盛顿大学
美国专利7,877,343
2011年1月25日授予

抽象

为了实现开放信息提取,已经开发了一种新的提取范例,其中系统在文本语料库上进行单个数据驱动的传递,无需任何人工输入即可提取大量的关系元组。自我监督学习者使用训练数据,使用解析器和启发式方法来确定将由提取分类器(或其他排名模型)用于评估从文本语料库中提取的候选元组的可信度的标准,方法是应用启发式的文本语料库。

分类器以足够高的可信度保留元组。基于冗余的评估器为每个保留的元组分配一个概率,以指示该保留的元组是包含保留的元组的多个对象之间关系的实际实例的可能性。保留的元组包含一个提取图,可以查询该提取图以获取信息。

我没有详细细分专利申请,而是’m您将获得以下资源,以更深入地了解此开放信息提取系统的工作方式。

首先是视频:

在网络规模

(它’很长,但绝对值得一看)

这些论文和页面还提供了更多详细信息:

拿走

瓦维不是’像收购前一样,将新闻聚合器应用程序带到Google。相反,他们带给搜索引擎的开放信息提取方法旨在在没有预定义模板或监督的情况下通读Web上的文本。

提取方法可识别名词以及它们之间的动词之间如何建立联系,并对这些关系的质量进行评级。一种“classifier”确定每个关系的可信赖程度,并仅保留可信赖的关系。

这些关系中的这些术语(每个都被认为是“tuple”)存储在可用于响应查询的倒排索引中。这里’s是在爬网期间可能标识的关系的一个示例,该关系可能是此索引的一部分::

(,获得, )(, 从......毕业, )(,是的作者, )(,位于 )(,研究过, )(, 就读于, )(,由 )(,成立于 )(,成立于 )(,与 )

使用有限数量的数据进行这种开放信息提取的示例是 催眠师 可用于搜索有关西雅图餐厅的信息。

在reminner网站上搜索的快照,其中包含玛格丽塔酒。

像Wavii收购的这样的系统有很大的潜力来改善Google’的知识库和Google即时,并根据上下文响应了预测查询。开放信息提取仍在进行中,但它可能是搜索未来的重要组成部分。

分享是关怀!

关于11条想法“有了Wavii,Google是否获得了网络搜索的未来?”

  1. 我最近在专利申请中花了一些时间,试图查找有关交易查询和信息查询的信息。我没有找到我想要的东西,但是当我谷歌搜索时,您的网站就出现了!感谢Bill,热爱您的工作和分析!

  2. 大概我听说雅虎购买了它,并对这个想法很感兴趣。当你 ’为了消磨手机上的时间,少量信息比大型文章要好得多。当然,可以选择将完整的文章发送到您的PC以便以后进行完整的阅读会很好。

    一旦我们看到Google将如何利用这一点,就会很有趣。

评论被关闭。