Google收购了该公司 瓦维 四月份的价格略高于3,000万美元。有人猜测,Wavii试图与Yahoo匹敌’购买Summly,该摘要汇总了来自网络的新闻。
瓦维应用程序确实做到了这一点– 获得和汇总的新闻 从网络上。当瓦维 从隐身模式出现,它被吹捧为基于主题而非关键字的个性化新闻聚合器。该应用已被Google关闭’收购该公司,而不是提供新闻聚合服务,该技术似乎将助推Google Now,Google’根据上面链接的TechCrunch文章,其知识库和Google Glass。
那是什么技术呢?
Oren Etzioni在他最初于2011年在《自然》杂志上发表的一篇文章中暗示瓦维 性质 当他撰写有关Google,Bing和Wolphram Alpha的局限性(pdf)以及搜索的未来时。搜索的未来意味着什么?该视频简要介绍了:
我喜欢与Google和Google的比较’视频和声明中的知识图:
我们的目标是建立下一代搜索引擎。
我检查了一下,Wavii在Google收购时拥有哪些专利,而且似乎描述了Web上公开信息提取(pdf)的一项专利已分配给Wavii
授予的专利和后续专利申请是:
从Web开放信息提取 (授予的原始版本)
从Web开放信息提取 (跟进继续专利申请,有新的权利要求部分)
由Michael J. Cafarella,Michele Banko和Oren Etzioni发明
通过其商业化中心分配给:华盛顿大学
美国专利7,877,343
2011年1月25日授予
抽象
为了实现开放信息提取,已经开发了一种新的提取范例,其中系统在文本语料库上进行单个数据驱动的传递,无需任何人工输入即可提取大量的关系元组。自我监督学习者使用训练数据,使用解析器和启发式方法来确定将由提取分类器(或其他排名模型)用于评估从文本语料库中提取的候选元组的可信度的标准,方法是应用启发式的文本语料库。
分类器以足够高的可信度保留元组。基于冗余的评估器为每个保留的元组分配一个概率,以指示该保留的元组是包含保留的元组的多个对象之间关系的实际实例的可能性。保留的元组包含一个提取图,可以查询该提取图以获取信息。
我没有详细细分专利申请,而是’m您将获得以下资源,以更深入地了解此开放信息提取系统的工作方式。
首先是视频:
在网络规模
(它’很长,但绝对值得一看)
这些论文和页面还提供了更多详细信息:
- 公开信息提取
- :第二代 (pdf)Oren Etzioni,Anthony Fader,Janara 克里斯tensen,Stephen Soderland和Mausam Ollie
- 软件
- 用于信息提取的开放语言学习 (pdf),Mausam,Michael Schmitz,Robert Bart,Stephen Soderland和Oren Etzioni
拿走
瓦维不是’像收购前一样,将新闻聚合器应用程序带到Google。相反,他们带给搜索引擎的开放信息提取方法旨在在没有预定义模板或监督的情况下通读Web上的文本。
提取方法可识别名词以及它们之间的动词之间如何建立联系,并对这些关系的质量进行评级。一种“classifier”确定每个关系的可信赖程度,并仅保留可信赖的关系。
这些关系中的这些术语(每个都被认为是“tuple”)存储在可用于响应查询的倒排索引中。这里’s是在爬网期间可能标识的关系的一个示例,该关系可能是此索引的一部分::
(
使用有限数量的数据进行这种开放信息提取的示例是 催眠师 可用于搜索有关西雅图餐厅的信息。
像Wavii收购的这样的系统有很大的潜力来改善Google’的知识库和Google即时,并根据上下文响应了预测查询。开放信息提取仍在进行中,但它可能是搜索未来的重要组成部分。
尼斯书面法案。似乎是从10个蓝色链接到“电脑,咖啡黑。”
谢谢,吉
我盯着专利申请书呆了一周左右,试图弄清楚如何最好地将它们放在上下文中,并最终决定上下文比专利申请的细分更为重要。这两段视频都值得一看,公开信息提取中较长的一段视频很好地解释了该专利背后的技术是如何工作的。
10个蓝色链接的日子看起来像他们’将会比我们可能知道的更快消失。
我最近在专利申请中花了一些时间,试图查找有关交易查询和信息查询的信息。我没有找到我想要的东西,但是当我谷歌搜索时,您的网站就出现了!感谢Bill,热爱您的工作和分析!
感谢您的撰写,这有助于弄清Wavii拥有的专利。我不知道这可能与Google Glass和用户对其进行搜索有关。
谢谢,吉!
搜索在不断发展,有关系统的想法“reads”网络并对其进行分类非常有趣。他们能够读取足够多的信息以捕获有关及时主题的实时数据这一事实,使我想知道他们可以用更多的计算能力来做什么。 Google正在进行许多项目,某些方法似乎可能会有些重叠,’很难猜测哪种方法可能最有效,但是这种开放式机器学习方法非常有趣。想象一下,如果这样的系统仅限于Google Plus,并且基于Google Plus向Google Now提供了社交元素–这样一来,您就可以在社交网络上发布自己可能会错过的,与您感兴趣的主题有关的帖子。不完全的“Coffee black,”但绝对比我们以前更接近
嗨安妮,
感谢您的客气话。我绝对会推荐的论文(而不是专利)是Andrea Broder’s的网络搜索分类 http://www.sigir.org/forum/F2002/broder.pdf
他在雅虎工作了相当长的时间,然后他搬到了Google,我相信他仍然在那儿。绝对是网络搜索的先驱之一。
嗨詹姆森,
我听说过Google购买Wavii的消息,但我怀疑这远不止新闻聚合器应用程序。
I’我认为这可能对创建Google很有帮助’在收集有关实体的事实和与之关联的事实方面,其知识基础要丰富得多。我还认为,通过在适当的时候发现有用的信息,以提供给可能觉得有用和有益的人们,它有可能使Google即时变得更加丰富’一定要寻找它。
大概我听说雅虎购买了它,并对这个想法很感兴趣。当你 ’为了消磨手机上的时间,少量信息比大型文章要好得多。当然,可以选择将完整的文章发送到您的PC以便以后进行完整的阅读会很好。
一旦我们看到Google将如何利用这一点,就会很有趣。
克里斯,你好
瓦维s能够收集,汇总和汇总与您指定的主题相关的新闻,这绝对是其可以做什么的一个很好的概念证明,但我确实认为’他们的开放学习事实提取方法背后的功能要比转移注意力要多得多“killing time.”Wavii新闻应用似乎已经关闭,但其背后的想法如何在Google中使用’的知识库和Google即时非常有趣。