什么是命名实体?
命名实体是特定的人物,地点或事物,是Google在返回有关查询的信息时可能寻找的内容的焦点。通过收购MetaWeb,他们在回答有关命名实体的问题时变得更加聪明,这已经开发出一种更好地理解搜索它们中的命名实体的方法,而Google似乎已经采用了这种方法。
这是MetaWeb如何处理命名实体的示例,如已授予它们的一项专利中所述:
您可能以许多名字或头衔认识他–加利福尼亚州州长,终结者,州长,野蛮人柯南,幼稚园警察,宇宙先生,奥林匹亚先生,阿诺德·斯特朗,阿妮,奥地利橡树。
在Metaweb中,Arnold Schwarzenegger称为9202a8c04000641f8000000000006567。
谁是Metaweb?
元web是最近被Google收购的一家公司,’ve创建了一个索引命名实体的系统,该系统允许您以新方式搜索信息。这个想法听起来有点像图书馆’■Dewey十进制系统,但用于命名实体。
为什么这很重要,什么是命名实体?
命名实体是特定的人,地点或事物。例如,命名实体可以包括巴拉克·奥巴马(Barack Obama),弗吉尼亚联邦或辛辛那提(Cincinnati)的Great American Ballpark。将唯一标识号与命名实体相关联可以使它们更容易建立索引,并在它们可能被不同名称引用时查找有关这些命名实体的信息,例如我上面关于Arnold Schwarzenegger的示例。他们还可以通过允许特定的地点或企业或地标具有唯一的标识号来帮助进行本地搜索。
命名实体在网络搜索中出现的频率如何?微软最近的一篇论文, 建立名称实体查询的Web搜索意图分类法 (pdf)告诉我们它们很常见:
根据Microsoft的一项内部研究,提交给Bing搜索的查询中至少有20-30%是简单命名的实体,据报告,有71%的查询包含名称实体。
Google在Google官方博客中宣布了对Metaweb的收购, 通过Metaweb更深入的了解。 元web还宣布了对他们的收购, 元web加入Google
元web建立了一个名为Freebase的知识库,该知识库由志愿者编辑和贡献者向其中添加了实体信息,它成为Google背后的主要信息来源之一’s Knowledge graph.
元web已在美国专利商标局分配了多项专利申请,如果您想了解一些公司背后的技术,则值得一试。
I’我刚刚开始看着自己,从下面的一个开始“Query Optimization,”在这里我找到了Arnold Schwarzenegger的Metaweb ID号。专利文件描述了如何使用ID号来收集和存储有关命名实体的数据以及与它们相关的信息,以及如何根据收集到的信息进行查询。
以下是分配给Metaweb的专利申请:
自动化的在线购买系统
布兰·费伦(W. Daniel Hillis)发明
美国专利申请20030195834
2003年10月16日发布
归档:2002年9月18日
元网络
布兰·费伦(W. Daniel Hillis)发明
美国专利申请20040210602
2004年10月21日发布
归档:2003年12月15日
个性化的个人资料,用于评估内容
W. Daniel Hillis和Bran Ferren发明
美国专利申请20050131918
2005年6月16日发布
归档:2004年5月24日
委托评估系统
W. Daniel Hillis和Bran Ferren发明
美国专利申请20050131722
2005年6月16日发布
归档:2004年5月25日
有助于通过网络导入用户资料数据的系统和方法
W. Daniel Hillis和Bran Ferren发明
美国专利申请20060095780
2006年5月4日发布
归档:2004年10月28日
用户贡献的知识数据库
Timothy Sturge,Kurt Bollacker,Robert Cook,John Giannandrea,Nicholas Thompson,Edwin Taylor发明的
美国专利申请20090024590
2009年1月22日发布
提交日期:2008年4月22日
图存储
由Scott Meyer,Jutta Degener,Barak Michener,John Giannandrea发明
美国专利申请20100174692
2010年7月8日发布
提交日期:2010年1月20日
数据库复制
由Scott Meyer,Jutta Degener,Barak Michener,John Giannandrea发明
美国专利申请20100121817
2010年5月13日发布
提交日期:2010年1月20日
查询优化
由Scott Meyer,Jutta Degener,Barak Michener,John Giannandrea发明
美国专利申请20100121839
2010年5月13日发布
提交日期:2010年1月20日
知识网
W. Daniel Hillis和Bran Ferren发明
分配给Metaweb Technologies,Inc.
美国专利7,502,770
2009年3月10日授予
申请日期:2002年4月10日
结论
元web运营基于社区的站点Freebase,该站点是基于社区的有关不同人物,地点和事物的数据源。有关他们如何收集和显示数据的绝佳示例,请参阅其在George Washington上的页面。
元web将为Google带来什么?
这还有待观察,但是Metaweb’的技术可能有助于使Google更轻松地将信息与命名实体相关联。正如我在上面提到的Microsoft论文所述,对命名实体的搜索在其搜索引擎上的搜索中占很大比例。在Google上搜索命名实体的可能性也很高。因此,Metaweb收购的影响可能很大。
I’撰写了一些有关命名实体的文章。这些是我想分享的:
- 您是否有用于营销网站的命名实体策略?
- 我如何爱实体并开始进行实体优化
- Google如何对具有相同名称的实体使用命名实体消歧
- 如何将命名实体连接到趋势主题以解决实时搜索结果
- 不是品牌而是实体:命名实体对Google和Yahoo搜索结果的影响
- 如何在搜索中使用知识库实体
- 在Google的知识图中查找实体名称
- Google通过命名实体变得更聪明:收购MetaWeb
- 与网站和相关实体的实体关联
- Google如何使用锚文本识别实体同义词
- 从诸如Wikipedia标题和信息框之类的来源中提取实体的事实
- 从网页和查询日志中提取语义类和相应的实例
- Google如何识别主要实体
- Google的知识图如何通过回答问题进行自我更新
上次更新时间为2019年6月26日。
从未遇到过Metaweb–但是Google似乎每天都在变得越来越聪明,并且正在收购任何可能在其霸主地位之前就对其霸主地位构成疑问的事物。
我希望Google的这一举动确实会变得更好,同时也希望Metaweb确实有助于改善Google。我希望最好的。
嗨,约翰,
我没有’收购之前也没有听说过Metaweb。我花一些时间阅读他们的一些专利申请,我认为他们有一些非常有趣的想法。它’很难说他们是否收购了公司以使用其技术,或者“hire”为他们工作的人,或两者兼而有之。
嗨安德鲁,
我认为此次收购有潜力帮助改善Google的业务。听起来谷歌不是’不会对元网站运行的Freebase网站进行任何更改,因此收购发生的任何事情都更有可能影响Google’的搜索结果。我们可能需要等待一段时间才能看到此次购买的影响。
嗨,比尔,
好吧,我同意约翰(第一位评论者)的观点。也许Google只是将MetaWeb视为对其统治地位的威胁。这些怪物公司是怎么做的?在他们构成任何威胁时立即买入比赛?还是我只是有点愤世嫉俗? ðŸ〜‰
来自西班牙的问候。
抢
嗨,罗伯,
谢谢。它’s nice to meet you.
那里’尽管Google在搜索的许多方面确实比Metaweb有了明显的领先,但这种可能性还是有的。’我不确定他们在生命周期的这一点是否真的会被视为对Google的威胁。
但是,我怀疑与Metaweb合作并使用他们开发的技术的机会一定会对Google有吸引力。
如果Google拒绝,像Microsoft这样的人可能将Metaweb作为目标。’t. 🙂
在从未接触过Freebase之后,我在那里进行了访问,而我去的那一页(波士顿红袜)在某些地方已经过时12个月了。除非你’大量的访问者可以自行编辑站点,例如Wikipedia’的过错确实如此,那么即使Google的支持也绝不能保证成功。
嗨史蒂夫,
我没有’之前也没有看过Freebase。我也注意到了一些与数据有关的领域– I’我想知道,既然Google已经收购了metaweb,他们是否会吸引更多的人来添加数据。一世’我不确定收购Freebase是Google’但是,这是收购公司的主要目标。
Google在购买元Web时会采取正确的措施。语义网是互联网的下一代,搜索引擎停止搜索单词,开始真正了解我们正在寻找的内容。
到目前为止,我没有’看不到任何像Freebase一样严重的语义数据库。看起来好像在微软和必应搜索联盟即将建立之时,谷歌仍然在语义网方面迈出了一步。
感谢您的精彩文章。
看起来命名实体可能是另一件事,它将成为搜索结果中的排名因素。对于Google而言,这绝对是一笔有价值的收购。
实际上,我的朋友(想不到的是更多),经过4年的等待,我已经研究了Google今年5月发布的最新专利。算法中的某些功能可以计算人’他所在领域的质量和专业水平。
这意味着,如果许多SEO人员倾向于访问您的网站并引用您和您的文章,则意味着的意义远不止一堆没有明确实体的虚假书签帐户。
我用希伯来语写了这篇文章– Google真正了解冲浪者行为
我曾尝试使用Google翻译供人们阅读。有点奇怪,但信息可以理解。
帐单,如果您看到此内容,而不是它会为此处的任何人提供帮助的质量,请不要’认为我想获得链接!
您可以删除它,尽管我认为将此信息翻译成英文对任何人都可能很重要,
我花了6个小时来阅读所有相关文档和实验以提取此信息。
嗨杜兰,
It’很好笑,但是阅读您的评论的第一句话,我认为您可能在Google购买Applied Semantics时也发表了相同的声明。从许多方面来看,他们在自然搜索领域提供的方法是少看关键词,反而看重这些词背后的含义。
微软一直在努力 对象级 (pdf)搜索方法已经有几年了,您可以在Microsoft Academic Search中看到它的实际应用。他们还有其他几篇关于这种对象级别排名的论文,包括如何将其用于其他垂直搜索(例如产品)中。
Google还花了很多时间和精力在网站上提取有关特定人物,地点和事物的事实,并且’他们可能会采取他们所采取的措施’我们已从Metaweb收购,以构建超越Freebase目前提供的功能的产品。
嗨,亚历克斯,
I’我不确定这种对命名实体的方法是否可能转化为另一个排名因素,是否可能意味着它是一种不同的方法来收集和索引在网络上找到的信息。与其当前帮助网页排名,不如将重点放在如何“facts”在有关特定人物,地点或事物的页面上找到的信息可能会被收集,组织并呈现给搜索者。
将Google从Metaweb获得的技术与他们从自己的技术中获得的技术相结合 变形性的获取,这可能是非常有价值的收购。
似乎Microsoft Academic Search在消除名称歧义方面做了一些有趣的工作,例如,它可以列出许多“Michael Cohen”在学术界,
http://academic.research.microsoft.com/Search.aspx?query=michael%20cohen
嗨,徐学业,
是的,我提到微软’进行学术搜索,并在您上方添加一些注释,以此作为Microsoft如何做到的示例’也不要坐下来对命名实体变得更聪明。
昨天我读了一篇关于《商业内幕》的文章,有人提到Google今年收购了大约50多家公司。其巨大的增长率。向Google致敬。
嗨极客揭秘。
我也读过这篇文章。我希望有办法找出更多有关这些收购的信息–关于它们的大多数细节确实没有’尚未公开,大多数涉及的公司名称都不明。这是一个巨大的增长率。
I’我是阿诺德的忠实粉丝只是想知道他为什么退出娱乐圈并选择政治生涯。我的意思是不完全放弃,但是..你知道我的意思..
嗨,RJ,
阿诺德(Arnold)最近在公众眼中看到了一段艰难时期,但他的故事非常有趣,如果他自传自传,我’d read it.
如果您阅读有关Arnold的Wikipedia文章,那么他参与政治的选择似乎有点矛盾。一位传记作者指出,阿诺德计划通过健美运动参与政治活动,然后将从事政治事业作为获得政治职务的基础。条目的另一部分暗示着Arnold wasn’甚至还没有认真考虑过竞选加利福尼亚州州长,直到他说他会在杰伊·莱诺(Jay Leno)秀上露面。
那里 are rumors out there that he is considering getting back into movies.