如何在搜索中使用知识库实体

分享是关怀!

当Google搜寻网络以收集有关对象或实体的信息时,它还会收集有关这些实体的事实。这些事实分为与这些实体相关的不同类别或属性。例如,一本书可能具有诸如作者,出版商,出版年份,可以称之为家的网站,体裁等属性。

通过实体属性识别实体

包含那些属性的搜索可用于识别属性可能与之关联的实体。

谷歌最近获得了一项专利,该专利描述了如何在属性数据存储区中搜索这些属性以找到实体。该专利说明了如何使用其中描述的过程来回答一些复杂的查询以及一些交互式Answerbox类型的查询。该专利解决的问题可以归纳为一个问题:

What entity of a generic type, e.g., book, medical condition, or 电影, is associated with the features named in the query?

因此,用这种方法可以回答的一个查询可能是诸如“What is the 电影 where 罗伯特·杜瓦尔 loves the smell of Napalm in the morning?”

Movie attributes used in query to identify 电影

In this first 电影, the attribution data store might tell us that 罗伯特·杜瓦尔 is an actor in the 电影, and it might also tell us that he has a memorable quote in the 电影 about loving the smell of napalm in the morning.

通过在数据存储中搜索该查询中列出的属性,“Apocalypse Now” is identified with a certain level of confidence as the 电影 being looked for, and a query for the name of the 电影 is sent to the search engines so that results for it can be returned.

Another query about a 电影 might be, “克里斯汀·斯莱特(Christian Slater)拥有狒狒心的电影。”

A query where attributes about the 电影 Untamed Heart are ued to search fo the 电影

In this query, Christian Slater is an actor in the 电影, and one of the plot elements is a rumor that he has a baboon heart. So there are two attributes identified with this 电影 that a search of the attribute data store can be used to identify which entity is being looked for.

A search of the 电影 is conducted 通过 the search engine so that search results for it can be returned.

如专利说明所述,可以进行类似的查询,其中涉及查找其他实体,例如书籍,人物或歌曲。

可以选中属性的Answerbox

但是该专利还描述了一组更复杂的实体, 一个盒子 允许您输入症状的方法,并询问您是否要包括其他人来识别特定的医疗状况。

我尝试了其中一些搜索,但没有’不能获得与专利中确定的结果相同的结果。

我不’不知道那是技术限制还是商业决定–Google是否应根据与之相关的症状来识别医疗状况?

医疗状况Onebox,搜索者可以在其中检查与他们想了解的医疗状况有关的症状。

该专利确实告诉我们,医疗状况是特定的实体类型,这些症状是实体的属性。

该专利是:

使用搜索结果识别实体
由Thomas A. Lasko,Andrew Tomkins,Michael Angelo,Matthew K.Gray,Russell Ryan,Namarata U.Godbole和Roni F.Zeiger发明
Assigned to 谷歌
美国专利8,775,439
2014年7月8日授予
申请日期:2011年9月27日

抽象

用于使用搜索结果识别实体的方法,系统和装置,包括编码在计算机存储介质上的计算机程序。

  • 这些方法中的一种包括确定第一搜索查询包括对一个或多个预定属性中的每个属性的相应文本引用的动作,其中每个属性与第一实体类型相关联。
  • 对于第一实体类型的多个实体中的每个实体,生成包括第一搜索查询和实体名称的组合搜索查询;
  • 使用针对每个相应实体的组合搜索查询来获取多个实体中的每个实体的搜索结果,并使用所获得的搜索结果来生成组合搜索结果以包括在对第一搜索查询的响应中。

外卖

I’一直在为寻找和确定站点上的实体以及应包含在这些站点上的实体的客户进行几次实体审核。

了解与那些实体关联的属性也是一个重要元素,就像在搜索结果中可能作为相关实体出现的实体一样。

该专利显示了如何在查询中以您的实体可能包含的属性为重点的搜索结果中找到您网站中的实体。

这是与蜂鸟搜索不同的语义搜索,它可能涉及重新编写冗长而复杂的会话查询

I’撰写了一些有关命名实体的文章。这些是我想分享的:

最近更新时间六月26,2019

分享是关怀!

关于10条想法“如何在搜索中使用知识库实体”

  1. 可能是一个很棘手的问题,但从实际应用的角度来看,这是您可以帮助客户确定其站点上的潜在实体,然后通过围绕这些实体创建结构化数据来指导他们的想法–使属性Googs可以更轻松地链接到查询?一世’受到所有语义动作的吸引,但仍在逐步探索使其易于消化的方式…

  2. 哦,天哪!!那’深入研究。我完全不知道这一点。这与Microsoft提供支持的ERD(实体识别和消歧)项目有关吗?知识图肯定是该实体关系的结果。我很期待某些实体是否可以通过结构化数据标记使网页受益,或者是否有其他好处可以使网站站长在搜索引擎中排名较高。向Bill.Love致敬,以探索更多相关信息。

  3. 真有趣的见解,比尔!

    包含此复选框,可以进一步缩小搜索范围,将滴答声用作AND和NOT搜索运算符的更简单替代方法– that’对于获得更好的用户体验,这是一种非常好奇的方法。

    尽管在此特定示例中,我对是否应向人们提供与他们列出的症状相关的一系列可能的疾病存有某些保留。我不’认为不应允许搜索引擎对一个人可能具有的健康状况做出假设,即诊断其用户。想象一下人们甚至孩子尝试以自己的某些东西对待自己的风险’ve被Google说过(那里有很多容易受骗的人–毫无疑问)。但是,与疾病相关的示例也可能仅用作说明算法的全部内容,因此我赢得了’不要读太多。

    另一个有趣的部分是搜索结果可能会受到先前查询的影响;“可以训练查询分类器来添加先前提交的查询中的词条,这些词条出现在与”。因此,如果从同一查询的搜索结果中选择2个实体,则搜索引擎可能会认为它们同等重要,并将这两个实体合并到以后的搜索结果中:
    “这两个条件然后可以以单个链接的形式呈现,例如,带有关联文本“皮肤疾病(例如牛皮癣,湿疹)。”用户可以选择链接来获取搜索结果,例如,包含以下内容的查询“skin diseases,” “牛皮癣和湿疹,” or both.”

  4. 这是基于实体的搜索还是基于关键字的搜索?正在搜寻“movie 罗伯特·杜瓦尔 loves Napalm morning”根据查询中找到的各个关键字,将给出几乎相同的SERP。谷歌取代“movie” with “film”虽然。如果确实是基于实体的搜索,则Google会通过其索引搜索以下内容:“Apocalypse Now”.

  5. 嗨,比尔,
    惊人的研究… Didnt knew that.
    谷歌长期以来一直是基于实体的关系专利和研究。我认为Microsoft正在进行类似的研究,但对此了解的细节并不多。必应还进行了更新,使其搜索效果更好,但要与Google竞争,还有很长的路要走。

  6. 您的研究太好了,我很高兴阅读此博客。这个知识库博客对于正在浏览的互联网用户非常有用&每天冲浪。根据我的知识,当您找到任何实体时,您首先对该实体有充分的了解,例如与哪些主要事实有关&如何通过这些事实找到答案。您的示例是本文的全部知识,这是描述您的想法的非常简单的方法。我认为Google是世界上最好的搜索引擎之一&它对您的搜索非常容易找到,对于任何搜索引擎而言,最重要的是如何工作以及如何满足用户的要求。谷歌使用最佳属性来查找任何查询,我非常喜欢谷歌其他搜索引擎。

    谢谢

评论被关闭。