All Your Knowledge Bases Belong to 谷歌

分享是关怀!

In a 谷歌 Inside Search blog post, 知识图介绍:事物,而不是字符串 we’re told of a new initiative from 谷歌 to show us more information within search results themselves about the things we search for. This is a potential paradigm-shifting view of what a search engine does. The post tells us:

知识图使您可以搜索Google知道的事物,人物或地点“地标,名人,城市,运动队,建筑物,地理特征,电影,天体,艺术品等”并立即获得信息’与您的查询有关。这是构建下一代搜索的关键的第一步,该搜索利用了网络的集体智慧,并随着人们的了解对世界有了更多的了解。

It’s not a surprise that 谷歌’s been working towards reinventing themselves and what they do. With an increased emphasis on social and real-time search results, 谷歌’一直在将自己转变成一种监控世界各地活动和事件的方式, 近实时监控器,而不仅仅是可能满足情境和信息需求的网页链接存储库。

With this move towards displaying information directly within search results about specific people, places, and things, 谷歌 is tapping into resources like Wikipedia, Freebase (which 谷歌 acquired when they 购买了Metaweb),网络上的其他位置,以及从人们正在搜索的内容中得出的知识,以及他们可能会如何做,例如完善搜索查询。

A recent paper from three 谷歌 Engineering team members, 使用Web和查询日志数据从微博中提取明确的关键字 (pdf)甚至还提供了有关它们如何工作的详细信息,它们是通过对Web文档上进行的统计分析以及从其查询日志中收集到的信息来更好地理解Tweets和Status Updates以及其他社交媒体中表达的思想和概念的。因此,社交媒体也可能是一种可以包含在知识库中的信息源。

A patent application that 谷歌 published in August of 2010, 识别查询方面 提示了这种知识库搜索以及如何将其用于转换搜索结果。我在帖子中发布它的时候就写了, 谷歌 and 元web: Named Entities and Mashup Search Results?

该专利申请中列出的发明人还写了一份白皮书,描述了如何结合来自诸如Wikipedia和Freebase的知识库的信息“named entities,” or specific people and places and things, with information from search query logs, could help to identify different 方面 of those 命名实体, and help the search engine decide what to display about them. The paper is 识别网络搜索查询的方面,最初于2011年3月发表在《人工智能研究杂志》上。

The paper gives us an idea of why 谷歌 might have decided to move towards a knowledge bases model of search with the opening statement:

许多网络搜索查询是探索未知信息空间的开始,而不是寻找特定的网页。为了有效地回答此类查询,搜索引擎应尝试以有助于探索的方式来组织相关信息的空间。

那么知识库结果如何提供帮助“促进探索? ” How does 谷歌 decide what to show about specific people or places or things? The paper tells us that it looks to at least a couple of sources to understand different “aspects”特定命名实体的名称:

Aspector结合了两种信息源来计算方面。我们通过分析查询日志并对其进行聚类以消除冗余来发现候选方面。然后,我们使用大规模协作知识库(例如Wikipedia)来为不太频繁发生的查询计算候选方面,并对可能是“semantically” related.

真的不应该’t come as a surprise that 谷歌 would venture off into this knowledge bases direction. It’s an interest on the part of 谷歌 that could be seen as far back as Sergey Brin’论文发表 从万维网中提取模式和关系 (pdf) in the 90s around the time that he and Lawrence Page worked to transform their Backrub search engine into 谷歌.

谷歌 projects like that described in the paper WebTables:探索Web上表格的功能 (pdf) also shows 谷歌 attempting to extract information from structured tables found within the unstructured pages of the Web to understand the semantic relatedness of data about people, places, and things. 谷歌 Squared was powered 通过 such an analysis and understanding derived from projects like that one.

这种知识库方法不是’如果您查看Google过去两年来如何收集和排名Google Maps的结果,甚至对Google来说都是非常新颖的。除了查看电信目录中的数据库以获取有关特定位置上不同企业和组织的信息外,Google还一直在爬网以查找提及那些还包括地理位置信息的企业的信息。

谷歌 may also determine that a particular site or page is the 权威性 企业或组织的页面,但有些企业,位置和地标’t even have webpages that are included in 谷歌 Maps.

谷歌’的知识库结果提供了有关可能出现在查询中的实体的信息,甚至可以预测和回答后续查询,但是它们是摘要,既可以为搜索者提供价值,也可以帮助进一步探索与搜索相关的方面的主题和思想。如果你’作为网站所有者,被视为这些主题的权威可能不会有任何伤害。

分享是关怀!

关于25条想法“All Your Knowledge Bases Belong to 谷歌”

  1. pingback: All Your Knowledge Bases Belong to 谷歌 | Inbound.org
  2. Thanks for the great post. I for one am excited about the changes that this more knowledge based approach will bring to search results at 谷歌, especially for it’使用社交媒体作为获得更直观结果的基础的意义。我们将拭目以待,这将对小型企业的SEO实践产生什么影响。

  3. Bill then you will enjoy 谷歌 Just Hi-jacked the Semantic Web Vocabulary –语义网.com链接不再可用

  4. 这说得通。

    我的想法是,它们必须显示在具有影响力的排名上,因为它们根本无法增加信号强度,因此它们根本无法增加信号的权重。

    如果他们过于激进地启动此功能,并且在许多SERP上显示该功能,那么许多在线零售商的收入将急剧下降。

    他们基本上是在增补Wiki页面。 Bing向您显示参与度,建议等。他们还有很长的路要走,但是有了新的设计和使用FB的能力,我’m much more eager to see where they end up. With 谷歌, it’s now.. “好的,现在我们该如何解决?”每次更新。

  5. It seems that 谷歌 is duplicating Amazons business model to a degree, “允许卖家出售商品,然后自己挑选奶油” with 谷歌 they are using the data gleaned from millions of web pages and searches, then just serving up the data on the search result page, so cutting out the owners of the websites.

    如果您不这样做,可以确保获得良好的用户体验’无需多次单击即可找到所需的内容。

  6. 丹尼尔,您好

    谢谢。专利申请和我撰写的有关唐的论文’真正将诸如Google Plus之类的社交媒体与这种知识库方法结合在一起。但它’很明显,Google Plus将参与者视为已命名实体。看看知识库方法与Google的交汇点将会是多么有趣’的社交媒体策略。

  7. 嗨,史蒂夫。

    感谢您链接到语义Web帖子。

    I understand why 谷歌 used their own vocabulary in their blog post announcing their knowledge graph search results. They were writing for a mainstream audience, in a way that they could hopefully best understand the changes.

    I’d love to see 谷歌 give a nod to all of the people who have been working on the Semantic Web.

  8. 嗨,布伦特,

    I’m not convinced that 谷歌 showing summaries of Wikipedia information, and links to more information that they believe might be related based upon things like an analysis of query logs related to specific entities is going to take away from searches of pages that provide great information. Even Wikipedia pages

    如果页面依靠回答一个简单的事实答案来接收搜索,那么也许它确实不是’尽力而为。

    此知识库更新似乎与帮助正在对其主题进行探索性搜索的人员有关’不太了解。偶然的搜寻者可能只想知道一些简单的事实,其搜寻范围可能不只是了解某人’的出生日期或地点等。但是谷歌的文件摘要’表示可能只是更深层次的搜索(可能包含多个页面)的第一部分。

  9. 嗨,特里,

    I’我不确定特定页面在本次讨论中是否真的有用,因为它的重点更多是提供人们可能认为是权威的组织的评论或建议。

    I pointed out the way that 谷歌 attempts to find “authority” pages for specific 谷歌 Maps listings because it’s possible that 谷歌 might do some similar analysis of associating different 方面 or attributes about an entity with a specific website or web page.

  10. 嗨,尼尔,

    谷歌’多年来一直在提供网站的文档摘要,以使人们访问包含更多信息的网站。尽管这种知识库方法可能专注于特定的命名实体并提供有关它们的事实和信息,但它还将这些文档摘要与人们可以单击以查找更多信息的来源相关联。

    We can look at this as 谷歌 preempting some searches, but we can also look at it as an opportunity to be the source of the information that 谷歌 displays, and a place were they can learn even more.

    对于许多具有探索性质的搜索,知识库结果不应’产生的搜索较少,但可能会产生更多的搜索,因为它们为搜索者提供了其他主题,使搜索者可以根据一些网站上的许多标题,摘要和URL进行搜索。

  11. 对我来说也很有意义,我的意思是’s what 谷歌 is supposed to do…they make data “findable” so, in turn, all databases will be indexed and categorized 通过 谷歌. Great post, thanks for sharing!

  12. 嗨,莫莉,

    谢谢。在许多方面,我认为仅索引在Web上不同URL上找到的内容比索引与不同实体和概念相关的内容并试图以有意义的方式组织起来要容易得多。它’是一个挑战,但是’可能带来更有用和有意义的搜索结果的挑战。我们’ll see. 🙂

  13. All your base are belong to 谷歌. 😀 All Internet meme aside, it’s a fact that so many people depend on 谷歌 for information. For one, 谷歌 is my newspaper, my grammar checker, my spelling checker, my encyclopedia, etc. This is how millions of people around the world feel about 谷歌, too.

  14. 嗨,布雷,

    上周我和一位邻居谈论他的情况’越来越多地在手机上查找事物,以查找有关对话,电视和其他地方发生的事物的信息。我们的指尖确实比以往拥有更多的信息。它’s in 谷歌’最大的兴趣就是尽可能地提供更好的搜索体验,我认为这些知识图谱的结果是朝这个方向迈出的一步。除了可能回答一些相当简单的问题外,它们还旨在帮助您在学习过程中更好地理解主题的不同方面。’重新搜索它们,以便您的搜索更加富有成果。

  15. 我认为这可以使SERP更加实用,以便用户更快地找到他们想要的东西。
    但是作为丹尼尔,我也认为,看看它对在小型企业中实施SEO有何影响将很有趣。

  16. Pingback:内容唯一性|同义词连接|概念拱|以色列搜索引擎

评论被关闭。