某些搜索会用主题替换关键字吗?

分享是关怀!

The example for the post I was writing for today appears to have been hijacked 通过 the Simpsons. They made an apology to 犹大 Priest, after referring to the band as a death metal band. The image below is from a Guardian 新s 文章 on the apology 目前在搜索该词时排名很高“Judas”。请参阅下面的搜索结果:

Bart Simpson writing on a bulletin board that 犹大 Priest is not a death metal band.

根据Google的一项专利,我想展示一组来自Google的搜索结果,这些搜索结果可能是基于Google匹配帖子主题而不是关键词的,这可能有助于提高搜索结果与视频和媒体丰富的结果的相关性使用该示例在2013年最后一天授予。

google-topic-search-results

基于主题的搜索结果

这里’是该专利中的示例,它使我们对Google的看法与我们大多数人一样’即使我们中有些人写信说Google可能会开始更加关注 concepts rather than specific 关键词s,即使我们’我们已经看到Google在 蜂鸟更新 那不’t match all 关键词s within a query.

举例来说,考虑一个包含单词的搜索查询“Judas.” That word, “Judas”可以映射到某些领域主题,例如“Born This Way” and “Lady Gaga.” “Born This Way”是流行专辑的名称,其中包含一首名为“Judas,” and “Lady Gaga”是创作该专辑并演唱歌曲的歌手“Judas.”

传统的基于关键字的搜索引擎只会返回带有单词的结果“Judas;”但是,即使这些结果不包括单词,所公开的基于主题的结果也可以包括相关结果。“Judas.”

例如,这样的相关结果可以包括单词“Lady Gaga” or “Born This Way” and so forth.

因此,即使用户不知道那些相关歌曲的标题,基于主题的搜索结果也可以包含来自同一专辑或同一艺术家的许多其他结果。

该视频是否针对“Judas”出现在这些搜索结果中是因为Google进行了基于主题的搜索,还是Google会根据PageRank和相关性将其高度返回?

我们可以’不能完全确定,但是该专利值得仔细研究和思考。

多种资源来识别主题

阅读有关可能的排名更新的专利并确定是否已使用专利权利要求和/或说明书中的方法可能非常困难。

如今天上午发布在一篇论文上的文章所述,目前可能存在一些技术限制,可能使Google无法将主题完全纳入这种算法中。 Freebase Google Plus页面.

纸是 信任,但要验证:预测知识库构建和管理的贡献质量 (pdf)(强烈建议阅读!)在我提供专利链接之前,这篇论文的这段文字让我想知道Google可能准备如何开始使用主题对网页进行排名:

尽管本文未报告这些结果,但在开发过程中,我们检查了概念空间和专业知识表示中哪一个最有用。我们的分析表明,分类法和谓词概念空间比大型主题概念空间更有用。

这是因为“主题”概念空间具有数百万个主题的顺序,因此对于用户贡献不多的三元组来说,分布的专业知识分布过于稀疏。

这篇论文很好地解释了Google如何将用户的贡献整合到Freebase中,看来基于主题的贡献可能还不如其他贡献有用。虽然Freebase确实提供了Google使用的信息’在知识库的基础上,Google可能会寻求其他资源来更好地理解诸如主题之类的内容,例如 公开信息提取.

Google的专利是:

根据主题搜索查询结果
何建明和张凯文发明
分配给Google Inc.
美国专利8,620,951
2013年12月31日授予
提交日期:2012年6月1日

抽象

本文公开了用于将结果返回到基于主题的查询的系统和方法。当搜索视频或其他媒体内容时,所公开的各方面尤其有用,与其他类型的内容相比,其相关的文本信息通常相对稀疏。

通过基于给定查询的领域主题的条件概率将查询中包括的一个或多个单词映射到一个或多个领域主题,可以将与查询相关联的文本在语义上与各种领域主题相关联。可以基于给定领域主题的结果的条件概率来标识一组结果。

当然,此时是否需要从知识库中获取基于主题的信息也需要询问。

Google可以在其他地方获取该信息吗?

开放信息提取方法是Google找出此类信息的一种方法。 Google似乎使用自动化的方式来获取信息,并采用众包的方式,例如向Freebase之类的地方捐款的人。它’两种类型的资源很有可能相互帮助。

基于概率的查询和结果主题

该专利告诉我们,确定主题的重点取决于与主题相关的概率的计算,并且可以分解为几个步骤或任务:

首先,可以基于查询来识别领域主题。其次,可以找到这些领域主题的代表性结果。这些任务可以通过分析与过去查询相关的适当统计信息并计算各种条件概率来完成。

然后,该专利继续提供更多细节,并提到如何使用一些其他信息。

给定查询的领域主题的条件概率P(T | Q)可用于将领域主题映射到查询。给定领域主题的结果的条件概率P(R | T)可用于识别基于主题的搜索的结果。 P(T | Q)和P(R | T)这两个概率可以通过本文详述的各种方式确定。在一些实施例中,用于确定P(T | Q)和P(R | T)之一或二者的某些概率可以由外部组件确定,并且那些外部产生的概率(如果可用)可以被利用。

I’最近写了关于Google可能如何识别帖子中的相关实体的文章, 与网站和相关实体的实体关联.

该专利告诉我们,Google可能会以类似的方式更好地理解主题,以便查询“astronomy”可能会被视为包含以下内容的主题“Hubble images”,即使其中的单词“astronomy” doesn’t appear on the page that shows the 哈勃图像. (Another example from the patent.)

Popularity Based on Things such as 观看次数 and (YouTube) Likes

我没有’看过Google专利指“likes”以前可能会影响排名的方法,但是这一方法确实可以。什么’s not clear here is that the 喜欢 being referred to are mostly likely YouTube Likes instead of 脸书 Likes (though the patent doesn’不能区分一个。)

该专利告诉我们,没有实际引用天文学的哈勃视频可能会作为搜索结果返回,原因是:

(1)确定“astronomy” and “Hubble images”是相关的概念;以及
(2) The result is popular according to certain indicative metrics (e.g., views, 喜欢, etc.).

“Views”结果有意义’是一个视频,但专利’的索赔部分没有’即使专利已将这种方法限制为仅视频’的说明说,它们可能是这种方法的一个很好的选择,因为与视频之类的事物相关的文本往往会受到限制。

拿走

该专利中的过程没有’似乎尚未生效,但似乎是Google将来可能会做的事情–与其说他们是否会这样做,不如说是什么时候的问题。

I’我现在将继续关注搜索结果’t include 关键词s within the actual query but appear to be related 通过 topic.

你呢?

分享是关怀!

关于29条想法“某些搜索会用主题替换关键字吗?”

  1. I’m definitely noticing topical results for this already for many searches (not for media or video) for clients. 人身伤害 lawyer for example, 我可以 search “car accident lawyer”它将返回人身伤害作为突出显示的关键字。

    Great post 法案!

  2. 我不’不知道,似乎他们在迫使这些改变提前了一段时间。就我个人而言,我仍然喜欢基于关键字的搜索的想法,只是因为机器无法很好地理解概念。

  3. 法案… Belive this is already happening to a large degree, where Hummingbird is the understanding-of-meaning-not-the-message, not 关键词 type match.

    唯一的问题是“when?”关键字字符串值是否会逐渐变小,我认为’当链接,链接锚文本,引荐页面内容/标签等的权重降低到‘traditional’链接不再重要,并且增强相关性/权威性的引用或数据库主题连接成为‘new’链接果汁。 (也在某种程度上发生了)

    干杯

  4. 我也已经看到了这种情况,这使我想知道Google是否在申请专利之前测试其技术发展。我认同。它’所有行业中的发明家通常在申请专利之前先制作其发明的原型,以便他们能够解决问题并将其知识与工作模型结合到专利申请中。

    我认为Google实际上已经有一段时间了。

  5. 当您在同一句话中有《辛普森一家》和一个受欢迎的死亡金属乐队时,它’在Google上排名很好。这就是为什么我总是无意中添加“Justin Bieber”到我所有的文章。它’当然,这纯属偶然。江南风格。

    “基于诸如观点和喜欢之类的事物的受欢迎程度” –我以为这是理所当然的,特别是因为Google Authorship变得如此重要。页面浏览量肯定也会显示出来。我想知道Google将如何打造Biz Stone’的Jelly应用程序,它为搜索可能性添加了新的动力。他们对问题的答案似乎是花费大约30亿美元购买犯罪者(例如和位智),因此’会很有趣。

  6. 一段时间以来,Google一直跟踪点击和与搜索广告的互动来确定质量得分。他们对个人进行相同的评论。对于他们来说,使用他们自己的点击流数据进行查询以返回最被选择的结果以及在用户专注于他们要查找的特定信息或结果时从用户进行查询转换是有意义的。我不确定算法(蜂鸟)是否能更好地理解语义是唯一的推动力,历史用户行为很可能也是一个强烈信号。

  7. 自Hummingbird以来,我一直在寻找这些示例性查询,但是正如您注意到的那样,很难确定100%的查询确实突出了Google自8月以来确定意图的方式…
    至今… ‘missed tv programme’返回英国的追赶和点播电视结果(第一个结果敌人没有单词‘missed’ on the page).
    ‘festive exchange’ gives a lot of Christmas related results at local theatres. Again, not direct 关键词 matching there either.
    我会继续寻找

  8. Google在做正确的事,并将更多的精力放在用户身上。关键字搜索在很长一段时间以来一直风光无限,现在Google搜索的未来又如何呢?感谢这篇详细的帖子。

  9. Hi 法案,

    感谢您为分析Google所做的出色工作’s patents.

    我认为看到Google只看YouTube有点奇怪’ indicators…其他视频平台或那些将视频存储在其服务器中的站点又如何呢?他们是否会信任外部评级来源,也许会使用熊猫作为衡量其是否可信赖的方式?

    只是想 ;)。

  10. 接下来,三句教他们如何教GoogleBrain?

    It’现在越来越少的搜索算法发展成为专家系统,它可能赢得了’直到可以解析自然的人类语言(打字或口语)。

    这里’内容丰富的阅读(您’ve可能涵盖了它):

    http://www.google.co.in/patents/US20060166174

    感谢提供这篇好文章。

  11. 您如何看待Google偏爱自己的社交媒体的明显趋势?许多博客都报告说,与Facebook相比,Google +与搜索的联系越来越紧密。您认为这种情况将来会继续吗?

  12. 相关性在,匹配关键字在外。这是一个很长的期限,对于某些搜索已经实施了。我相信,随着时间的推移,我们将在越来越多的查询中看到这些结果。很棒的文章。基本上,关键字会保留,只是在我们的查询范围内结果会更广泛。

  13. 我同意以上一些评论。一世’我不太确定搜索引擎是否已准备好放弃关键字的概念。有时候好像在那里’改变只是为了改变,而我不’觉得这是进步或生产力的标志。还是’s nice to see 新 technologies rise.

  14. Great piece 法案. This is going to lead to a piece of great content receiving more traffic than it previously would.

    It worries me a bit that popularity would be based on views and 喜欢 since those factors are easily gamed.

  15. 我认为尝试将广泛使用的搜索平台更改为基于主题的搜索对人们来说非常困难。我认为基于主题而非关键字的结果质量会很糟糕。 Google一直在确定清除垃圾邮件结果并对相关垃圾邮件进行排名的最佳途径,那么为什么要改变它呢?如果是’t broke, don’t fix it.

  16. 法案,这是一篇不错的文章,我真的想一想,在蜂鸟Google试图捕捉人们用来搜索某物的长尾搜索查询之后,它的主要思想是什么,它影响了关键字,但关键字也具有结果与以前相同。我们需要做的是通过使用关键字来优化我们的网站,但是最好使用长尾关键字,这些关键字更有助于在SERP中获得更好的排名。

  17. 我在基于主题的搜索结果中注意到,有时由于某些拼写错误或与您的研究术语最相关的关键字而替换了关键字。有人说,在Hummingbird更新之后,关键字系统就告一段落,因为现在Google会考虑整个研究查询,而不是单个关键字。阅读您的文章后,我就能理解在搜索引擎中替换某些关键字的逻辑。

  18. 很棒的帖子!看来我们似乎正朝着这个方向前进,’在Moz博客和其他博客上看到的是,我们需要开始专注于和优化关键字主题的内容,而不仅仅是关键字本身。

  19. You give a 新 idea and I really appreciate it but I still force on 关键词 based search. Google updates specially design to catch and crawl on 关键词 based search. As you say about the topic this can happen in some cases so you can’t take it lastingly as Google makes changes in algorithms.

  20. Insightful as always 法案 –我想这是一段时间以来我们已经看到的同义词的自然发展/延伸?

    对‘old school’ SEO – ‘keyword’ led search campaigns, 关键词 specific tools, exact match domains etc…。继续推动大品牌,‘authorities’.

评论被关闭。