Google如何生成搜索结果片段

分享是关怀!

搜索结果片段

When you perform a search at Google, and you have a set of search results in front of you, how do you decide which result to click upon? How do you judge the page 标题s, snippets, and URLs that you see? How does Google decide what to show you?

A little more than a year ago, Google Webmaster Trends Analyst Pierre Far wrote on the Google Webmaster Central 博客 a post 标题d Better page 标题s in search results. 那里 he told us that Google might sometimes rewrite 标题s for web pages when showing them in 搜索结果片段. The post also told us that Google might do some changing of 标题s when those had generic 标题s such as “home”, or no 标题 at all, or:

我们使用多种信号来决定向用户显示哪个标题,主要是<title> tag if the webmaster specified one. But for some pages, a single 标题 might not be the best one to show for all queries, and so we have algorithms that generate alternative 标题s to make it easier for our users to recognize relevant pages.

Before we consider how Google might decide when and how to change page 标题s (in a follow-up post to this one), there’有关搜索结果摘要的另一个问题,需要进一步探讨。 Google经常根据要查找网页的查询字词来决定可能显示的搜索摘录。

当Google从页面内容中为搜索结果摘要选择文本时,Google如何决定在搜索结果摘要中显示什么?

有时候,Google会使用为页面创建的元描述作为搜索结果片段。否则,Google可能会从页面内容中提取句子或某些信息,而不是显示给搜索者。如果某个页面的元描述写得很好,其中可能包含该页面针对该页面进行了优化的关键字词或短语,并且大约包含150个字符左右,则Google会选择该元描述以显示为搜索结果摘要。但不总是。

有时,页面的排名足以在搜索结果中显示针对某个页面进行了优化的字词或词组以外的单词,而这些单词不是’全部包含在页面的元描述中。有时一页’的meta描述不是’写得好,没有’t包含关键字,页面针对任一页面进行优化。页面的元描述可能非常简短,而且描述性很差,这会使它们成为搜索结果摘要的不佳选择。有时,元描述可能与网站上的所有其他元描述相同。有些页面没有’甚至没有元描述。 Google甚至可以选择使用页面中的内容,即使来自查询的单词出现在元描述中也是如此。

去年三月,谷歌获得了一项专利,该专利为谷歌何时选择从搜索结果摘要页面上显示的内容以及从何处选择文本提供了一些提示。

如果有人搜索的查询词或短语是出现在带有摘要或冗长介绍的页面上的单词,那么如果存在查询词,则Google可能会决定从页面开头提取内容,并在搜索摘要中使用该内容。

如果要搜索的查询词或短语倾向于出现在通常在页面末尾有结论的排名页面中,则Google可能会选择从页面末尾提取要显示的内容。那’搜索结果摘要专利告诉我们的内容:

根据查询和搜索结果生成文档摘要
由Alexandre A. Verstak和Anurag Acharya发明
分配给Google
美国专利8,145,617
2012年3月27日授予
提交日期:2005年11月18日

抽象

文档检索系统生成文档片段,以显示为带有搜索结果的用户界面屏幕的一部分。可以基于查询的类型或查询词在文档中的位置来生成摘要。根据查询类型,可以使用不同的代码片段生成算法。可替代地,可以基于对文档中查询词的位置的分析来生成片段。

我们不’无法确定该专利中的方法是否是Google所采用的方法,还是他们曾经在某一点上使用过该方法,然后又转向了新方法。但它’值得研究专利并了解他们如何做出选择。

多个搜索代码段生成算法

该专利告诉我们,Google可能会根据其对查询的感知,来决定使用哪种摘要算法来确定搜索结果摘要。

Google可能会查看包含查询词的段落长度以及段落距文档开头或文档末尾的距离。

Web上的某些文档可能具有许多与之关联的元数据,例如学术文献中可能包含“作者姓名,标题,出版者,出版日期,出版位置,引用信息,文章标识符(例如,数字对象标识符,PubMed标识符,SICI,ISBN等),网络位置(例如,URL),参考编号,引文,语言等。”

其他文档的元数据可能要少得多,例如博客或电子商务页面。

可能有几种不同类型的规则可用于决定搜索结果摘要–基于位置的规则以及与语言相关的规则。

基于位置的规则

这些规则可用于基于页面中查询词的位置生成摘要。根据段落距页面开头或结尾的长度和距离,可以选择段落或段落的一部分作为搜索结果片段。

可以基于段落的长度和段落到文档中预定位置(例如文档的开头或结尾)的距离来给包括查询词的每个段落一个分数。页面的开头可用于以下类型的文档:“包括摘要,执行摘要或综合介绍”这些文件的开头。

页面末尾可能用于其他类型的页面“包括结论或总结” at their end.

语言相关规则

除了选择摘要外,还可以使用一些语言规则。

语言相关规则的示例:

  • 该段中有多少是标点符号
  • 该段落以标点符号还是命题结尾
  • 该段中的任何单词是否过长
  • 段落中粗体或斜体字的数量

包含所有查询词的某些段落(部分或全部)可能由于其他原因而无法作为摘要的选择。这些段落的得分可能为0,因为它们:

  • 小于特定阈值
  • 主要是标点符号,或者标点符号超过特定阈值
  • 特定于失败语言的规则
  • 包含超过特定阈值的斜体或粗体字
  • 根据查询类型(页面倾向于显示包含摘要的结果页面,或者倾向于得出带有结论的结果的页面),离页面的开头或结尾相距太远

所选的搜索结果摘要可能来自页面中得分最高的段落,或者“第一段得分超过阈值。 ”

可以从该段中选择一个片段,它可能是:

  • 所选段落的预定单词数,例如该段落的第一个预定单词数(例如25个单词)
  • 该段落的前一个或多个句子(例如3个句子)
  • 包含至少一个查询词的中间部分(例如50个单词)
  • 整段

结论

我从这篇文章的开头提到,有时Google可能会更改搜索结果中页面的标题或代码段,前提是他们认为这样做可能会导致点击后页面的点击次数增加’出现在搜索结果中。我们将在下一两篇文章中讨论。什么’重要的是,Google确实有一个流程可以确定在显示不’t来自页面上的元描述。

如果查询返回的搜索结果页面倾向于是包含摘要和元数据的页面(例如作者),则Google可能会从页面顶部加权的段落中选择一个片段。’s name, a publisher’的名字,等等。例如,这在查询学者姓名时可能是正确的。

如果为查询返回的搜索结果页面通常以结论结尾,则Google可能会从页面底部的段落开始选择一个摘要。

其他信号,例如段落的长度,标点符号的数量,粗体和斜体等等,也会影响Google的选择。

为什么决定要显示哪些搜索结果片段如此重要?

搜索结果页面中的代码段可以确定是否有人可以从搜索结果页面中单击。如果您在网页上的排名很高,但没有人从搜索结果中选择您的网页,那将是可悲的。

上次更新时间为2019年6月8日。

分享是关怀!

27个想法“Google如何生成搜索结果片段”

  1. 有趣的东西。一世’我很期待您在我暗示的未来职位’m seeing lots of 标题 changes in the SERPs lately, especially rearranging order to emphasize brands.

  2. 好东西比尔。

    I’m in the process if writing and 文章 about SERP engagement and looking at how to improve click through rate through optimized 标题s, meta, rich snippets, universal media etc. but the Google folks never want to make it that easy 🙂

    我们(与我合作的人)去年开始注意到改写,最容易在品牌搜索结果中发现,其中可点击链接通常比实际标题短得多,得出的结论是,这完全符合确定的意图。搜索品牌名称,并且无需特别注意(如果可以将事实视为逐渐分散注意力),因此Google只是将品牌显示为可点击的链接,而不是完整的标题标签。

    如前所述,深入研究Google如何显示搜索结果,我们相信目标始终是展示与Google更匹配的内容’对搜索者意图的解释…改善点击信号并推断出更相关的结果。

    干杯

  3. 那’很高兴知道。坦白地说,我以前认为Google仅从meta-descp中获取摘要。是的,有时我过去在我的网站的搜索结果中得到错误的摘要。我试图解决它。现在我知道了秘密。

    Bill感谢您分享ðŸ™,

  4. 我一直以为他们在找出摘要时会从元描述中摘取。很有趣,因为我’我一直在使用网站站长工具更密切地监视我的网站,’ve发现了更一致的结果;至少显示我想要的预期结果。

    能够’等待下两个部分! ðŸ〜€

  5. 嗨,比尔,希望您一切都好,并感谢您的见解。实际上,标题是SERP中的关键’s and according to what the user sees, he will click or not. In terms of SEO, it is relevant to take time and think about the 标题s of his website. And or the meta description as well!

    Besides, it is true that your original 标题 may appear differently according to the search terms. Like Jim, I recently saw many changes in the display of the 标题s in the SERP’s.

  6. I’最近,我注意到Google通过在前面加上网站的品牌名称来玩弄网站标题,我发现这很有趣。我最初注意到这是我所工作的公司(这只是一家中小企业),所以它’对于那些声称Google只在大公司中胜出,但只有一个小论点的人,绝对是一个论点。

  7. 嗨,比尔,这是我摘录中最好的帖子之一’我碰到过。但是,当您建议‘Google有时会认为更改搜索结果中显示的页面的标题或代码段可能会导致页面点击次数增加,因此他们可能会对此进行更改’,我发现自己难以置信。 Google会无私地做任何事情仍然是一个神话概念。他们是自私自利的…

  8. 对于SEO,我总是读(并被告知)页面顶部的内容是最重要的,并且如果页面很大,则末尾的部分甚至可能不会被抓取。也许我需要更加注意网站上页面的结论!

  9. 嗨,比尔,我以为我明白你在说什么,但后来发现我没有’t really – or at least I’m a bit confused – probably my fault.

    我知道,如果Google搜索查询的目标关键字不是文章或我们的元描述中我们的主要优化关键字,那么Google可能不会使用我们精心制作的元描述。

    但是随后您将讨论Google用于对第一段和最后一段进行评分的特征–知道这很有用– thanks. But –

    I’在Google为什么会选择其他元描述以及Google为什么不会从第一个和最后一个参数中选择斜体和粗体之类的链接之间造成了困惑。

    当Google想要从我们指定的元描述中选择一个不同的元描述,并且第一段和/或最后一段的得分为零时,会发生什么?

    我不’看不到一个与另一个之间的关系–Google会放弃,然后根本不列出我们的文章吗?

  10. 嗨,卡罗姆。

    当Google决定使用页面中的内容而不是元描述时,它可能会在页面上的不同段落中评分,从而在其中找到用于查找页面的所有查询词。

    对于倾向于以摘要或冗长的介绍(如在搜索结果中显示的页面中所示)开头的查询,它可能会开始探索从顶部开始的段落,然后逐步向下浏览页面。

    对于不符合条件的查询’为了从摘要或导言开始,但得出长结论(同样,页面显示在该查询的搜索结果中),Google可能会从页面底部开始探索段落,然后逐步向上。

    Google将显示的摘录片段’不一定来自第一段或最后一段,而是取而代之的是基于一些不同的评分规则,或者第一段它根据这些规则认为得分高于某个阈值。

  11. 码头,我不’t think it’对于Google想要增加点击率,这是无私的(至少对网站运营商而言)。这些页面是Google为响应查询而返回的页面,因此,他们希望以表明他们正确选择它们的方式来显示它们。如果是元描述和标题,我们’书面未能证明(在Google中’的观点),我们的网页是真正相关的,Google’我们将寻找自己的方式来演示它,以便让搜索者知道它知道什么’s doing.

  12. 我注意到,有时Google搜索结果包含约150个字符的元描述,有时还包含相关段落中的3至4行。实际上,Google更加智能,并且每天都在改善搜索结果。

  13. 我又回来阅读您的博客。我敢说您拥有我所见过的关于SEO的最佳博客。我可以告诉你,它投入了很多思想。感谢您的资源。星期五快乐:)

  14. 伟大的比尔!它’Google决定这样做很有趣。在我看来,似乎这些更多的步骤应该鼓励人们围绕主题或概念(不一定是一个关键字词组)构建页面。

  15. 感谢您为撰写本文所付出的努力。我的要点是没有办法控制代码段。

    您提到了Google可能用来提取元数据的许多变量…我想目前我能做的最好的事情就是总是编写一个关键字丰富且结构良好的元描述,并在可能的时候添加引文。

    如果我错过了什么,请告诉我。谢谢。

  16. 在我的一个旧网站上,Google制作了一个,¢â€,â€,â€,a摘录–我不敢继续…。和客户,甚至更多)

  17. 进行搜索时,除非特别难以查找或固定下来,否则我从不单击前几个链接,也从不单击赞助商链接。我尝试进行长尾短语搜索。它’尽管我对您所说的片段很有趣’我试图绕开它,我只是不’似乎正在得到它。

  18. 那 very interesting! I wonder how they determine which is going to get top spot? A rich 标题 might have some bearing but it probably reverts back to how many links they have.

  19. Google有很多方法可以生成摘要。您可能会看到导航页的摘录,列表中的每个项目都有点点滴滴,有时是从元描述的一行开始。
    尽管生成这些摘要需要花费大量时间,但是这可能会导致较高的点击率,并对您为获得最佳结果而应实际使用的元描述提供一些见解。

  20. Pingback:关于Google代码段|网络搜索指南和互联网新闻
  21. 我的堂兄在8个月前尝试创建一个完整的网站,但他没有’不要放置任何元描述来测试此Google’s “auto-snippets”. He didn’真的喜欢谷歌 ’正在做他在SERP上的页面。因此,也许最好的办法是(仍然)编写高质量的元描述。这是创建网站内容时最被忽略的事情…但是,如果您可以花一些时间和技巧来做到这一点,那也许是值得的。

  22. 有趣的话题。至少现在我们有了一个想法,即每次我们按下搜索按钮时,它如何对Google起作用,以及它如何实现窍门。我实际上想知道它是如何工作的。这是我脑海中所有问题的启示。感谢您的回答。

评论被关闭。