谷歌 Defines Semantic Closeness as a Ranking Signal

分享是关怀!

这篇文章可能会让您从与以往略有不同的角度思考将标题元素和网页上的列表用于SEO的好处。

谷歌使用大量信号来确定搜索结果中显示的页面顺序。这些信号中的一些信号可衡量网页的质量或重要性,而其他信号则可指示页面与输入到搜索引擎中的特定搜索查询的相关性’s search box.

一个相当明显的相关性信号是查询中的单词是否出现在可能是该查询的搜索结果的页面上。如果这些单词在页面上出现不止一次,则该页面对于该特定查询可能比其他仅出现一次或根本不出现这些术语的网页更具相关性。

另一个可能表明页面与一组特定术语的相关性的因素是这些术语在页面上的接近程度。尽管您可以轻松地计算各个查询词之间的词数来确定它们之间的接近程度,但是网页的格式给简单地计算词间词的方法提出了一些挑战,例如在如下列表中:

An example HTML list, using the heading 土星 Facts and listing several astronomical facts about 土星, including orbit, rotation period, mass, volume, and 距离 from the sun.

想象上图中的列表是出现在特定网页上的所有列表。由于列出的每个项目都与土星有关,如页面标题所示,因此可以说,从语义上讲,每个列表项在紧密度方面都与土星同等重要,即使列出的项目距土星标题的视觉距离有所增加计算之间的字数时列出“Saturn” and list items.

This way of calculating semantic closeness means that the page this list appears upon is equally 相关的 for the terms “Saturn Mass”, “Saturn Volume”, and “Saturn 回转。”

本周授予的一项Google专利探索了当单词出现在诸如列表之类的语义结构中时,搜索引擎如何查看单词之间的紧密程度,从而确定页面与包含这些单词的查询之间的相关性。

该专利于2004年提交,但是它提供了一种思考方式,可以使搜索引擎如何解释网页上的语义结构,而该语义结构在表面上可能并不明显。

Document ranking based on semantic 距离 between terms in a document
由Georges R. Harik和Monika H.Henzinger发明
Assigned to 谷歌
美国专利7,716,216
2010年5月11日授予
归档:2004年3月31日

抽象

公开了在文档中定位隐式定义的语义结构的技术,例如HTML文档中的隐式定义的列表。语义结构可用于计算文档中术语之间的距离值。

距离值可用于例如排名分数的生成,该排名分数指示文档与搜索查询的相关性级别。

用于确定语义结构的HTML格式

这种方法背后的过程的一部分涉及到搜索引擎分析页面上的HTML结构,查找页面上的标题和标题,无序列表(<ul>)和有序列表(<ol>),嵌套表,div和换行符(<br>),可用于在页面上布置项目列表。

页面标题可能使用实际的标题元素,例如<h1>或较大的字体,例如<font size=16>,并且该标题下的文字可能会被视为属于该标题。

换句话说,搜索引擎正在尝试定位和理解页面上可能在语义上有意义的视觉结构,例如与标题相关的项目列表。我们’再次告诉我们,此过程可能还会寻找其他有意义的语义结构,而不仅仅是列表。

涉及到标题和列表项中出现的单词之间的距离时,该专利为我们提供了以下规则:

  1. 如果两个术语都出现在同一列表项中,则认为这些术语彼此接近;
  2. 如果一个术语出现在列表项中,而另一个术语出现在标题中,则可以认为这对术语与出现在标题和另一个列表项中的另一对术语大致相等。
  3. 出现在不同列表项中的成对术语可能被认为比属于1和2的成对术语更远。

So, in the 土星 example above, the words “Saturn”(从列表的标题开始)和“Distance”(来自最后一个列表项)被认为比单词更靠近“Days” and “Rotation” even though “Days”是第一个列表项的最后一个单词,并且“Rotation”是第二个列表项的第一个单词。

The HTML list from above showing that 土星 and 距离 are semantically closer than 天 and 回转。

结论

这项Google专利早在2004年就提交了,但确实提出了一些有趣的想法,有关搜索引擎如何看待诸如列表之类的语义结构,以确定页面与特定查询的相关性的一个方面。

您现在是否以不同的方式考虑标题和列表?

分享是关怀!

关于48个想法“Google将语义接近度定义为排名信号”

  1. I’很高兴我偶然发现了这篇文章。这是否意味着在内容中包含列表可以帮助您提高SEO?这对排名有多重要?

  2. I’ve总是避免列出认为对SEO不好的东西,但您的这篇帖子使我感到启发,毕竟链接还不错。谢谢。

  3. 非常酷的见解。去表明,如果你想排名“Saturn Volume”,如果您以合理的方式组织内容,从技术上讲,您可能不需要将这两个关键词配对。

  4. 嗨,多米尼克

    SEO中这种语义结构的概念可能有助于优化页面。它提供了一种思考方式,使搜索引擎可以确定哪些页面可能与某些查询相关,而这些查询可能与人们过去怀疑的内容有所不同。

    列表通常比纯文本块更容易在监视器上阅读,并且它们可以以一种易于访问页面的方式进行扫描的方式来呈现信息,是一种有用的方式。它’Google可能会使用页面上不同单词之间的距离作为信号,表明如果这些单词出现在查询中,则该页面与这些单词之间的相关性,并且列表等结构内的语义紧密性概念对该概念具有重要意义。

  5. 嗨安德鲁,

    您’重新欢迎。从纯粹的可用性立场来看,项目符号列表可以使人们更有可能阅读您页面上的内容。见Jako Nielsen’s 文章 用户如何在网络上阅读

    谷歌的专利指出,列表也可能会从SEO立场中受益。即使Google不是’使用这种方法,使用页面上的列表可能会导致更多的人更彻底地阅读您的内容。

  6. 嗨,杰里米。

    在阅读专利并得出该结论时,我感到非常兴奋。

    I’一直建议出于可读性考虑在网站上使用列表,因此’很高兴看到它们也可能从SEO立场也有价值。

  7. 我一直在设计使用诸如h1标签之类的标题作为关键字的网站。将列表添加到混合代码证明是一个很好的公式。我当然不能’受伤了有测试依据吗?一世’d想举一些适当的术语解析和结构的例子。

  8. 本文非常符合我们的一些实验性布局’最近一直在合作。具体来说,我们 ’ve发现CSS浮动在以不牺牲美观性的情况下在导航开始时放置更多SEO友好术语的方式来构造导航很有用。很高兴看到其他一些战术付诸实践。

    安德鲁·古蒂
    博尔德SEO

  9. 很好的文章!
    我特别觉得这很棒,因为这给Google提供了更多学习关联词的可能性,这对于任何SEO都是重要的因素。

  10. 我从来没有真正喜欢过列表,也从来没有从众谈论过SEO的好处。(我知道这是刚刚获得的专利)。看起来我会在适当的地方多使用一些列表。

  11. pingback:» Pandia Search Engine 新s Wrap-up May 15
  12. 有趣,但是作为一个相对新手,细节对我来说有点深。列表很整洁,可以提供一些信息,我会在适合时使用它们,但是我’我不确定我是否可以将一些列表整理成页面。

  13. 嗨,超级巨星,

    如果你不这样做’没有一个可以测试类似内容的网站’开始一个还不算太晚。一世’d建议开发一个或多个。它’这是一个好习惯,这样你就不会’放自己的网站或客户’尝试时会面临风险。

    至于正确的配对和结构,我不’就列表而言,它的实际实现是如此复杂。该专利告诉我们,尽管他们将查看显式列表,例如有序列表或编号列表,但他们还将查看通过使用表甚至中断元素创建的列表。他们还注意到,虽然可以使用heading元素,但他们会将仅在列表顶部使用较大字体大小的标题视为这些显式或隐式列表之一的标题或标题。

  14. 嗨安德鲁,

    那’这是一个好问题。

    人们一直在使用表格技巧,CSS绝对定位,浮点数和其他技巧来尝试使重要文本在页面的HTML代码中突出显示,即使它不是’在页面本身的视觉视图中突出显示。我没有’我们坚信这样做是个好主意,在通读了Microsoft,Google和Yahoo的专利和白皮书以及有关网页内容的视觉分割的大量专利和白皮书之后,我’我更没有说服力。

    如果你 focus instead on putting your important content within an area of your pages that are obviously the main content sections of a page, you may be better off.

  15. 你好罗宾,

    专利需要很长时间才能获得授权,而六年的专利授权期限是’一切异常。我获得了很多授权专利 ’我们最近看到的是2004年提出的,甚至还有2003年和2002年提出的一些。

  16. 嗨,迈克,

    我不’t believe that I’甚至还没有人讨论这样组合的标题和列表的SEO值。我最近看到许多帖子质疑使用价值<h1>在进行了几次实验后,从SEO角度分析了元素,但这只是针对<h1>, and didn’请考虑语义紧密度的概念,以及搜索引擎如何考虑出现在列表标题中的单词与作为该列表中一项显示的术语的接近程度。

    也许我们’会看到那些尝试过这些的人<h1>元素也测试了这种语义上的接近性概念。

  17. 嗨菲利克斯,

    然后,使用稍微不同的方法来解释该概念。

    如果你’重新优化术语页面“New 约克 冰 奶油”,理想情况下,您需要“New” and “York” and “ice” and “cream”一起出现在同一页面上。

    搜索引擎,看到查询“New 约克 冰 奶油”(不带引号)可能会尝试查找网络上包含以下条款的所有页面“New” and “York” and “ice” and “cream”, even if they aren’像那样全部在一起。除了在搜索结果中返回包含以下短语的网页“New 约克 冰淇淋”,搜索引擎可能会向我们显示带有以下句子的页面:

    “I went to a store in 新 约克 to buy 奶油 and slipped on the 冰.”

    该句子中的单词仅相隔几个单词,但它们不是’t彼此紧邻。它们越靠得越近“relevant”他们可能是查询– 纽约冰淇淋.

    该专利的意思是,如果单词出现在标题中并在该标题下列出项目,则它们对标题和列表项目之间的单词进行计数的方式可能会不同,而不只是对单词之间的所有单词进行计数。

    想象一下,您有一个这样的列表:

    <h1>New 约克 Industries</h1>

    <ul><li>Milk</li>
    <li>Wine</li>
    <li>shipbuilding</li>
    <li>Tourism</li>
    <li>Ice Cream</li></ul>

    由于列表是“semantic structure,” and “ice 奶油”是与以下内容相关的列表项“New 约克 Industries,”它被认为在语义上接近“New 约克 Industries.” It’s as close as any of the other list items to that title. 新 约克 Industries 冰淇淋 –之间只有一个字“new 约克” in the title and “ice 奶油” as a list item.

    单词比句子中的单词更接近“I went to a store in 新 约克 to buy 奶油 and slipped on the 冰,”因此,如果我们仅根据查询中单词的紧密程度来确定相关性,那么包含此类列表的页面可能会比包含该句子的页面更适合我的查询。

  18. Pingback:双歧双歧杆菌排名信号|电子差异在线营销博客
  19. 妈妈,我告诉你,我需要花更多的时间在计算机上,以使我的代码看起来更漂亮!

  20. 嗨,比尔,

    It has been so long since I have not read an 文章 as 相关的 about SEO.
    感谢您提供这些确切的信息,我已经阅读了您的其他文章,这些文章非常完整,非常有教育意义。

    大卫(来自法国)

  21. Based on your description, 我不’t understand why “distance”会更紧密地与“Saturn” than “rotation.”

    维克

  22. 法案,

    在该示例中,您指出每个项目符号开头的所有术语都与顶部项目具有相同的距离,因此我想问一个问题,为什么在另一个示例中,您在项目符号列表的下方列出一个术语尽管它们都是每个项目符号的第一个字,但它们比列表中较高的项目具有更大的相关性。

    谢谢,

    维克

  23. 嗨,维克

    我在上面的示例中添加了插图。我在比较单词之间的语义距离“Saturn” and “Distance”到之间的语义距离“Days” and “Rotation.”换句话说,标题中的单词与列表项中的单词之间的语义距离比不同列表项中的两个单词之间的语义距离短。

    我希望该图像有助于使我的示例更清晰。

  24. If I understand this 文章 correctly, the 距离 between not only keywords, but subject related words also matters?

  25. 嗨,马克,

    专利确实没有’t discuss “与主题相关的单词,”就像可以说是相关的词语一样,例如,它们往往在Web的同一文档中一起出现很多。

    相反,它’查看关键字之间的距离,以及如果这些关键字以某种有意义的语义结构(例如项目列表)出现,则该距离的计算方式会有所不同。列表标题中的单词与列表项之间的距离’t是通过查看它们之间的单词数来衡量的,因为每个列表项被认为与标题的距离与任何其他列表项的距离相同。

  26. 我总是尝试使用语义html,如果某些内容是重复单词/短语的列表,那么它应该位于(无序)列表中,这就是为什么导航栏和菜单应显示为列表的原因。列表中的所有项目都应具有同等的权重,以便这些项目中的任何一项与标题或子标题具有相同的关系,这是有道理的。我还认为,文本大小是一个重要因素,就像Google索引中的某些PDF文件一样,最大的文本似乎和H1标签一样重要。

  27. 谢谢。

    确实有道理,搜索引擎会给予列表中的项目彼此相对相等的权重,并假定它们与该列表的标题之间的距离相等。它’很高兴看到Google对此专利进行了验证。

    该专利有趣的一件事是,作者似乎假设并不是每个人都会尽心尽力以语义方式使用HTML标记,并且其背后的过程将考虑表中或列表中列出的列表。使用br元素与使用有序和无序列表元素一样有效(作为列表)。

    该专利告诉我们,他们还将查看列表的标题或标题,即使它使用较大的字体大小而不是实际的标题元素,也将其视为标题。因此,根据Google表示他们可能解释标题的语义结构以及其后的列表的方式,您在PDF文档中使用较大字体近似H1元素的直觉似乎是一个好习惯。

  28. 多么伟大的文章。感谢您与我们分享您的见解。一世’我曾经以为亲近是一个因素 ’ve注意到某些站点对不一定在其页面或传入反向链接的锚文本中显示的术语进行排名。 谷歌使用网页的语义来确定信息是否相关是有意义的,但是您是否认为该算法的某些方面仅在网站达到某个PageRank时才触发,或者相反地,您认为同一算法是以无差别的方式应用于所有网站?

  29. 你好乔纳森,

    谢谢。页面上单词的接近性可能是搜索引擎已经考虑了一段时间的问题。

    您之所以可能会为某些可能不会出现在您的页面上或出现在页面上的锚定文字中的词语进行排名的原因之一是Google可能扩大了一些搜索者’查询以包含可能出现在页面上的同义词。

    It’Google可能无法在某些页面低于某个PageRank时对这些页面的某些方面进行索引,或者可能无法尽快对这些页面进行爬网和重新索引。但是PageRank只是搜索引擎可能查看的数百种不同因素之一。对于某些类型的页面,例如新闻报道,Google可能会注意一些信号,’不要关注或重视电子商务产品页面或博客文章。搜索引擎也可能会基于页面的主题考虑或赋予不同信号更多的权重。例如,包含历史文件(例如,独立宣言)的页面的新鲜度可能不如关于本周发生的流行事件的页面重要。

  30. I’d完全同意您上面的评论,拥有测试站点可以在不杀死重要站点(例如属于客户的站点!)的情况下尝试这些操作,这真的很有用。您可以按照自己的经验进行测试,而不仅仅是遵循他人的说法。

  31. 嗨,马克,

    确实有帮助。这也有助于使该网站成为您所需要的东西’对它非常感兴趣,因此您可以添加一些动机,并尝试使用它。

  32. 嗨,比尔,

    很棒的文章,这是我第一次访问您的博客,但考虑到自己已加入书签!事后看来,我当然可以在实际应用中看到一些巨大的可能性,特别是在保持页面自然外观的同时,还可以优化页面,在这些页面中,客户可以为许多地区提供相同的服务。

  33. 嗨尼克,

    谢谢,欢迎来到海边的SEO。

    关于如何使用它来制作显示服务列表的好地方可能在不同的地方可用。我认为有几种方法可能会有用。我还在考虑当标题是链接时,标题可能与列表中的每个条目相关联。

  34. 是的条例草案,我记得听过。似乎Google在为网页加权时正在寻找链接网络。如果某个页面被更多页面链接的页面所喜欢,那么它的权重当然会更高! ðŸ™,

  35. pingback:List Items and SEO
  36. pingback:A Great Tool 您’重新使用:Wonder Wheel |密尔沃基SEO
  37. 法案,

    有趣的文章。

    任何使用此技术的视图。我一直试图利用列表作为页面的一部分。有趣的是,看看这种方法是否可以带来任何积极的增长。

    谢谢

    西蒙

评论被关闭。