10项最重要的SEO专利:第4部分–PageRank符合合理的冲浪者模型

分享是关怀!

网页排名是一种度量,它表示以下可能性:如果某人从Web上的任何页面开始,并随机单击他们在页面上找到的链接,或者经常感到无聊和传送(是,这是官方技术搜索工程师的行话),随机页面,最终它们将最终到达特定页面。

拉里·佩奇(Larry Page)指此人单击链接,如下所示“random surfer model.”事实是,大多数人都没有’t so random. It’s not like we’重新站在某个街角某个地方,然后随机朝某个方向出发。 (好的,我承认我有时会这样做,尤其是当遇到下面的标志时。)

弗吉尼亚州平原地区的一个街角,有一个标牌,显示到附近许多其他城市的距离。

Imagine someone from 谷歌 waking up in the middle of the night, with the thought, “Hmmmm. Maybe we’re not quite doing 网页排名 非常正确。也许我们应该做一些诸如关注 链接出现的位置 在页面上,以及其他内容。”

那’s the scenario I envisioned when reading the 谷歌 Reasonable Surfer Model patent 根据用户行为和/或功能数据对文档进行排名,它消除了一些随机性,并向我们介绍了另一种冲浪者模型– the 合理的冲浪者 model.

早在2008年,当雅虎拥有自己的搜索引擎时,雅虎’普里扬克·加格(Priyank Garg)告诉埃里克·恩格(Eric Enge) 面试 有关Yahoo如何处理某些链接的信息:

页面底部的无关紧要的链接对于用户而言不会那么有价值,不会增加用户体验的质量,因此我们不考虑排名中的那些链接。所有这些链接可能仍然对爬网发现有用,但是它们不支持排名。

Was 谷歌 doing the same thing?

In a 2009 blog post on 网页排名 Sculpting, 谷歌’s Matt Cutts添加了以下内容 免责声明:

免责声明:即使当我2000年加入公司时,Google所做的链接计算也比您从经典PageRank论文中所观察到的复杂。如果您认为Google停止了链接分析方面的创新,那就是错误的假设。

尽管我们仍然将其称为PageRank,但Google多年来基于链接计算信誉的能力已大大提高。我将在“经典PageRank”框架中完成我的博客文章的其余部分,但请记住,这并不是一个完美的类比。

因此,想象一下,而不是Google赋予页面上要分配的相同数量的PageRank,而不是给每个链接分配相同的PageRank,而是经过详细分析并查看与每个链接相关的一系列功能之后,通过每个链接提供了不同数量的PageRank。

合理冲浪者模型背后的专利,我写了一篇有关 谷歌’s合理的冲浪者:基于链接和文档功能以及用户数据的链接价值可能会有所不同,没有’只需查看页面上链接的位置即可确定要传递多少PageRank。

合理的冲浪者模型没有’只需查看链接文本的强调程度,就可以确定链接文本是通过不同的颜色,字体系列还是较大的字体来决定是否增加通过该链接的PageRank的数量。粗体,下划线或其他装饰方式。

合理的Surfer模型可能还会查看与链接相关联的单词数,这些单词本身是什么,这些单词可能具有多大的商业意义以及许多其他功能。

因此,如果某个链接出现在有关当地县市集的吃馅饼竞赛的页面上主要内容区域的顶部附近,则该链接会使用锚文本“cheap NFL球衣”以粗体字母表示,Resibleable Surfer模型背后的算法可能会确定,即使该链接突出放置并在页面重要部分中从其余文本中脱颖而出,该链接的文本也与内容无关该页面其余部分的内容,并且该文本证明具有非常商业目的。

而且’多数访问该页面以了解县集市活动的人都是合理的’不要点击该链接。因此,它真的不应该’t传递了很多PageRank。

为什么我将这个特定的“合理的冲浪者模式”专利选择为10个最重要的SEO专利之一?

原因之一是’很好地说明了当支持该算法的假设和模型随时间变化时如何修改算法,以及运行搜索引擎可能带来的经验和后见之明。当您想到一个合理的冲浪者模型时会发生什么

另一个是’几年来,Google一直很明显’我们一直在为同一页面上的不同链接传递相同数量的PageRank,并且我们有像Matt Mattts所说的那样,即使PagePage甚至在早期也已经发展了,但是我们没有’我们无法从Google本身得到任何关于搜索引擎如何以不同方式计算PageRank的信息。

合理的Surfer模型专利是在2004年提交的,但没有’直到2010年获得批准为止,才能公开访问。在阅读时,我一直对自己说:“是的,那很有道理。它解释了很多事情。”

可以对原始的PageRank算法进行一些有效的批评,包括Random Surfer模型不是人们如何使用Web的示例。

为了尽可能简洁,合理的冲浪者模型通过查看可能有助于确定某人最可能关注的页面上的哪个或多个链接,并通过这些链接传递最多PageRank的因素组合来改变了它。再说一次’Google可能会继续发展PageRank的工作方式,但现在看来比以前更加合理了。

SEO十大最重要专利系列的所有部分:

第1部分–原始PageRank专利申请
第2部分–历史原始数据专利申请及其子版本
第三部分–使用语言功能对Web块进行分类
第4部分–PageRank与合理的冲浪者会面
第5部分–基于短语的索引
第6部分–查询中的命名实体检测
第7部分–集,语义紧密度,分段和Web表
第8部分–将地理相关性分配给网页
第9部分–从十个蓝色链接到混合搜索和通用搜索
第10部分– Just the Beginning

分享是关怀!

37想法“10项最重要的SEO专利:第4部分–PageRank符合合理的冲浪者模型”

  1. 我认为在站点上放置链接似乎也是一种趋势。仅在站点上放置链接的位置越高,链接的权重就越大。那’这就是为什么我们被告知将最重要的关键字放在页面顶部以显示什么’对于该特定页面非常重要。将最重要的链接放在顶部才有意义。

  2. 我经常想知道他们是否’ll ever (or already have) move on from a reasonable-surfer model to an 知情的-surfer one. The ability to get rick-rolled shows that it’s easy to trick a 合理的冲浪者. But an 知情的 surfer, who knew metrics about the page being linked to, would tend get to what they want far more quickly as they would rarely end up on irrelevant pages.

  3. 很棒的帖子!虽然我可以’跟上最新的东西。但是我’我很惊讶您可以收集这么多信息。到目前为止,您是我掌握的最新信息的最佳信息来源。谢谢你,比尔。

  4. 我认为链接的放置确实会带来一些负担,但是信息丰富且相关的链接又是用户正在寻找并与页面本身相关的链接,无论页面的较低位置如何,都不能忽略它。最终,网络上的每个冲浪者都在寻找最准确的搜索结果。
    请记住,可能存在决定性的元素,这些元素表示任何链接的价值。

  5. 毫无疑问,Google对网页上不同位置的链接的处理方式有所不同。我确信这是非常复杂的。我也知道前几个链接也更重要。即使是内部链接,我们也可以看到。前几个流量更大。基本和简单的PR算法我早已不复存在:)。

  6. 嗨围。

    有趣的是Google并不是’PageRank专利的所有者。它’由斯坦福大学(Stanford University)拥有,尽管Google拥有在该专利中使用该技术的专有许可,该专利将于2011年到期。’不知道Google和Stanford是否以任何方式扩展了它,但是它’他们可能有。在专利到期之前,专利本身还有几年的时间。

  7. 嗨,马尔科姆,

    有趣的一点。在“合理的冲浪者”模型下,专利要研究的功能之一是指向页面的锚文本与该页面的实际内容之间的匹配程度。因此,文字链接“最新的Android功能”指向有关“在哥斯达黎加钓鱼”在这种分析下将会失败。所以有一些“informed”专利方面。

    但是,我了解您的意思,即Google现已拥有编写此专利的权利,而现在他们已经拥有了更多的信息和计算能力,甚至可以跟踪人们单击页面上某个特定链接的频率是多少,页。但是,他们不仅可以依赖于这样的用户行为信号,还可以聚合从页面上找到的特征的信息,这些链接通常是某些人通常会很快离开的链接,然后根据这些特征确定链接权重(类似于熊猫方法)链接权重)。

  8. 萨姆你好,

    我了解这样想是多么诱人, ’s something that people have been saying for years. But, with the page segmentation patent and this 合理的冲浪者 patent, that’不一定是真的。

    这项专利告诉我们,除了页面上链接的位置之外,Google还将关注更多其他内容,并且有时,当链接在页面上的位置很高时,其他功能可能会使链接通过比同一页面上的其他链接轻。例如,如果锚文本与其所在页面的内容以及它指向的页面的内容几乎没有关系或根本没有关系,那可能就不好了。如果该链接实际上与周围的文本无关,例如相同的颜色和字体样式和字体强调,并且没有文本修饰(例如下划线),则该链接’几乎被隐藏了’要么向搜索引擎发送了一个好信号,它可能因此因此贬值。它’■各种可能的功能的总和,这将决定链接可能传递的权重,而不仅仅是一个。

  9. 嗨,尼古拉斯,

    我同意。这是对许多问题的明智适应,这些问题涉及对PageRank算法的某些可能的滥用。很难说这是第一个,因为我们只是不’不能访问Google幕后发生的事情。但是您可以看到他们的一些虐待’如果您查看了它考虑的各种功能,就可以解决该问题,例如,给与文本颜色相同的文本链接以较低的权重,将这些链接放置在页面的页脚中,以尝试提高页面排名,这些页面以及许多其他页面。

  10. 嗨,Parvesh,

    正是因为如此,该专利才没有’不能仅依赖其中任何一项功能,而是将其完全考虑。尽管某些功能本身可以起决定性作用,例如链接的颜色与背景颜色相同’儿子。这似乎是一个明确的信号,表明有人正在使用该链接只是为了增强指向该页面的PageRank。

  11. 嗨,尼古拉,

    在考虑该专利时,我尝试记住的一个相当简单的经验法则是,人们在查看页面时最有可能点击的链接很可能是沿着页面上最多PageRank传递的链接。该页面。可能并非一直如此,但可能大部分时间都是如此。

  12. 嗨加文,

    不过,最棘手的部分之一是PageRank确实独立于“relevance” or at least 关联 to the query that someone might find a page for. It’s calculated independently of a query. Now the 关联 of anchor text used in a link to the text on the rest of the page, or on the text of the page being linked to is another matter, and that could play a role in how much weight a link could pass along. 🙂

  13. 有趣的东西比尔。我不知道Yahoo忽略了页面底部的链接,但这很有意义,因为通常这些链接都是垃圾。

    我也毫不怀疑Google在合理冲浪者方面处于领先地位。 Matt Cutts是Oz的SEO向导。有意义的是,如果位于内容顶部的链接是与内容无关的商业链接,则不会像页面上的其他链接那样通过太多的页面排名。

  14. 比尔,这是很棒的东西,好像很多人自称的“SEO Specialists” aren’t all to aware of.

    这让我想知道Bing在这种事情上的表现如何,因为每当我在Bing中搜索时,与我从Google获得的结果相比,搜索结果的关联性似乎都差强人意,我想知道您或其他人是否经历过相同的事情。

  15. 和往常一样非常有趣。确实不对页面上的所有链接应用相同的值确实有意义。

    Personally, this is why I feel that link building via 来宾 posting is so beneficial as opposed to outright link 垃圾邮件ming which seems to be what many SEOs do.

    因此,最佳链接将始终与上下文相关,并与页面主题相关。

    我感觉合理。

    标记

  16. 我不’认为链接的位置应与相关性一样重要。我真的很讨厌那些反向链接如此明显的帖子,例如“NFL jerseys”在有关旅行或节食的博客上。人们为什么仍然这样做?

  17. 蒂姆,你好

    It’当来自某个搜索引擎的某人指出诸如如何处理页面底部的链接之类的内容时,这非常好。对于刚读完页面的人来说,这些内容通常会很有用,’我们已经找到了他们可能一直在寻找的信息,但是对于搜索引擎来说,通常不要给这些链接太多的权重(如果有的话)是很有意义的。

    The 合理的冲浪者 model does seem to fit its name well, as being “reasonable.” 🙂

  18. 嗨,亚当,

    Thank you. 那里 do seem to be a lot of people who working at SEO who may be doing what they are doing without an awareness of how a 合理的冲浪者 approach might impact what they are doing.

    根据他们的论文,我怀疑Bing也会做类似的事情’像他们的白皮书一样,多年来一直在发布 块级链接分析 (pdf)。它’s likely that they are at least paying attention to 链接出现的位置 on a page, and likely that they are looking at some other similar signals described in the 合理的冲浪者 patent.

  19. 嗨,马克,

    那里 are a lot of people who do try to use comment link 垃圾邮件 to manipulate search results when they could instead be getting much better benefits out of creating their own content on their own pages that provides value to people.

    我喜欢访客博客文章的想法,但看到许多人滥用过多。一世’ve免费提供了优惠“guest” posts from people I’我从来没有听说过,谁曾经’甚至试图以任何方式与我建立关系,并且谁似乎有意使用我的平台’我们已经建立了向那些为这些链接付费的客户的链接垃圾邮件。我真的不知道’不想与此有关。 --

  20. 嗨,尼古拉,

    谷歌使得自己使用自己的浏览器,Google工具栏,已登录的个性化搜索,自己的书签服务,人们在Google Plus上共享页面等功能来跟踪信息变得越来越容易。 --

  21. 嗨朱莉,

    谷歌 considers a wide range of factors in the 合理的冲浪者 approach, so page location plus 关联 plus features about the link itself and other factors are considered altogether. A very 相关的 link at the very bottom of the page might be 减 likely to be clicked upon 通过 a visitor than a link with much more neutral anchor text near the top of a page, for instance.

    不确定为什么人们会做诸如添加链接到“nfl jerseys” or “casino adventures”到与这些内容无关的文章或博客文章,除非他们认为他们至少可以在短时间内摆脱它。

  22. 嗨,帕维尔,

    过去,PageRank大约每4-5周更改一次,但是从那时起Google对其进行计算并重新计算的速度要快得多。我可能需要指出的是,您在页面上看到的工具栏pagerank是’确实是在任何时间点页面PageRank的很好指示器,因为它’一年仅更新几次,并且只会告诉您过去某个时间点某个页面可能位于的PageRank。

    至于“the 沙盒,”哪有这回事。

    在SEO和网站站长论坛上,许多人都认为关于“sandbox”在Google信任它们之前,将哪个新站点放进去,然后这些站点将开始在搜索结果中排名。有时,这些页面最初的排名很好,然后消失,直到几个月后才重新出现。

    谷歌的Matt Cutts承认这一点,即Google在算法上做的事情看起来像是存在“samdbox,” but that 谷歌 never set out to actually create a 沙盒 like the one described in the forums that I referred to.

    事实是,许多互联网网站像许多实体企业一样开始,“cold start,” in that there aren’没有与他们的任何链接, ’关于它们的任何消息,他们几乎是未知的。包含局部相关信息并且稳定并定期建立和吸引链接的站点可以避免任何类型的“sandbox” type effects.

  23. 超级研究。尽管我确实设法通过博客和论坛紧跟任何SEO问题,但我当然没有时间去详细介绍这些细节。

    The one thing I would say, surely to anyone genuinely interested in SEO the most important things to concentrate on are content and 相关的 links.

    If you get links from 相关的 sites then the position and font of anchor text should not be a worry. You will still get good link juice if the site from which the link is passed is 相关的 and not stuffed with outbound links

    有兴趣听到任何人对我的评论的看法

    抄送

  24. 嗨,科林,

    谢谢。一世’多年以来,我发现如果我尝试学习一些东西,并尝试用别人可能会理解的词来表达,我往往会更迅速地掌握它背后的许多概念,并且与我在一起的时间更长。我还可以返回一些内容来刷新我的记忆。:)

    I’我不相信您绝对需要来自“relevant”网站或确切的意思。如果我从博客中获得有关小型企业问题的链接,那么我不会’认为这比我从写有SEO的站点的链接获得的计数要少。然而,小型企业网站可能是“less” 相关的 to my site.

    如果来自任何一个的链接都在其页脚中,并且看起来与它们周围的非链接文本完全相同,那么我不会’与相同页面上的某些其他链接相比,期望通过这些链接流过的PageRank可能更多,例如,可能位于那些页面的主要内容区域中,并且以某种方式肯定地脱颖而出。

  25. 嗨比尔

    What I mean 通过 links from 相关的 pages is links from a site on the same or related topic.

    例如,如果您有一个有关遥控直升机的站点,那么来自模型商店的入站链接将比来自一个烧烤站点的链接承担更大的重量’s

    我在各种论坛上所读到的内容都没有科学依据。

    科林

  26. 嗨,科林,

    好的,如果有一个写有关小型企业的博客,并且他们发布了有关推广商业网站的文章,并链接到我的文章,’撰写过有关小型企业在线营销的文章,’re writing about.

    我认为这可能会有所帮助’合理的冲浪者专利中的某些语言听起来与此相似。但是我确实认为,如果锚文本有些中性,并且每个页面的主题之间可能没有太多相似之处,PageRank仍然会通过。

  27. 嗨,比尔,

    这是关于页面排名和链接的非常有趣的帖子。我不知道如何将其转换为专门在内容块中设置的页面(更像是Wiki)。在我看来,按照这种逻辑,每个区块中与该主题相关的第一个主要链接将是“most 相关的” link –还是内容块本身的标题将获得大部分荣耀?

    无论如何,已经使用了不相关的锚文本。“bad practice” for a while now, it’有趣的是,将其转换为页面排名。

    〜杜鲁

  28. 嗨Shira,

    我认为分析不仅限于此,但是它’值得花一些时间思考。

    Microsoft提供了许多有关页面上的块的可视化细分的白皮书,其中一些功能包括根据一些不同的因素来分析页面上最重要的段或块的内容。例如,报纸网站的首页可能涵盖许多不同的主题,并且每个主题都可能被独立考虑,但是Microsoft可能仍认为该页面上的一个区域比其他区域更重要。

    谷歌可能也有一种独特的方法,对于Wiki页面来说,但是它可能不仅仅只是确定Wiki帖子的每个段落或部分中的第一个链接是最重要的。合理的浏览器方法不仅包括页面上链接的位置,还包括许多功能。

  29. Bill和所有这些都为出色的撰写和评论做出了贡献。

    这是很棒的东西。是的,我相信Google会通过Chrome收集更多的用户数据,并且我相信他们会实现Chrome浏览器中定义的大多数功能“reasonable surfer” SEO model making searches more 相关的 compared to other search engines such as Bing and Yahoo!.

    值得注意的是,与其他浏览器运行Google搜索相比,Chrome呈现搜索结果的速度更快。这是否是因为Chrome现在在客户端而不是服务器端进行了大量的搜索处理?

    来自Google’整个SEO商业模式的角度,与Google当时不同’没有自己的浏览器,现在所有处理都将在Google上完成’的数据中心位于服务器端。这样可以节省Google的处理时间’的服务器,以及将购买电力的部分固定费用分摊给Google用户’的服务,例如搜索,Youtube,电子邮件等…这也是真的吗?

评论被关闭。