Google如何索引链接行为信息

分享是关怀!

查看链接行为信息

Under a conventional approach to indexing links 通过 a search engine, information about the 目标ed address that a link is pointed towards might be included in a search engine’的索引以及链接中显示的锚文本,甚至可能是链接本身附近的一些文本。谷歌 合理的冲浪者模型 指出了也可能收集有关链接的其他信息的可能性,可以将这些信息作为一个整体进行汇总,以计算在PageRank链接分析模型下,甚至在确定链接时,链接可以传递多少价值或权重。用于指向链接的锚点文本可能包含多少重量。

这个问题 搜索引擎机器人到底有多聪明 最近被问到的次数越来越多,由Google发布的一项正在审理的专利申请显示了搜索引擎可能如何收集有关在Web上找到的链接的完全不同类型的链接行为信息。鉴于谷歌’努力构建自己的Chrome浏览器,并通过其他屏幕(例如智能手机和其他手持设备和电视屏幕上的屏幕)提供对网页的访问,对于搜索引擎而言,捕获此类信息也很有意义。下面的专利文件中的图像显示了链接的各个部分,包括搜索引擎现在可能在索引的target和onclick属性。

单击左侧列中的链接后,出现在Google地图上的屏幕快照,其中显示了地图上方的信息框。

当我们考虑搜索引擎如何索引Web上的内容时,它会’通常以搜索引擎程序的形式抓取并收集有关看上去似乎是静态的页面的信息,而不是在单击链接时以及在这些页面上可能发生的更改。

链接行为信息可以包括以下内容:

  • 链接的显示方式
  • 页面上链接的位置,以“link placeholder”
  • 选择链接是否会启动新的应用程序和/或新的浏览器窗口
  • 选择链接后是否生成警报消息
  • 是否通过现有内容在浏览器窗口的部分或选项卡中(而不是在多个浏览器窗口中)在现有浏览器窗口中打开与链接关联的网页(或其他信息)

It’移动设备支持的链接行为的类型可能与膝上型计算机支持的链接行为的类型不同。例如,如果您使用笔记本电脑在Google Maps上针对特定类型的企业执行搜索,并且您的地图显示在右侧,则可以在左侧选择要选择的企业,然后单击其中一个企业链接左侧可能会导致地图上显示一个信息框,其中显示有关商家的更多信息,包括位置,地址以及指向商家首页的链接。手机可能无法显示该信息框。

A screenshot from the patent showing sections of HTML anchor links, including both 目标 和 onclick attributes that Google might now be indexing.

该链接行为信息也可能以实时方式收集,捕获与链接关联的上下文信息,例如:

  • 请求网页的计算设备类型
  • A 目标 address associated with at least one of the one or more 链接占位符s
  • 一个或多个链接占位符中的至少一个在与网页相关联的图形用户界面中的放置
  • 与网页关联的显示模式
  • 解析请求以生成与计算设备关联的上下文信息

专利没有’告诉我们是否通过诸如浏览器或附加浏览器之类的功能捕获了链接行为信息的实时集合,但事实并非如此。

So the purpose of collecting this kind of 链接行为信息 is for Google to understand: how a link should be displayed, how the content 目标ed 通过 a link should be displayed, 和 what kinds of events might be associated with a link.

专利申请是:

生成链接的行为信息
由Lori D. Meiskey和Jana S.Urban发明
美国专利申请20120084630
2012年4月5日发布
提交日期:2010年9月30日

抽象

一种计算机实现的方法,包括:接收对网页的请求;检索与网页相关联的信息,其中,该信息包括链接和与该链接相关联的一个或多个链接占位符;确定与计算设备相关联的上下文信息;根据上下文信息生成链接的行为信息;并使用行为信息填充一个或多个链接占位符中的至少一个。

当您单击链接时,有时结果是您在该页面上看到一个包含一些其他信息的弹出窗口,或者某些文本被突出显示,或者可能会显示地理信息。专利文件告诉我们,Google可能会捕获行为信息,“包括在选择链接后执行的javascript指令。”

外卖

该专利的发明人似乎是他们共同撰写的帖子中的Google地方信息页小组的成员 将Google地方信息页设置为您的企业扩音器,专利申请包括Google Maps的一些截屏,包括Google Place页面。看来他们可能已经受命尝试根据用于显示它们的显示设备的类型,找到一种以不同的方式显示Google Map增强功能的方法,无论是具有一种浏览器类型的台式计算机,还是具有不同浏览器版本的智能手机一种浏览器,其显示链接点击结果的方式可能更为有限。

It’他们提出的方法可能已经被采用,以了解Google外部网站上的链接行为,并可能有助于调整Google浏览器在可能不支持和支持设备的设备上显示链接信息的方式。显示此类信息。

Google网站管理员指南 长期以来,至少有一个部分警告网站站长,警告搜索引擎在抓取基于HTML文本的链接(包括基于javascript的链接)以外的链接时可能会遇到困难,例如这些指南的最新版本:

使用Lynx之类的文本浏览器来检查您的站点,因为大多数搜索引擎蜘蛛会像Lynx那样看到您的站点。如果诸如JavaScript,Cookie,会话ID,框架,DHTML或Flash之类的精美功能使您无法在文本浏览器中看到所有网站,则搜索引擎蜘蛛可能会在抓取您的网站时遇到麻烦。

那里’多年来,Google和其他来源一直在讨论如何使搜索引擎能够查找和抓取一些JavaScript链接,甚至 表面含量’s behind AJAX 链接,但这是Google的第一个专利申请,我可以回想起它们在哪里明确表明他们可能正在跟踪和索引页面链接的这种行为。

正如我在本文开头所指出的,’随着他们提供浏览器并逐渐致力于提供对Web的移动访问,他们应该更加注意他们在网页上看到的链接行为,并了解如何显示这些链接,特别是在那些他们提供的信息,例如Google Maps搜索中Maps上的信息叠加层。

It’目前尚不清楚这种对链接的更复杂的分析如何可能会影响搜索排名和结果,但可能无法使Google’的索引更了解仅在单击链接时才可能在页面上显示的信息,但我认为这有助于了解Google理解链接如何工作以及与链接相关联的行为的更深层次的方法。

分享是关怀!

37想法“Google如何索引链接行为信息”

  1. 优秀的邮政条例草案。问题:您是否认为这也可能导致Google“peering into”分析帐户?另外,您是否认为这解释了为什么我在上周(G +上)与Pierre Far进行了联系,他说:“..实际上,我们有3台Googlebot-Mobile(2台用于功能手机和一部智能手机),’请注意网址结构(m个子域名或相同的URL或/ m /目录或单独的域名)。将台式机和移动内容托管在同一URL上对您的用户来说是最容易的操作(例如,由于重定向而不会产生额外的延迟),也是我们最容易理解的内容。”

  2. 我总是想知道各种链接属性_blank等,几乎每次创建链接时,他们肯定都会将其用于某些东西,但是我不知道’t think it’在信号权重方面非常出色。通常,我将_blank添加到所有外部链接中’不想失去我的听众。我猜Google知道这种类型的链接放置行为类似于rel external。

  3. I’我一直在想,链接是否与“spammy links” –该链接/站点是否可以与页面上的其他链接/站点相关联,从而影响页面外SEO?

    I’我们已经了解到,如果网站站长正在参与Google不提供的链接方案,那么Google现在会在Google网站站长工具中提供消息’t approve.

  4. 优秀的帖子! Google几乎让世界各地的每个SEO和市场营销人员都在观看他们的网站,以查看新更新将如何影响他们的网站和链接建立策略。您’ve提到了几个关键点,我一定会在下面做一些额外的研究–但是在这一阶段,我已经阅读了很多Blog帖子,我必须承认,主要是所有猜测。最后,我们’只需等待更新启动并查看效果。很棒的帖子–我喜欢阅读的经验。感谢分享。

  5. 几天前,Google宣布将更新链接评估算法。但是没有’没有透露它是如何做到的。本文不提供链接评估的实际方法,对了解Google的链接评估方法很有帮助,因为Google让我们陷入了黑暗。

  6. 比尔,令人印象深刻且发人深省。我知道我们’re talking about 这里 is link “relevance”,或者更好的说,“link context”? If so, it sounds like the most-affected content would be low-quality 和/or random in nature. Not sure that would be a bad thing, but I plan to monitor this for future reference. Thanks for all the great data posted 这里.

  7. 你们可能知道,Phil有一点要说,Google确实专注于通过“高品质的网站”在搜索结果中更高。菲尔说的可能是这样…
    但是,如果它碰到了随机内容,那’t be so good.
    因此,他们确实需要跟踪自己在做什么。

  8. 真的很好的信息。我们注意到,一些我们未使用太多锚文本的站点(客户端)的运行情况令人惊讶。也许吧’s the 链接上下文 concept? Click 这里 is surprising strong.

    时间会证明一切(我们希望)

  9. 如果您认为锚文本是唯一相关的链接信息,那么您总是错的。我想知道为什么即使链接中嵌入了高度相关的内容,仍然有那么多SEO如此关注锚文本。但这可能会改变游戏规则。我认为在应该承担更大权重的链接与想要出售某些东西的简单链接之间总会有一个权衡。对于读者而言,提供更多信息的非常相关的链接通常会隐藏在非描述性锚文本中(例如“here” or “for example”等),同时将一个简单的广告放在醒目位置。什么链接应该获得更多“juice”和体重?对我来说’绝大部分时间绝对不是广告链接…

  10. Bill,真不错。即使我’已经有一段时间了,我’我仍然对Google正在收集和处理多少数据感到惊讶。您描述的所有数据都是通过单个链接收集的 –并有多少亿个链接?也许这有点切线,但是那’是我在阅读这篇文章时的想法。

  11. 伟大的邮政条例草案。 Google现在会考虑这些信号在很大程度上很有意义。由于转向更多“natural”看起来链接,尤其是锚文本,似乎这些信号是理想的后继者。

  12. 其实那里’有人声明他们会进行Rawl javascript链接。还有’讨论使用Chrome浏览器进行抓取和编制索引的人员。

    还有一位葡萄牙前googler先生最近说,到今年年底,Google将大大改变链接评估。我认为Google Places在本地网站排名中已经发挥了重要作用。

  13. 我同意Mike的观点,与我的竞争对手相比,我的许多客户排名很高,反向链接很少。在我们的一些测试中,’ve注意到仅提及一个域; mysite.com(不是实时链接)似乎有很大帮助。

  14. “选择链接是否会启动新的应用程序和/或新的浏览器窗口”
    我想知道这是否会一样
    <a href =”somewhere.html” 目标=”_blank”></a>

    <a href =”somewhere.html” onClick=”window.open(this.href);返回假”></a>

    从屏幕截图来看,它们看起来有所不同

  15. 嗨斯蒂芬,

    谢谢。我不’认为这表明Google可能正在使用来自单个Google 分析工具(分析)帐户的数据。他们拥有有关不同查询,浏览活动和网站的用户活动日志。

    但是,是的’专注于移动设备的爬网程序可能会发现对此类链接功能更感兴趣,特别是如果这意味着访问某些页面的人可能无法通过某些URL访问信息(如果其移动浏览器无法访问某些信息)’支持onclick事件等功能。

  16. 嗨,丹,

    我发现对该特定专利真正感兴趣的一件事是’如此之多,以至于Google正在努力为这些特定功能建立索引,而是使它们正在为我们可能根本不会期望的事情建立索引。如果页面上填充的链接可能无法在移动浏览器上很好地工作,那么它在移动搜索中的排名可能不会很高,或者网站(或移动浏览器)是否可以找到其他方式来显示该信息?一世’m not sure.

  17. 嗨,妮基,

    我不会’认为仅仅是因为一个站点链接到两个不同的地方,而其中一个可能是”bad neighborhood”类型链接,链接到另一页面将以某种方式受到损害。这本身就是一组非常有限的信号。进行这种关联可能需要花费更多的时间。

    但是Google会为在页面上找到的链接建立索引,并建立一个链接图来描述链接如何在Web上彼此关联。– that’这也是计算PageRank的过程的一部分。页面之间链接的图形化可能会揭示出一些模式,这些模式可能表明是否可能发生某种异常的链接方案,这可能被视为只是为了尝试操纵PageRank而存在的页面之间的链接环。

    Google确实发出了大量有关以下内容的警告消息“不自然的链接模式”很多网站管理员。幸运的是,我没有’我看不到任何有关我的网站的消息’网站站长工具中的监控。

  18. 嗨安东,

    谢谢。现在,在收到来自Google的一些信息后,Google将会如何更改排名,目前存在很多不确定性,他们将对自己使用的有关网站站长指南的算法进行更改。他们到底在做什么,我们可以’不太确定,但是某些站点肯定受到了影响,’在涉及许多网站的Google网站站长中心帮助论坛上进行了大量讨论。

  19. 嗨,理查德,

    我的帖子只真正描述了一小块更大的东西。谷歌上个月确实宣布,他们将不再使用已经使用了几年的链接分析方法。大概是因为它不再需要或不再有用,或者可能是因为他们想出了一个替代方案。几天前,他们进行了另一种算法更改,对许多网站的排名产生了相当大的影响。

    如果您从这篇文章中得到任何帮助,希望它’可能是Google可能正在寻找与链接相关的事物,这比我们过去可能知道的更多。

  20. 嗨,菲尔,

    谢谢。也许对此我最感兴趣的是,当您单击页面上的一个或几个链接时,’t带到另一个页面,但您会在该页面本身上看到更多内容。 Google是否出于索引目的而关注它?也许。

    那种内容是’本质上也不一定总是低质量。

  21. 嗨,迈克尔,

    我怀疑,如果Google将仅在单击链接时显示的内容编入索引,并且链接在同一页面上,并且每次单击该链接时它都会改变,那么Google可能不太希望索引该内容。它可能认为它本质上是太短暂的。

  22. 嗨,迈克,

    It’很难得出这样的结论,而不是过多地了解可能导致这些页面排名良好的其他信号和功能,以及不十分了解它们在这些查询中的竞争。但是,绝对值得尝试考虑可能会影响这种事情的所有因素。

  23. 你好汤姆,

    绝对是如果谷歌 合理的冲浪者 专利教会了我们任何东西’s that there are a lot of different features 和 aspects of a link that might play a role in how much PageRank 和 hypertext 关联 it might pass along, from font size 和 color 和 style to location on a page to how relevant it might be to the page around it, 和 much more.

    该专利告诉我们的是,可能还有一些其他与链接相关的功能也可能起着一定的作用,过去我们可能并没有引起太多关注,也许我们应该这样做。

  24. 嗨,约翰,

    谢谢。 Google确实收集了多少数据,这让人有些agger异,更令我惊讶的是,他们可以找到以有意义的方式使用它的方法。我记得几年前“meet the crawlers”会议上,有人问Google代表他们如何识别付费链接,他收到的回复是“我们有很多计算机。”他们比现在更多了。

  25. 嗨,肖恩,

    在某种程度上,我认为Google需要开始更多地关注这些类型的链接,因为其中某些链接可能会导致移动浏览器出现问题。另外,其中一些触发内容也会在同一页面上显示,例如,当您在Google Maps搜索结果页面中单击公司名称时,气球便会显示在地图上,以显示有关其列表的公司的更多信息。您的点击。页面(包括Google Maps之外的许多页面)上的内容的那些onclick类型添加看起来像这样’Google可能希望了解的信息,这些信息既适用于使用移动浏览器的人,而这些人可能看不到该信息,并且可能将这种点击可能触发的其他信息编入索引。

  26. 嗨,马科斯,

    很好的一点。尽管如果转到Google网站站长指南,我们仍然会看到以下警告:

    使用Lynx之类的文本浏览器来检查您的站点,因为大多数搜索引擎蜘蛛会像Lynx那样看到您的站点。如果诸如JavaScript,Cookie,会话ID,框架,DHTML或Flash之类的精美功能使您无法在文本浏览器中看到所有网站,则搜索引擎蜘蛛可能会在抓取您的网站时遇到麻烦。

    我们知道Google可以看到一段JavaScript何时包含一个“href=”URL”并愿意抓取该链接,他们’至少已经这样做了几年。

    但它’Google也可能会在此时触发javascript事件,以查看它们实际发生的情况。

    关于Google在年底前大幅更改链接评估的声明很有趣,我也看到了这一点。不太清楚这可能意味着什么。

  27. 嗨文斯,

    I’m确信,这是由于人们通过具有不同功能的不同设备查看Google Maps时遇到的问题所致。但是它也可以应用于许多其他站点,并且该专利以一种表达方式的方式编写,该方式表达了能够理解Web上可能发现的链接行为的能力。所以我’我不确定我们是否应该仅根据其起源来限制对它的看法。

  28. 嗨,杰里米,

    但是,使该观察结果偏离的一件事是,就PageRank和超文本相关性而言,每个链接可能都具有不同的权重。一世’例如,在非常高的PageRank页面中,单个链接的优势使页面排名令人惊讶。一世’d假设在那种情况下,来自该特定页面(页面排名9)的链接可能比来自较低PageRank页面的数千个链接有价值。鉴于此,它’很难说锚文本可能产生什么样的影响。

  29. 嗨,CMSbuffet,

    两者的结果是相同的,但是每种方法都存在差异,甚至在某些情况下甚至可能对移动浏览器或台式机浏览器产生影响。第一个可能会导致一次只能打开一个窗口的移动浏览器出现问题。它可能会忽略“target”并转到链接到的页面。第二种可能会被没有 ’请使用javascript,并且单击链接时可能不会发生任何事情。

    可能对Google来说是一个类似的页面’是否适合移动设备,并且该页面在移动网站上的搜索结果中应该排名较低?我不’不知道,但是可能是。

  30. 比尔,自企鹅更新以来,您注意到了什么?我知道有很多谣言和猜测,但是我似乎得到了一个普遍的共识,即Google在最新的算法更改中已大大改变了链接排名因素。有什么想法吗?

  31. 你好汤姆,

    我真的避风港’t注意到任何可能与’在本专利申请和企鹅更新中描述。我可能会想到的是,该专利申请可能会影响到的最不寻常的事情是,如果页面的实际URL不包含在onclick事件之后才出现的内容可能会包含在同一页面的搜索结果中’t change.

  32. Pingback:Google企鹅更新和入站链接

评论被关闭。