Microsoft跟踪搜索和浏览行为以查找权威页面

分享是关怀!

在2005年12月至2006年4月之间,Microsoft研究人员在获得许可的情况下收集了有关成千上万Windows Live Toolbar用户的搜索和浏览活动的信息,以了解搜索者最终针对某些最终未排序和未编制索引的最终目标页面。在Google,Yahoo和Microsoft输入的查询’s Live.com.

当向搜索者展示相关结果时,搜索引擎试图做的很多事情都是基于诸如PageRank之类的算法中的假设。

跟踪实际的用户搜索和浏览行为能否更好地帮助搜索引擎了解哪些页面最能回答搜索者在搜索引擎中提出的查询?

Microsoft在最终目标页面上

去年,三位微软研究人员因题为《科学》的论文而获得了SIGIR’¢07的最佳论文奖。 研究使用热门目的地来增强Web搜索互动 (pdf)着眼于大量人员的搜索和浏览行为。

研究的重点是查找似乎是最终目的地的页面,或者是人们可能会根据提交给搜索引擎的查询找到搜索答案的站点。我在2006年世界会议之前写了一些有关原始论文的文章 Microsoft Study使导航站点链接更进一步.

What they told us then about those 最终目的地 was that:

目的地可能不在排名最高的结果之中,可能不包含查询的术语,甚至可能没有被搜索引擎索引。相反,它们是其他用户在提交相同或相似的查询然后远离最初单击的搜索结果浏览之后频繁出现的页面。

最终目的地为权威页面?

他们’在新论文的原始研究基础上, 利用热门目的地来增强Web搜索互动 。这里’他们在摘要中告诉我们的内容:

本文介绍了一种新颖的Web搜索交互功能,该功能针对给定查询提供了指向其他用户经常访问的具有类似信息需求的网站的链接。

These popular destinations complement traditional search results, allowing direct navigation to 权威性 resources for the query topic.

使用长时间内许多用户的搜索和浏览行为历史来识别目标,并且他们的集体行为为计算源权限提供了基础。

的researchers looked for what they called 搜索路径 遵循从搜索者位于搜索结果页面到搜索者页面的路径’关于该搜索的查询似乎由于某种原因而停止。他们的研究提供了一些有关搜索线索的有趣统计信息:

统计数据表明,用户通常浏览距离搜索结果页面较远(即大约五个步骤),并在搜索过程中访问一系列域。平均而言,用户每个查询跟踪访问两个唯一的(非搜索引擎)域,每个会话跟踪访问四个以上的唯一域。

这表明用户通常不会在他们访问的第一个域上找到他们寻找的所有信息。对于查询路径,与之前所有域的总和相比,用户在该路径的最后一个域上还会访问更多页面,并且花费更多的时间。路径中最后一个域的这些区别可能表示用户兴趣,页面实用程序或页面相关性。

他们还提供了一些有关搜索查询的有趣统计信息:

对于频繁查询,可以简单地存储从Web活动日志中识别出的最流行的目的地,以备将来在搜索时查找。

但是,我们发现,在我们的数据集覆盖的六个月内,有56.9%的查询是唯一的,而97%的查询出现了10次或更少的次数,分别占所有搜索的19.8%和66.3%(这些数字是可比的)与先前有关搜索引擎查询日志的研究报告中所报道的内容相同(Silverstein等,1999; Spink等,2002)。

除了研究来自许多Windows Live Toolbar用户的查询日志之外,研究人员还将许多人带入他们的实验室进行研究。本文为我们提供了有关该研究的许多细节。

结论

的“final destinations” in this study aren’查询细化建议,但可能是与所进行的搜索相关的页面,如搜索者的实际搜索和浏览行为所见。

本文的附录显示了在Microsoft实验室中测试人员所承担的一些任务。您最终会在哪些最终目标页面上寻找此类问题的答案,其中包括以下列出的一些问题:

已知项目任务说明:

  1. 指出哈勃望远镜自1991年发射以来取得的三项积极成就。
  2. 在法国巴黎找到三家酒店,其中包括水疗和健身俱乐部。
  3. 确定在日本京都一个周末期间要做的三件事。

探索性任务描述:

  1. 您一直在和朋友谈论美国学生人数的增加和多样性。您决定找出过去五年来学生人数的实际变化。
  2. 一位同事最近被诊断出患有粉尘过敏。您对粉尘过敏和药物缓解症状的原因感到好奇,因此您决定进一步了解它们。
  3. 您必须计划在意大利西海岸进行为期五天的度假。您想找出意大利西海岸必看的观光景点,并了解意大利葡萄酒和托斯卡纳最好的葡萄园,以供您游览。

分享是关怀!

22想法“Microsoft跟踪搜索和浏览行为以查找权威页面”

  1. 谢谢,比尔。有趣的可能性(不是新的或毁灭性的,而是…),同时还考虑了吸引访问者的初始SE查询,从而构成了网站搜索返回的内容和内容的其他/可选阅读建议。应该能够增加网站和页面浏览量的时间。

    我不是很高兴‘提供热门目的地的系统导致更成功和有效的搜索‘因为这可能会使给定的回报变得越来越受欢迎,因此首先需要提供回报。而是赶上22。过度僵化可能越来越需要非SE普及‘曾经的权威永远是权威’ query rankings.

  2. 您’re welcome.

    我认为这很好地表明,如果您要尝试针对特定短语进行优化,则需要花费时间来确保优化的页面或网站上的其他页面能够满足人们搜索该短语的需求。

    在非搜索引擎上流行的好处。我认为有趣的是,通过此过程发现的许多最终目标页面都没有排名,也没有索引页面。有趣的是,该研究分支在未来如何继续。

  3. I never thought it was possible tracking your browsing behaviour when Microsoft is finding with my opnion their 权威性 websites. So if I search a long time from another Ip than mine, to my website, microsoft is thinking my website is authorative.

  4. 阅读此:p后,我的大脑感到疼痛。我想我要做的就是优化页面。一世’我刚刚打印了MSN纸,尝试看看我能从中得到什么。
    感谢您的注意

  5. 问候法案 ….superior帖子照常!谢谢你很高兴大公司的眼光超越了pagerank。相对于总页面数,可索引/可索引的网页百分比是多少?当我看到有多少个页面没有考虑搜索引擎的设计时,它永远不会令我感到惊奇。

  6. 嗨,雅克,

    谢谢。令人鼓舞的是,看到来自主要搜索引擎之一的过程确实超出了页面排名。

    在深层网络中,可能有数十亿个页面是故意无法爬网的,还有一些网站会根据要求动态创建新页面(例如,博客中用于访问者定义查询的搜索页面)。绝对应该考虑搜索引擎来设计更多站点。

  7. @快乐先生

    它看起来确实像页面的可用性,并且访问者找到所需内容的能力将在搜索引擎向人们发送邮件的位置中扮演越来越重要的角色。我不’认为这根本不是一个坏变化。

  8. @威廉·斯劳斯基

    Google在授权网站上这样做。如果您搜索的是权威网站,则可以在Google中看到一个搜索框,该搜索框使您能够在网站中查找内容。上星期六,我在一个博客上听说过它,它是Google的一项新功能。我必须承认,我不’t like it.

  9. 我个人认为信息必须是有用的,否则为什么要麻烦整理数据。话虽这么说,如果微软对雅虎的竞购失败,微软在挽回他们输给谷歌的土地方面并没有取得太大进步,垄断将持续很多年。

  10. 嗨,皮特,

    我认为Microsoft,Google和Yahoo在将人们引导到他们进行导航搜索时可能希望看到的页面上都得出了相同的结论。它似乎确实是有用的信息。 ðŸ™,

  11. 有趣。那么,也许Google和其他搜索引擎可以查看最终的目标页面,并授予它与初始搜索词相关的较高得分?

    那肯定会减少垃圾邮件页面的功能。

  12. 对我来说,隐形传送这个词带来了一些困惑。对我来说,这意味着它可以将您带到您没有去过的地方’t intent to go…

    但是Searchbox本身确实提高了SERP的质量。
    从Google的官方网站上,您可以确切地了解搜索的含义以及为什么此Searchbox可以向用户提供更好的反馈:[…向用户显示搜索框作为结果的一部分,增加了他们找到他们要查找的确切页面的可能性]。

    换句话说,它是一个出现在某些搜索结果本身中的方框。当Google检测到用户希望在特定站点内获得更精确的搜索结果的可能性很高时,就会使用此功能。

  13. 嗨,互联网营销专家和meta pasban,

    考虑到传送的方式,传送可能不是一个好的选择’过去曾在PageRank中的随机冲浪者模型之类的地方使用过,它表明某人在网络上移动可能在某个时刻随机地走到其他地方的可能性很小。

    但是在微软的论文中’使用的可能性较小–搜索者可能决定返回先前浏览过的页面的可能性。在网站内的Google搜索中,’用于表示附加搜索允许访问者在实际进入网站之前先在网站中进行搜索’的页面并使用网站导航。

    我不’认为整个学期会有很多困惑“teleportation”由Google或Microsoft提出-可能会赢得’不会被任何人使用。

  14. 我100%同意互联网营销专家对此的看法。我也有相同的看法,即如果Microsoft实施Teleportation,那将会带来一些混乱。

  15. never thought it was possible tracking your browsing behaviour when Microsoft is finding with my opnion their 权威性 websites. So if I search a long time from another Ip than mine, to my website, microsoft is thinking my website is authorative.

  16. @ MSN哈肯

    好吧。我猜是黑帽子,但可能。我读到有些人也在他们的Adsense竞赛中做到了这一点,只需单击单击单击即可,使用不同的IP’s and they’很快超出他们的预算,超出了预期…

  17. 嗨,MSN Hacken,

    在搜索引擎确定某个网页要被搜索之前,可能需要来自不同人员或IP地址的一定量的活动。“authoritative”用于特定查询。它’对于相当受欢迎的查询,很可能会有来自许多不同的人和许多不同的IP地址的大量活动。

    您好vertaalbureau engels,

    有些人确实尝试在Web上进行一些相当卑鄙的活动。当搜索引擎提出基于衡量用户行为的内容时,他们确实需要记住,有些人将尝试找到滥用这些过程的方法。我认为他们中的大多数人都考虑到了滥用行为的可能性,并试图找到方法将其过滤掉。

  18. 首先,我担心允许高级用户轻松优化其查询的网址参数,例如pws = 0,gl = US等,将消失。谷歌的Adwords预览工具证明了这一点。最初启动时,Google记录了URL参数,该参数允许高级用户模拟其地理位置。但是,目前在相关文档中没有提及这些参数。如果您不知道,则需要使用AJAX界面来做到最好。更糟糕的是,Google可能决定弃用或淘汰URL参数。我确实希望我在这些观点上是非常错误的。

  19. 嗨,马奎尔,

    老实说,我很少使用这些URL参数。太多的可能的内容过滤器和重新排序过程可以发挥作用,以使其完全有用。一世’d宁愿花时间在网站分析上,看看那里发生了什么。

评论被关闭。