赔率:可能的含义如何影响搜索引擎排名

分享是关怀!

当有人输入“George Washington”在搜索框中,他们可能对革命战争将军和总统比对华盛顿的一些乔治更感兴趣。搜索“Washington Hotels”在华盛顿寻找住宿的可能性比名为华盛顿的旅馆更高。搜索带有标语的地方“华盛顿在这里睡”可能与酒店无关(这些搜索者可能有太多时间在手)。

乔治和玛莎·华盛顿的石版画,有两个孩子,1889年,库尔兹和艾莉森最初拥有版权。

当搜索查询中使用的单词可能具有多个含义时,如果搜索引擎可以计算出该单词最可能含义的概率,则搜索引擎可以向搜索者提供更好的搜索结果。那’是上周授予Yahoo的一项专利的重点:

确定输入单词的可能含义的系统
由David Richardson-Bunbury,Soren Riise,Devesh Patel,Eugene H.Stipp,Paul J.Grealish发明
分配给Yahoo!
美国专利7,681,147
2010年3月16日授予
申请日期:2005年12月13日

抽象

公开了一种用于确定单词的可能含义的系统。获得单词的输入。可以根据单词的可能含义的先验概率和单词的可能含义的上下文频率概率来确定单词的可能含义。

Examples in the patent primarily focus upon place names, but the inventors listed in the patent tell us that the processes described could be used for other terms that could be interpreted more than one way. So, a 美洲虎 could be a kind of animal, a car, or a NFL footballer from Jacksonville.

搜索引擎可能会尝试计算搜索的概率“jaguar”可能旨在满足这些含义之一。如果添加了另一个术语,则可以根据上下文对这些概率进行不同的计算。搜索“Jacksonville 美洲虎” is more likely about someone playing 足球, while the odds are that a search for “Jaguar carburetor” isn’t.

A web search at Google for 美洲虎 brings back pictures of cars and cats. Same search at Yahoo shows a couple of images alongside snippets for pages, one of a feline in the wild, and one of a stylized feline in a logo for the automobile.

诸如Yahoo之类的搜索引擎(如果他们获得此专利的权利,可能还有Bing)如何使用单词含义的统计概率?专利’s的作者为我们提供了以下列表,说明如何以不同方式使用单词的最佳估计:

  • 网页可以被索引到搜索中。
  • 新闻报道的位置可以绘制在地图上。
  • 地理上相关的广告可以放置在网页上。
  • 可以计算增强的统计信息以用于查询分析。
  • 可以根据概率将搜索结果列表呈现给用户。
  • 广告可以针对按展示位置付费,每次点击费用,每次通话付费和按行为付费类型服务来关注这一含义。

搜索引擎可以根据搜索者意图查看与一种类型的相关内容相关的概率,对搜索结果进行排名,而不是尝试将查询与那些单词可能是出现在那些页面上或指向那些页面的链接中的页面进行匹配,而无需对搜索结果进行匹配。搜索而不是另一个。

因此,姓氏的人“Ind” and the first name “Gary”可能拥有一个个人网页,该网页可能在搜索结果中排名最高“Gary d.”但是,搜索引擎可能会计算出有人在搜索的可能性更高“Gary d.” wants to see information about a City named 加里 in the State diana, than the home page of 加里 d. Based upon those probabilities, it might 重新排名 search results for “Gary, d.”首先显示有关城市的页面。

如果您住在英国巴斯市,而您’需要水管工,您可能仍然很难找到自己想要的东西’当您搜索时重新寻找“Bath plumber”(祝你好运)。我们’关于斯普林菲尔德市的事:

例如,如果有三十个不同的地方叫“Springfield”,则可以生成三十一个先验概率,每个位置一个,再加上一个可能根本不是一个位置的可能性。

该专利确实提供了许多示例以及一些细节,这些细节以及如何针对单独使用的单词以及在其他单词的上下文中如何计算不同单词的概率进行计算。如果你’如果对如何使用概率来重新排名搜索结果感兴趣,您可能需要花费一些时间来获得这项专利。

当有人搜寻“Washington,” do they mean the State of 华盛顿 the District of Columbia, a City named 华盛顿 George, or something else completely? Probabilities, in addition to ranking signals based upon things such as relevance and quality and link analysis, may play a role in what pages show up where in search results.

分享是关怀!

关于61条想法“赔率:可能的含义如何影响搜索引擎排名”

  1. 这是一个非常好的专利。对于可能意味着很多事情的单词,也许它’取决于搜索者在其搜索词中包含单词提示,例如使其更具体。在Google上输入搜索字词时,’出现的下拉列表中列出了您可能要搜索的所有可能的事物。我认为这也可以帮助优化搜索。

  2. 有趣的考虑。我想知道它们是否/如何将地理因素组合到概率中。佛罗里达有人在输入吗“Jaguar”经常获得足球成绩?我的服务提供商通过科珀斯克里斯蒂市(Corpus Christi)为我提供路线,因此我出现在其中一些跟踪程序的城市中,但是当我在搜索中测试关键字时,经常会获得宾夕法尼亚州的本地搜索结果。概率的概念对于改善结果非常有用,但是很高兴看到它们如何结合其他因素来产生更相关的结果。

  3. 感谢您对专利的研究和分析。

    考虑到当今社会和生活状况的流逝,如今搜索者的搜索方式变得越来越复杂,因此该专利无疑会有所帮助。

    遇到了Aardvark大规模社交搜索引擎论文的剖析,指出与几年前的常规关键字搜索相比,搜索者的搜索方式更多地基于对话或问题。

    看看搜索引擎如何显示除常规蓝色超链接以外的数据将会很有趣。

  4. Web所取得的进步给我留下了深刻的印象。这确实会影响搜索引擎的优化。我来自一个小镇,我认为这样的事情确实可以帮助小企业传达信息。考虑到地理因素,当地企业似乎更有可能被看到。我很高兴看到它是如何发生的。

  5. 嗨安德鲁,

    我想知道,搜索引擎可以使搜索者更轻松地找到所需内容的最佳方法之一就是使搜索框更宽。

    如果这样做的话,人们可能会输入更长的查询,这可能会使搜索引擎更容易更好地了解搜索背后的意图以及查询中单词的上下文。

    我们在出现该下拉列表时看到的预测性建议通常基于查询和查询会话的历史记录,但是我’我不太确定它们是否完全遵循该专利包含的逻辑。我认为这些预测性搜索建议中存在一些概率计算。

  6. 嗨弗兰克,

    让’以您的示例为例,并扩大地理区域。想象一下搜索“football,”由美国某人,英国某人和澳大利亚某人完成。美国搜索者可能会获得英国和澳大利亚搜索者赢得的NFL结果’t。澳大利亚人可能会看到《澳大利亚足球规则》的结果,而英国将看到美国人所说的足球的结果。

    该专利确实没有’它指出某人从何处进行搜索,但是搜索引擎提供了专利和白皮书,描述了他们如何考虑这些因素。一世’d guess that there’根据佛罗里达州某人是否在搜索来计算概率“jaguar”更可能担心杰克逊维尔队。一世’我不确定该专利是否试图涵盖这种情况。虽然在阅读过程中我确实问过自己。

  7. 嗨,德里克,

    实时搜索将诸如Twitter之类的微博客工具整合到搜索引擎中’的指数确实提出了一些严峻的挑战–索引简短的内容,而没有太多的往返链接。我们已经了解了Google如何尝试在自动滚动并可以暂停的页面部分中显示推文和其他微博内容。那’严重地偏离了旧的十个蓝色链接。一世’d现场观看一项关于人们从该功能中进行选择的频率的研究’s displayed.

  8. 嗨,瑞安,

    我同意您的看法,如果在查询中使用地理参考时,搜索引擎可以更智能地知道在哪个位置,那么它将使小型企业和小镇受益。一世’我也为此感到兴奋。

  9. 一项聪明的专利可能会在大多数情况下有用。尽管有时可能会令人沮丧,并且实际上可能会对结果产生不利影响。我可能希望获得不太可能的学期的结果,而不得不投入更多的精力来获得所需的结果。我想我们将通过搜索市场份额的数字来看看人们是否能获得更好的结果。有趣…

  10. 李嗨

    对我来说,这似乎也是一种很好的方法,尽管我同意您的观点,即当人们键入查询时,有时可能会出现一些问题,这些查询可能被解释为搜索者未曾想到的含义。如果发生的最糟糕的情况是您必须修改查询并可能使其更具体一些,那可能不是一件坏事。

    一件事困扰着我’本地搜索是,如果我在一个位置中搜索一个位置,然后尝试在另一个位置中搜索另一个位置,则Google有时会尝试继续向我显示有关第一个位置的信息。可能基于我的第二个查询与我的第一个查询相关的概率。搜索引擎将其显示在概率基础上的结果可能会有用,但有时它们也会产生令人沮丧的结果。

  11. Pingback:社区管理,Twitter上的4…[Lu sur lablogosphré] |网络营销& co'm
  12. 香港专业教育学院注意到最近在搜索引擎中的一些变化。实际上,本地搜索为我提供了与在家(距办公室只有20分钟路程)相比完全不同的结果

  13. 嗨杰森,

    大约五年前,当我住在特拉华州,在距离马里兰州约30分钟,约30分钟的地方工作时,我也会看到一些截然不同的结果。他们中的一些人可能与我从中搜索的不同位置有关,但其他人可能与我在两个位置访问另一个数据中心有关。我不’不知道是不是您造成差异的原因’重新看到,但它们是可能的。

  14. 我不知道这种可能性搜索将如何与个性化结果交互。在我看来,如果他们使用概率,则根据他们对您的搜索行为的了解进行计算就很有意义。

  15. 大卫,您好

    有趣的一点。

    如果个性化搜索也使用基于概率的方法,则可能会更好。它会根据过去的搜索和浏览历史记录以及它收集到的有关您的其他信息,对您可能希望看到的内容进行最佳查询。

    该专利申请中描述的概率还旨在使某人搜索某物更有可能找到他们可能想要查找的东西,但是它’试图基于有关在Web上如何使用语言的信息以及对汇总查询信息以及搜索和浏览行为的分析来做到这一点。

    这些方法的某种组合可能效果很好–如你所说,“interaction” between the two.

    应该向那些可能会倾向于寻找有关Java编程信息的程序员的人显示有关该编程语言的页面,但他们可能对岛屿或饮料有兴趣,应向他们显示各种搜索结果,其中包括以及基于他们可能对当前编程以外的其他事物感兴趣的概率。

  16. @jason:您有没有在家中使用Chrome?也许Firefox或Internet Explorer在起作用?使用Chrome浏览器时,我发现有些奇怪的地方是,搜索任何给定短语后,我点击次数最多的网站实际上排名会越来越高。我只是偏执吗?或者实际上是这样吗?因为前一段时间,我致力于对网站进行排名,检查我在Chrome中的排名,有时还单击自己的网站。我终于到达了第一个搜索结果页面,过了一会儿我占据了榜首–至少我是这么认为的,但是当检查我在FF和IE中的排名时,我根本不在第一页上;在Chrome浏览器中,我排名微不足道。

  17. 这纯属逻辑。对它进行编程一定很困难。就像每一项发明一样。但最后,没有人真正知道人脑适合什么-

  18. 那’为什么个性化搜索结果在Google中得到了发展?那么,我们如何使搜索方式个性化?

    @wczasy–我同意,它使用了强大的思维能力和技能!大声笑。

  19. 嗨奥维尔,

    那么,我们如何使搜索方式个性化?

    I’由于搜索引擎一直在整合个性化和自定义搜索结果,因此我不确定我们是否能够做到。他们想向我们展示他们对搜索的意义,而不仅仅是提供包含我们在查询中输入的关键字的页面列表。

  20. 实际上,您可以轻松地取消个性化Google搜索结果!

    首先,请确保您已经避风港’t登录。请确保您已退出Google帐户。

    访问Google搜索引擎并输入一些搜索词。您’会看到列表照常出现。您可以在搜索结果上方的右侧看到“查看自定义”链接。单击该链接。现在,您就可以使用所有个性化和反个性化选项!

  21. 嗨,马丁(Martijn),

    通过采取概述的步骤,您可以看到较少的个性化影响,但是仍有一些您无法控制的自定义设置。举例来说,Google仍可能会根据您偏爱的国家/地区,语言和位置来偏向您看到的搜索结果。它仍然可能会基于汇总的用户数据以某种方式扩展查询,以执行诸如显示拼写更正和结果同义词的操作。根据您的位置,所用设备的种类,它可能仍会显示不同的结果’重新用于连接到Web,以及其他方式。

  22. 这篇文章太深了。上下文就是一切。有时,我使用Google Wheel,Quinutra或关键字密度分析器来帮助我确定要添加哪些术语以确保支持目标关键字。很好的帖子。 (一如既往)

  23. 嗨,詹姆斯,

    谢谢。 Google Wheel和quintura提供了一些有趣的术语可视化关系。一世’更少的关键字密度分析仪爱好者– they’在我看来,ve一直是软件制造商围绕搜索引擎如何对页面进行排名创建一些民间传说的工具。

  24. Google SEO算法不时改进,对我而言,他们对页面排名进行排序的方式更准确,更可靠。

  25. 嗨Mikaela,

    搜索引擎无疑旨在改善显示给搜索者的结果,但面临一些有趣的挑战。

    例如,您搜索的许多单词或短语可能具有不止一种含义,并且可能难以确定针对不同含义在顶部显示哪些结果。例如,有人在寻找“java”可能表示软件,岛屿或咖啡。作为搜索引擎,您首先显示搜索者哪些页面? --

    我们从搜索引擎中看到的一些有趣的方法是,有时查询词的同义词可能会提供比搜索者实际使用的词更好的搜索结果。 Google也似乎在尝试解决此问题。不过,这具有挑战性。

  26. 我认为,这种专利将极大地帮助您。不仅来自搜索者’既是网站管理员的立场,也是他们的立场,因此他们可以更好地针对自己的市场。另外,Google希望这样做,因为他们可以从更具针对性的查询中获得更多的广告收入。 --
    谢谢(你的)信息。
    亲切的问候,
    杰森

  27. 至于有关Google个性化的讨论,我可以添加以下内容:

    我已经体验到,使用家用计算机和工作中的相同短语进行搜索会产生稍微不同的结果。这是在单击取消激活的个性化设置之后,未登录到任何Google帐户并且已清除cookie的情况。

    我期望区别必须基于IP-nr,但是有些奇怪,因为它们之间到计算机的距离不超过5英里。

  28. 嗨Per和Jason,

    I’我在工作计算机和家用计算机之间经历了类似的事情,一项工作的距离约为14英里,另一项工作的距离为22英里。这些工作中的一个处于另一状态,这肯定是给我一个来自不同数据中心的结果,但是在14英里之外的工作环境中,我也会看到不同的结果,并且那个工作可能使用了相同的数据中心。

  29. 嗨,瑞安,

    我在上面撰写的专利来自Yahoo,而不是Google,但问题对于两个搜索引擎都是相同的。他们俩都想提供最好的答案,并且面临着这样的挑战,即在搜索者的查询中,他们通常只提供很少或更少的单词。

    It’仅向搜索者文档显示搜索查询中的单词出现在文档中,指向文档的链接中或同时出现在这两个位置上,就容易得多。它’如果这些单词可能具有多个含义,并且搜索的人可能对该单词的另一个或另一个含义更感兴趣,则难度会更大。

    It’这是Google和其他搜索引擎试图解决的问题。

  30. 嗨,比尔,

    与往常一样,感谢您的精彩文章。

    我认为这会使事情变得简单,希望我们’会得到比以前更好的结果。我只是想知道自从Bing为Yahoo Search提供支持以来,Bing是否将采用该专利。

    在必应(Bing)支持下,雅虎(Yahoo)会继续提出类似的有用专利吗?还是将它留给微软来完成所有工作?

  31. 我想知道Google是否已经使用了该系统,对我来说,他们似乎只是在没有任何其他情报的情况下简单地确定了最受欢迎和声誉最高的含义。

  32. 嗨,Max,

    一些有趣的问题。

    It’很难说出微软实际上是在为雅虎搜索提供动力的交易。他们会获得雅虎专利技术吗?我不’t know.

    雅虎会继续提出有用的专利吗?从申请专利到获得授权可能要花费几年的时间,因此可能还有很多专利正在筹划中,我们应该继续从专利中看到一些。雅虎还申请了涵盖广泛应用的专利,包括付费搜索和与运行一系列门户服务相关的技术。它’雅虎很可能会继续为这些类型的服务申请专利。

  33. 嗨克林顿,

    I’在此处撰写了大量关于不同方法的文章,Google可能会尝试使用这些方法来查找关键字在检索这些页面时是否出现在页面上,以试图了解搜索的意图。如果您查看我的一些有关搜索引擎如何尝试的帖子 重新排名 搜索结果,你’会看到一些例子。

  34. 我仍然不明白他们是如何确定我当时想看的可能性的。这是基于我以前的搜索历史记录吗?

  35. 嗨,科摩

    那里’混合多种信息,当搜索中的一个术语可能具有多个含义时,搜索引擎可能会在尝试确定搜索的意图时考虑这些信息。

    您的搜索和浏览历史记录可能会影响您在搜索结果中看到的内容,但是’搜索引擎可能也会查看的其他信息。

    例如,如果您住在佛罗里达州,’s a very recent and popular news story on the Jacksonville 美洲虎s, you might be more likely to see some pages in your search results on the NFL team. If a 美洲虎 recently escaped from a Florida zoo, you may see more results about the animal.

    搜索引擎不仅可以查看您过去的搜索或浏览历史记录,还可以查看许多其他搜索者的搜索和浏览历史记录。

  36. 我认为搜索引擎应该向他们显示一个随机页面,因为它们无法构建适当的查询-

    它可以工作,但是我可以猜到您要查找的内容有很多问题。当然SERP’s代表SE的页面’根据seo,他们认为最相关,新闻文章也出现在Google的顶部,如果您搜索可购买的物品(例如,索尼笔记本电脑),则会显示购物结果。

  37. 嗨,谢恩,

    I’我一直在听人们说,有时候想出合适的词来搜索某些东西会很困难。

    当你不穿’对某个主题不了解很多,而您’在尝试查找有关它的信息时,有时目录结构而不是搜索引擎非常重要。

    搜索引擎可以尝试猜测查询背后的含义,提供查询细化建议,根据他们认为可能是搜索背后的意图对结果进行排名,但是它可以’允许搜索者通过提供更多互动来完善其查询的方式可能会有所帮助。例如,让搜索者看到搜索引擎可能与查询关联的类别,可以为搜索者找到他们要寻找的内容增加有用的层次。

  38. 我认为必须给用户一些重点,如果搜索字词具有多种含义,或者可能会带回我所不希望的结果,则我特别要添加其他单词。

  39. 嗨,安迪,

    通常,您希望人们改进搜索查询以使用可以使他们更清楚他们所寻找内容的术语。当人们想要有关某个他们知道的话题的信息时,这通常可以很好地工作。

    但是当他们不这样做’对该主题了解不多,在查询中包括多余单词以帮助返回更有意义的结果可能会困难得多。

  40. 顺便说一下,这个帖子很有趣。我认为搜索引擎在显示结果时应显示选项。也就是说,您的意思是说乔治·华盛顿是美国领导人,等等。如果在广泛匹配中选择了该关键字,则搜索结果将显示与其匹配的内容。我尝试使用关键字“激光脱毛”,即使我想提供“激光脱毛服务”,Google仍然会显示该关键字,因为我选择了广泛的匹配项。它显示了很多组合。

  41. 你好萨尔贡,

    我相信我’在执行搜索时,现在看到的查询建议比以前更多。当您在搜索框中键入查询时,会显示预测性查询下拉列表,以及有时会在搜索结果及其下方显示的建议。

    对于广泛匹配的付费搜索,我认为广告客户需要非常谨慎地选择使用付费搜索的方式,并应仔细监控其广告系列,以确保他们不会’不会出现他们不遵守的条款’不想出现。

  42. 嗨,托马斯,

    人们可以更好地定义他们使用的搜索查询,但这对于可能已经知道他们正在搜索的主题的人们来说最有用。当某人搜索他们可能不了解的东西时,他们可能不知道优化查询以获取他们正在搜索的信息的最佳方法。

    例如,某人不’对足球了解不多,但是知道那里’s a team named the 美洲虎s might not know that the team is from Jacksonville. They might type in “jaguars”进入Google,并在结果中看到对杰克逊维尔的引用,因为搜索引擎可能已经决定,并非所有人都在搜索“jaguar”想要了解猫科动物的种类或汽车的型号,并且可能已经确定了一些搜索对橄榄球队也感兴趣的可能性。

  43. 我认为Google的新的预测搜索功能将使一般的互联网浏览器更轻松地找到他们想要的内容。不利的一面是,作为网站所有者,您不太可能捕获原本不适合您的流量。战斗继续!

  44. 保罗,你好

    预测查询建议实际上已在Google上发布’的主页已经有两年了–Google即搜即得实际上只添加了随您输入而更新的搜索结果,所以我不’不知道添加Instant会不会带来巨大的影响,可能除了Google可能通过更改我们可能会看到的一些结果来减少带宽而进行的更改之外。

  45. Bill,我刚刚发现了您的博客,只花了几秒钟便对其添加了书签。

    It’很高兴看到有人分析专利以深入了解算法。我一直相信,让自己进入搜索引擎’尝试思考如何解决搜索中的问题(例如为用户检索相关结果),这是理解搜索引擎为何以其行为方式的好方法。查看他们的专利又向前迈进了一步。

    I’我会关注你的著作。

    干杯,

    安东尼奥

  46. 嗨安东尼奥,

    无疑,从搜索引擎查看专利的最好的事情之一就是,您获得的视角与仅从营销人员,开发人员或设计师的角度查看搜索引擎时所获得的视角有所不同。

    谢谢。期待与您见面。

  47. 我认为Google为我们准备了各种有趣的东西。和我’m sure they won’告诉我们其中的任何内容,并将其不加通知地发送给我们。但是专利确实至少使我们对他们正在寻找和想要的东西有一些见识。

    It’有趣的是,当我使用Google时,突然看到它们的某些更改出现或消失。

  48. 嗨,丹,

    I definitely agree with you. 那里 are a lot of hints of possible new services and new approaches from Google in their white papers and patents, but likely some real surprises as well.

    而且,您看到的某些更改可能会出现和消失,这些更改可能来自搜索引擎正在执行的实时测试,以识别其中的某些更改可能收到的程度或对搜索行为的影响。

  49. 很有意思。

    我不知道个性化如何影响所有这些。如果有人持续访问汽车网站而不是猫网站(如果他们搜索关键字),该算法是否会失去其价值?“Jaguar”?我想这就是Google几乎每天都会说要更新算法时的意思。这样的事情!

    挖掘专利的出色工作也是如此。

    布兰登

  50. 嗨布兰登,

    谢谢。理想情况下,这样的系统应该独立于人为干预而工作,除了可能需要检查一下系统在提供相关结果方面的工作情况之外。当Google说他们几乎每天都在更新算法时,我相信他们的意思是他们在测试和测试分析之后对算法进行实际的手动更改。但是,许多已经实施的算法会进行某种机器学习,从而无需人工指导或决策即可更新结果。

  51. 好发现!

    您如何处理这些东西?无论如何,我认为Google’一段时间以来一直在使用这样的东西。我只是不’我不明白为什么每个人都认为Google的成绩如此出色,所以我发现它们通常正是我想要的。我永远不必离开第一页来找到合适的网站。

    我认为Yahoo!与Google相比,在8球上仅落后了一点。

    谢谢,
    兰道夫

  52. 嗨伦道夫,

    我花了很多时间来研究专利,大量博客的RSS提要以及搜索引擎的白皮书。

    通过Bing为Yahoo背后的数据库提供支持’s results, I’我不确定将来会从他们那里得到什么。

  53. 有趣的发现,比尔。您似乎在分析搜索专利和相关文档的细节方面有耐心。感谢您分享您对这个难以捉摸的话题的分析。

    通常,对于我使用的关键字词组,其描述性更强’在寻找,我倾向于获得更好的结果。但不总是。而且,如果我太具体了…特别是当使用引号或方括号时,有时搜索引擎不会返回任何结果。

  54. 嗨,唐,

    申请专利并尝试尽可能多地掌握其实质所面临的挑战有助于我学习,而且我认为这有助于我保持敏锐的头脑。

    在搜索中过于笼统和过于具体之间肯定有一条很好的界限。许多搜索经常会出现的一个问题是,如果主题是主题,那么您不会’对此一无所知,很难找到合适的词给您所需的结果。在那种情况下,我’通常,它会从一个更通用的查询开始,然后查看结果和查询优化建议,以期获得一个或更多个更具体的其他搜索的想法。

评论被关闭。