预测性搜索查询建议

分享是关怀!

当您开始在许多搜索引擎的搜索框中键入查询时,您可能会在搜索框下方看到一个下拉菜单,该下拉菜单甚至在您尚未完成输入之前就为查询字词提供了可选建议。如果您在搜索框中键入网页的地址,这些预测性搜索建议也可能会提供网页的备用URL。

We’过去曾见过一些描述这种行为的专利申请,但是他们没有’我们没有详细讨论如何选择这些特定的预测性搜索建议。

谷歌本周发布的一项专利申请使我们对它提供的搜索建议有了更多的了解。有趣的是,基于诸如我们是否与否之类的事情,我看到的查询建议可能与您提供的查询建议有所不同:

  • 正在使用移动设备连接到搜索引擎或台式计算机
  • 可以识别为对某些主题或网站类别感兴趣的论坛资料的成员
  • 拥有搜索历史记录,搜索引擎可以用来将这些建议偏向我们感兴趣的内容
  • 正在查看附有特定配置文件的特定页面,并且正在使用搜索工具栏进行搜索
  • 可能以不同的连接速度连接到Web,或正在使用不同的连接类型
  • 可以在浏览器中或通过搜索引擎为喜欢的语言等内容设置不同的浏览首选项
  • 其他

该专利申请还描述了过滤器,这些过滤器可能会阻止某些术语和短语出现在预测性搜索建议中。有关以下过滤器的更多信息。

预测搜索建议界面

预测性搜索建议已变得非常流行,从一个搜索引擎到另一个搜索引擎,它们看起来非常相似。即使它们看起来很相似,每个搜索引擎提出建议的方式也可能大不相同。无论如何,我认为看看有多少搜索引擎提出他们的建议,并查看他们是否在其页面上提供了有关这些建议的任何信息,将会很有趣。

谷歌:

谷歌在其标题为“帮助”的页面之一上描述了其预测性搜索查询建议方法 Features: 谷歌建议。将查询建议整合到Google之前的某一时刻’在网络搜索中,Google在其实验实验室中有一个单独的页面,称为“Google Suggest”您可以在其中接收查询建议。该页面不再可用时, 谷歌建议 常问问题 仍然存在。

谷歌预测查询的示例

雅虎 Search Assist

雅虎’s predictive 搜索查询建议 have a slightly different look and feel, in a scrollable box that opens below their search box, and they are known as 雅虎 Search Assist.

an example of 雅虎 Search Assist predictive queries

Microsoft Live搜索建议

Microsoft Live称其为预测性搜索查询建议搜索建议

Microsoft Live搜索建议预测查询的示例

Ask.com

当我从Ask.com找到有关搜索建议的专利申请时,它主要描述了建议的界面,但没有详细说明这些建议的来源。它也没有’看起来很像今天在Ask.com上提供的查询建议。没有’Ask.com网站上有关其预测搜索查询建议方法的其他信息很多。

Ask.com搜索查询建议示例

居里.com

在Cuil上’Google的“功能”页面(不再可用)对他们对搜索查询建议的描述有些微妙,他们告诉我们:

当您键入查询时,有时您’ll see a search suggestion with an icon representing a website. Click on this link and you will go directly to that website. We let you look before you leap because not everyone feels 幸运.

大概是提到这个词“lucky” refers to 谷歌’s “I’m Feeling Lucky”该搜索引擎首页上的按钮,通常可以直接将您带到键入Google的查询的搜索结果中的第一个结果’s search box. Here’s what 居里’的搜索建议如下:

an example of 居里 predictive queries

预测性搜索查询建议的专利申请

已经有许多涉及主要商业搜索引擎的预测搜索查询建议的论文和专利申请。一世’过去曾经写过其中一些。如果你’d想看这些帖子,可以在这里找到:

我最新的专利申请’谷歌本周发布了有关预测搜索查询建议的信息:

使用排名结果自动完成的方法和系统
由Kevin A.Gibbs,Sepandar D.Kamvar,Taher H.Haveliwala和Glen M.Jeh发明
Assigned to 谷歌
美国专利申请20090119289
2009年5月7日发布
申请日期:2008年12月29日

抽象

当用户在文本输入框(例如,浏览器或工具栏)中输入文本时,向用户呈现一组有序的预测完成字符串。预测的完成字符串可以采用URL或查询字符串的形式。排序可以基于多种因素(例如,查询’用户社区提交的频率)。可以基于URL的重要性值对URL进行排名。隐私以多种方式考虑在内,例如仅当有一定数量以上的唯一请求者进行查询时才使用先前提交的查询。

The sets of ordered predicted completion strings are obtained 通过 matching a 指纹 value of the user’s entry string to a 指纹 to table map which contains the set of ordered predicted completion strings.

这与该主题的某些先前专利申请最大不同之处是告诉我们,基于一个可能的信号,为一个搜索者显示的预测搜索查询建议可能与为其他搜索者显示的查询建议有所不同。

虽然排名和显示特定预测性搜索查询建议的一种方法可能取决于显示为建议的查询在过去可能已提交给搜索引擎的频率,但是其他因素也会影响向谁显示哪些建议。我从一些信号清单开始了这篇文章。

User 个性化信息 may play a role in determining which predictive 搜索查询建议 you might see as you search. The patent filing tells us:

例如,用户个性化信息可以包括关于用户感兴趣的信息的主题,概念或类别的信息。用户个性化信息可以由用户直接提供,也可以由用户推断出’来自用户的许可’之前的搜索或浏览活动,或者可能至少部分基于与用户相关联或用户所属的组(例如,作为成员或作为雇员)的信息。

It’也有可能显示给搜索者的预测查询可能会受到本地存储在您的计算设备上的搜索查询的影响。所以,如果你’曾经搜索过某个主题,并且您的查询搜索历史记录可能包含一些查询,这些查询可能是您的搜索历史的一部分,可以为您提供这些查询以及可能从搜索引擎获取的新建议’先前查询的缓存,或者如果缓存不包含查询数据库’包含许多建议。

指纹和预测性搜索查询建议

可能会为您的搜索建议的搜索查询可以基于“fingerprint” associated with that search. Each query (or partial query as you type) can have many different 指纹s associated with it based upon several different factors, such as:

  • 用户提供的个人资料信息,包括位置信息
  • 从请求本身获取的信息,例如语言
  • 基于用户行为信号(例如,搜索会话期间的先前搜索)的与用户相关联的信息
  • 设备类型–掌上电脑的屏幕较小,可能会收到较少的预测查询
  • 连接速度
  • 连接类型
  • 与查询词相关的重要因素–在具有较高重要性因子的术语之前,可以从预测中删除具有较低重要性因子的查询术语
  • 与用户相关的类别– different sets of 指纹-to-table maps might be used for respective categories of users, where those categories or topics are associated with the user
  • 与网站相关的历史查询–从特定网站(也许通过工具栏搜索)接收到的部分搜索查询可能会映射到从相同网站或可能被视为与该特定网站相似的一组网站接收的历史查询生成的预测结​​果
  • 拼写错误–如果键入查询,可以认为是一个“单词拼写错误,”正确拼写单词的预测查询可以与预测结果合并
  • 概念提取 –可以对查询中的术语进行分析,以从搜索词中提取概念,以表明信息的特定类别,例如“technology, “food”, “music” or “animals.”
  • 社区会员–来自搜索者的查询至少具有一种类似的特征,例如:“属于同一工作组,使用相同的语言,具有与相同国家或地区相关联的Internet地址,或者;类似。”

筛选器

由于过滤器无法显示某些预测性搜索查询建议,因此它们可能不会显示在下拉框中。可能涉及许多不同类型的过滤器,例如:

隐私过滤器 –由于搜索引擎已接收到的查询数量是用来确定一个术语或短语是否应作为查询建议出现的信号之一,因此,’被一定数量的“unique submitters”可能不会显示给搜索者。

不经常提交的查询过滤器 –消除了很少提交且用户不太可能选择的查询。

适当的过滤器 –根据各种因素(例如查询中的特定关键字和与该查询相对应的搜索结果页的内容)阻止某些查询。

新近度过滤器 –阻止可能早于特定历史时间点(可能是几小时,几天,几周,几个月或几年)提交的查询建议。因此,如果某个特定的查询字词是去年常用的字词,而今年却很少使用,则可能不会显示该字词

反欺骗过滤器 –如果预测系统在大量人工生成的查询或URL提交中看到某些查询或URL,则可以使用它们来防止某些查询或URL出现在预测中。

结论

谷歌的专利申请提供了更多详细信息和示例,说明了如何针对不同的搜索者提出不同的预测搜索查询建议。我认为重要的是知道搜索时看到的预测查询建议可能与您看到的有所不同。

最近更新时间五月22,2019

分享是关怀!

37想法“预测性搜索查询建议”

  1. Poor 居里 when it first came out I had such high hopes but their biggest flaw was putting pictures next to the results because 75% of the time the pictures where 非常错误。

  2. 那 is interesting.

    一次,我发现这些搜索建议很烦人,但是当您相对不熟悉的主题进行搜索时,它们确实可以提供帮助。

    有时这些搜索建议确实可以帮助您“划出这片土地”在陌生地区进行搜索时。

  3. 您好,有趣的文章。您是否尝试过测试Google建议以针对同一查询显示不同建议?

  4. 在大多数情况下,我只是发现这些辅助功能很有趣,可以看到流行的话题,但是它们提供了一些措辞,可以帮助我专注于搜索。

    我还没有看到将语义搜索的发展并入这些功能。这可能是帮助搜索者发现更多信息的一种方式。例如,您可以输入“capriotada” and be shown “bread pudding”与语义相关。这可以帮助搜索成为更好的发现形式。想知道Wolfram Alpha是否会这样做。

  5. pingback:»Pandia搜索引擎新闻摘要10
  6. 这些预测性搜索建议是我所从事的事情的类型’我一直以为在那里,但我从未真正注意到它们在搜索过程中开始出现。我想他们没有’确实不会造成任何伤害,因为如果您愿意,您仍然可以进行常规搜索。所有公司’s seem to be doing it the same way so 我不’t think anyone’获得了任何特别的优势。

    您的例子‘baseb’显示了结果如何多样化– having fantasy 棒球 2nd on MSN is a strange one considering 棒球 is the second word rather than the first…

  7. 克里斯,你好

    关于Cuil,最让我困扰的是那些像您注意到的那样经常出现的照片“terribly wrong.”我希望Cuil在这些方面能做得更好,或者放弃它们并专注于显示更多相关的搜索结果。

  8. 嗨人查找器,

    如果你不这样做’不太了解某个主题,Google’预测性搜索建议的混合以及查询的优化建议可能会有所帮助。我只是担心可能会错过一些重要信息’经常被搜索到足以显示在这些建议中…

  9. 嗨弗兰克,

    Good points. 我不’相信我通常会过多地关注大多数时间下降的查询建议。我已经知道了’无论要提供什么建议,都将继续搜索。但是,如果显示出与语义相关的建议,我可能会更加关注。

    谷歌和Yahoo关于预测性查询建议的专利申请确实表明,他们将寻求更多类型的建议,这些建议可能与您的查询共享字母’重新输入搜索框。例如,在此Google专利申请中,我们’re told:

    在一些实施例中,分析查询中的术语以提取在搜索术语中体现的概念,这些概念指示信息的特定类别(例如,“technology, “food”, “music” or “animals”)。来自与一个或多个提取的概念有关的查询的一个或多个预测结果与返回给用户的预测结果合并。

    那 could make things pretty interesting.

  10. 嗨,亚当,

    那’实际上是显示的Yahoo结果“baseball” as the second word in the phrase suggested (fantasy 棒球). I’我实际上对其他搜索引擎感到惊讶’不会显示更多类似结果。从一个搜索引擎到另一个搜索引擎的结果也比我预期的要多样化。

  11. 你好比尔,
    我不知所措,无法根据我的预期看到预测性查询工具的价值’我们看到它悲惨地发生了。当我使用“why are black…”作为我的搜索查询,提出的建议并不能远程解决我感兴趣的问题,而当我使用“why are white,”why are Chinese”或爱尔兰或您选择的种族。通过拼写检查和行为相关性排名,我们真的需要从幽默感较差的机器或需要评估其先入之见的个人那里获得建议吗?

  12. 嗨,比尔,
    居里’的实现(类别匹配)很有趣。

    您是否看到过一些示例,其中基于与文档标题的匹配情况,网站搜索正在提出建议?

    我非常感谢您在博客上发布的所有精彩内容和研究成果。

  13. 嗨比尔–在专利应用程序上很好的发现。

    这些建议大约有50%的时间有用。当他们不是,那么他们很烦人–有点像微软回形针的东西。

    我猜还有其他要关闭的地方…

  14. 那些很烦人。我猜’d如果建议仅显示在搜索结果页面的底部,则更好。我通常知道我’m looking for, don’t need google’s help there.

  15. 嗨玛丽安,

    我遇到的一些有关预测性查询的第一批专利文件和论文都描述了开发此技术以帮助使用手持和移动设备(带有小键盘(甚至数字键盘))的人们的主要原因。如果搜索引擎可以预测您要键入的查询,则可以使您不必键入完整的查询。我认为这是个好主意。

    您看到的结果取自“行为相关性排名”过去来自其他搜索者的查询通常是您看到的预测查询的主要基础来源之一。

  16. 嗨,约翰,

    谢谢。我想知道实际上有多少人使用所提供的查询建议。很高兴在其中一个搜索引擎上看到一份白皮书,他们在其中讨论人们在搜索时多久选择一次预测性查询建议,以及人们多久关闭一次这些查询建议…

  17. 嗨,皮特,

    我认为Cuil也提供类别很有趣。我觉得’s a good idea.

    It’可能是标题在响应建议查询的搜索结果中显示的页面排名中起作用,但很难说出标题在实际查询建议中可能扮演的角色。似乎这些建议是由查询日志中的信息触发的。如果提供的查询建议也可以由要查询的查询的搜索结果中找到的信息(包括那些文档的标题,URL和这些结果的摘要)确定,这将很有趣。

  18. 嗨斯坦奇,

    谷歌已经在搜索结果中提供了查询优化建议。这样做的目的是提供替代方案,以帮助可能不太了解他们正在搜索的主题的人们。预测性查询建议背后的一个主要目的是提供建议作为快捷方式,以帮助搜索者减少他们在搜索时可能需要进行的键入操作

  19. 作为最终用户,这些预测性查询建议对我来说是完全有帮助的,因为它们消除了键入和敲入Enter键的工作,并且在大多数情况下,它们提供了我所寻找的确切内容。

    另一方面,这些建议对于网站所有者来说是一个很好的机会,可以针对这些搜索优化其网站,以吸引更多的访问者。

    您对此威廉有何看法?

  20. 嗨,阿格拉,

    我认为那里’在提供预测查询的搜索引擎中具有一定的价值,但希望这些预测不’不要让人们回避他们实际上可能经常意图的询问。

    网站所有者可以在搜索引擎中键入候选关键字词或短语,并从提供预测性查询,查看搜索结果中显示的内容,查看任何查询建议的改进内容以及查找内容等方面,查看搜索引擎的反应,这是很明智的。确定是否在这些搜索结果中显示混合的图像和视频,新闻和书籍以及其他类型的搜索。这样做可能会提供一些关于其他潜在关键字词条/短语进行优化的想法,以及其他一些关于如何对候选词条进行优化的想法,甚至可能是’一个好主意还是不针对这些术语。

  21. 嗨,阿维,

    谢谢。有趣的是,不同的搜索引擎尝试了不同的预测查询方法。看到他们根据他们的专利申请积极尝试将其他人排除在实验之外,这真是可耻的– I think you’没错,如果这样做的话,公众将是输家。

    也感谢您链接到Yahoo User Interface库设计页面。它’能够看到诸如预测查询之类的东西背后的一些代码真是太好了。链接到该页面底部附近的移动设备的相关文章也很有趣:

  22. 威廉你好,
    您说Google根据我们在移动设备(例如iPhone)上的查询或我们在社区资料中的声明等内容,提供了单独的预测性搜索查询建议。在何处描述了Google如何关联这些不同的信息。在德国,这种做法会与法律相抵触…

    br
    短剑

  23. 嗨,德克,

    真的很好的问题。谢谢。隐私和隐私法是我所要做的事情之一’我非常在意搜索引擎。

    谷歌可以用来进行预测性搜索的不同信息源清单来自我申请的专利’链接至以上内容(使用排名结果自动完成的方法和系统),该描述以此行开头:

    [0045]An applicable 指纹-to-table map 510 may be selected based on a number of different factors associated with a user or a request.

    .

    It’可能是预测性搜索可能没有使用专利申请中描述的所有那些信息源。该专利申请还指出,它将仅使用诸如从某人获取的信息’的个人资料(如果该人同意以这种方式使用)。在同一段中:

    类似地,单个用户在他/她的许可下可以具有用户配置文件,该用户配置文件指定有关该用户或与该用户关联的组的信息,并且“个性化信息”可以使用“指纹表”来识别相应的指纹表映射集,以在预测该用户的结果时使用。

    我不’对德国法律了解得足够多,以至于不能以其描述的方式允许这种使用。我们必须记住,它们在专利申请中描述的内容也可能以不同的方式实现。

  24. 我知道搜索引擎可以查看您提到的所有内容以建议搜索选项。我的印象是建议是基于关键字匹配的– broad and lateral.

    他们具有关键字工具,还可以跟踪大多数搜索模式。我当时想这就是他们用来提出建议的全部。

    添加到德克’如果他们使用我的手机或机器中的信息来建议搜索选项,则不应禁止上述说明。

  25. 嗨,拉维,

    搜索引擎仅着眼于关键字匹配的日子就已经结束了,甚至更久了。他们需要查看查询日志文件以跟踪搜索模式。

    我不’认为以汇总方式使用该类型的信息,而个人可识别信息不’包括在内,将违反隐私法。如果您创建有关自己的信息的个人资料,并且使用个性化搜索影响您可能看到的搜索结果,’我不确定这是否也是一个问题。

  26. 有趣。一世’m wondering if the patent conflicts in anyway with 雅虎’的搜索帮助,必应自动完成功能,询问(以及许多其他网站)?

  27. 你好乔纳森,

    与其他搜索引擎的专利和白皮书中提出的思想和方法有些重叠。我在上面的帖子中列出了一些。一世’确保每个都有其独特的功能,但我无法’•告诉您是否有人根据其专利申请在法律上质疑另一人是否存在问题。一世’留给搜索引擎的法律团队去探索。 --

  28. 嗨,比尔,

    您知道Google在哪个时间段内细化搜索查询建议吗?一个月或更长时间?

    感谢您的帮助!

  29. 嗨,德克,

    我们不是’虽然可以清楚地表明Google可以回溯多远,但是专利申请中提到了新近度过滤器,这表明Google可能只回溯了一段距离才能生成查询建议:

    [0050]一个或多个过滤器504用于确定被授权进行进一步处理的查询。例如,过滤器可以根据各种标准消除某些查询。在一些实施例中,隐私过滤器504防止未从多于一定数目的唯一提交者接收到的查询被包括在授权历史查询列表506中。这可以通过检查与每个查询相关联的唯一标识符来实现。存在一个,并且仅识别至少由n个唯一提交者提交的那些查询,其中n是基于隐私问题选择的数字(例如,三个或五个唯一提交者)。在一些实施例中,过滤器504包括过滤器,该过滤器消除了不经常提交并且因此不太可能被用户选择的查询。在一些实施例中,过滤器504包括适当性过滤器504,该适当性过滤器504基于许多不同因素(例如查询中一个或多个特定关键字的存在)和/或基于搜索结果的内容来阻止某些查询被包括在内。或与查询相对应的文档。其他类型的过滤器很容易想到。 例如,过滤器可以阻止早于特定历史时间点提交的查询,使得授权历史查询列表506代表最近提交的查询。被认为是最新的取决于实施例(例如,小时,天,周,月或年)。在又一个示例中,可以使用反欺骗过滤器504来防止查询/ URL预测系统被大量人工生成的查询或URL提交欺骗。例如,反欺骗过滤器504可以过滤掉从相同用户或相同客户端计算机接收的相同查询或URL的多个提交。

    *强调我的。

    所以我可以’不能肯定地回答您的问题,但我可以说Google可能不会’不想使用时光倒流到过时的数据。

  30. 嗨,我想知道Google根据什么显示建议?是否完全基于术语的搜索率?他们可以被操纵吗?

  31. 您好Nidhi,

    I’我们确定了搜索引擎在确定显示哪些预测建议时可能考虑的许多可能信号。

    那里 seem to be two main factors right now:

    1.建议是可以自动完成查询的内容–使搜索者不必输入完整的查询
    2.基于人们搜索特定相关术语的频率。

    但是,如果您查看上面标记为“指纹和搜索查询建议,”他们现在或将来可能还会考虑其他因素。当然,搜索引擎也可能会看别人。

    他们可以被操纵吗?

    可能,但我不会’不能保证这样做的能力。

  32. 嗨,马修,

    我喜欢Ask.com有很多东西,但是我’我对结果感到失望’从他们那里可以看到,新内容出现在搜索结果中的速度有多慢,从网络上删除的旧内容从索引中消失的速度有多慢。一世’d喜欢看到他们变得更有竞争力。

评论被关闭。