查询建议来自搜索引擎,它们提供替代查询以满足搜索者的信息或情境需求。
就像在网站上组织内容的信息架构师一样,搜索引擎设计师应渴望在用户的信息搜索过程的每个步骤中为他们提供香气。查询建议,分面搜索和结果聚类之类的技术都为用户提供了在下一步上取得进展的机会,而不必总是从头开始重新启动信息搜索过程。实际上,分面搜索是一种为用户提供此类指导的流行技术。
尽管用户最终有责任表达他们的信息需求,但它是搜索引擎’担任参考图书馆员的工作,并在此过程中为用户提供帮助。
重新考虑相关性并拥抱互动
由Daniel Tunkelang
在Google上搜索时,您可能会在搜索结果中发现一些其他搜索查询建议。
这些查询建议提供了相关的术语,当您使用的术语可能无法完全提供您所需要的信息时,这些术语可能会有所帮助’重新寻找。搜索引擎可以使用许多不同的方式来查找和标识潜在的查询建议。一种是通过查看搜索引擎’的查询日志文件,以获取潜在的查询建议。另一个涉及查看在搜索结果中找到的文档中出现的术语的频率,或特定查询的搜索结果摘要。
搜索查询建议是最初于2005年发布并于本周授予Google的Google专利的重点。 Google可能已采用其他识别查询建议的方法,但是该专利中描述的过程似乎在后来的工作中具有影响力,这些工作涉及在搜索结果中扩展查询,网页分类以及相关过程。专利发明人的几本白皮书详细描述了此查询建议方法背后的过程:
- A 基于Web的内核 Function for Measuring the Similarity of Short Text Snippets (pdf)
- 挖掘Web以确定单词,对象和社区之间的相似性 (pdf)
Google Scholar上的一张支票显示有150条被引用“Web-Based Kernel” paper.
简而言之,论文描述了当有人搜索时,搜索引擎如何发现它的可能性更高“AI,” they likely mean “人工智能,”而不是缩写的缩写。它说明了对Steve Ballmer的搜索可能如何包含针对以下内容的查询建议“Microsoft CEO,”而对比尔·盖茨(前微软首席执行官)的搜索可能包含针对以下内容的查询建议:“Microsoft Founder,” rather than “Microsoft CEO.”
它还说明了术语“NASA” and “Space exploration”可能被认为比“vacation travel” and “space travel,”即使前两个短语没有’t共享一个词,第二个词都包含单词“travel.”
该专利提供了另一个示例,说明搜索者何时需要查询建议:
语言困难可能会导致一个人搜索使用错误的关键字。对所搜索内容的语言不熟悉的人可能会使用错误的关键字。即使是熟悉内容语言的人也可能会犯错误。
例如,寻求有关在美国临时获得汽车的信息的英国公民可能会进行搜索“car for hire” rather than “car for rent.”后一个查询更准确地反映了美国英语的常规用法,并且可能会产生更好的搜索结果。
查询建议专利为:
由Mehran Sahami和Timothy D. Heilman发明
分配给Google Inc.
美国专利7,725,485
2010年5月25日授予
申请日期:2005年8月1日
抽象
搜索引擎接收来自最终用户的查询。搜索引擎在内容数据库上执行查询,并标识一组匹配的内容。搜索引擎利用匹配的内容来生成描述最终用户查询的查询向量。
搜索引擎搜索其他向量的存储库,称为“centroids,”生成与查询向量匹配的质心排名。这些质心被转换为搜索查询,并形成一组候选查询。搜索引擎过滤候选查询,以识别可能对最终用户有意义的查询。所选的候选查询作为查询建议返回给最终用户。
简单来说,这里’概述了专利中涉及的查询建议流程如何工作:
搜索引擎:
- 接收来自搜索者的查询
- 选择更多页面之一以响应查询
- 从每个页面中选择权重最高的字词
- 找出这些页面中最常用的术语
- 查看该查询是否之前已完成此过程,如果是,则查找这些最常用术语的先前集合(搜索结果会随时间变化,并且所收集的术语可能会有所不同)
- 计算每个先前存储的术语集合(如果有)与最近的术语集合之间的相似度
- 对先前的术语集合进行排序,以查看最接近的术语与最新的术语匹配
- 将词条从最高级的词条集合中转换为候选查询建议
- 按排名检查那些候选查询建议
- 如果候选查询建议包含原始查询中未包含的特定级别的新术语,则将它们添加到一组建议中;以及
- 响应原始查询,向搜索者提供查询建议集
所描述的过程可以使用在搜索结果中标识的完整文档进行原始查询,也可以使用这些文档的摘要或简短摘要(可能最多1000个单词)。
It’也有可能以其他方式使用通过此方法标识的术语,例如提供可用于扩展原始搜索的其他查询建议,或者通过提供可用于对网页进行分类的术语来帮助识别适当的广告,这些页面。
当搜索引擎寻找过去可能已经针对特定查询确定的术语(或质心)的先前集合时,它可能会从几个不同的来源中获取这些术语(或质心),例如:
- 从给定时间段内搜索引擎收到的真实查询中挑选出的查询,
- 管理员提供给搜索引擎的一组训练查询,和/或
- 手工编码的数据。
当我’如果对专利中描述的过程进行了粗略的概述,则会对其进行更详细的介绍。如果您想深入研究它,我强烈建议您先阅读上面链接的两篇论文,这些论文更易于阅读和理解,并包括许多其他示例。
其他查询建议的方法
这项Google专利最初是在2006年提交的,其中描述其流程的白皮书也是如此。尽管考虑到上面链接的第一篇论文在其他白皮书上被引用的次数,它使用的基于搜索结果的过程似乎具有影响力,但还有许多其他论文描述了识别可能的查询建议的其他方法。
许多较新的浏览器会查看搜索引擎的查询日志,以查看诸如搜索者在同一查询会话中使用的其他查询,在查询会话期间单击的页面之类的内容,或用于识别查询建议的其他基于搜索日志的方法。以下是其中一些内容,其中包括一些视频和幻灯片演示,主要是从2007年至今。
Google查询建议
- 查询分布相似度的大规模计算 (pdf)
- 西班牙凉菜汤和夏季皮疹:来自网络搜索查询的时间模式的词汇关系 (pdf)
Microsoft查询建议
- 基于用户登陆页面的查询建议 (pdf)
- 使用不同语言的查询日志进行跨语言查询建议 (pdf)
- 基于搜索的查询建议 (pdf)
- 使用击球时间查询建议 (pdf)
- 通过挖掘点击和会话数据的上下文感知查询建议 (pdf)
- 通过从搜索日志中学习非常大的可变长度隐马尔可夫模型来实现上下文感知搜索 (pdf)
- 具有隐式用户反馈的最佳稀有查询建议 (pdf)
雅虎查询建议
- 从搜索会话中挖掘潜在的广泛查询方面(pdf)
雅虎查询流程图
- 使用查询流图查询建议 (pdf) 视频
- 老化对查询建议的查询流程图的影响 (pdf)
- 查询建议的优化框架 (pdf)幻灯片
- 从“Dango” to “Japanese Cakes”:查询重新编制模型和模式 (pdf)
学术查询建议论文
- 分析和评估Web搜索日志中的查询重新编制策略 (pdf)
- 有意查询建议:在搜索过程中使用户目标更加明确(pdf)
- 用户为何忽略建议?:语义相关性和任务对单词识别的影响 (pdf)
- 通过查询搜索进行查询建议:Web搜索中支持用户的新方法 (pdf)
- 人气和质量对信息搜索过程中查询建议使用率的影响(ppt)
- 大规模搜索日志中的长查询分析 (视频)
结论
在本文开头,我引用了丹尼尔·图克朗(Daniel Tunkelang)的语录,他在发表引用该论文的论文发表后的某个时候加入了Google。他的建议是,搜索引擎开始更像参考图书馆员,而不是简单的网络索引,这是一个应该仔细考虑的问题。
当您为网络写作时,如果您专注于特定的术语或短语,希望有人会使用这些术语进行搜索,则需要记住,搜索引擎可能会向该搜索者建议其他查询。这些查询建议大部分可能是由搜索引擎通过类似Google专利或我在本文结尾处列出的论文中描述的过程自动生成的。
这些查询建议可能也会随着时间而改变–如果搜索引擎正在使用基于搜索结果的方法,则查询建议可能基于该查询的一定数量的顶部结果。如果搜索引擎正在使用搜索日志方法,则建议可能会根据搜索者在同一搜索会话期间使用的其他术语和/或在搜索结果或其他基于用户行为的活动中被单击和查看的页面而改变。
It’也可能会修改一些用于创建查询建议的过程,以查找其他术语来扩展具有不同查询或将页面分类为不同类别的查询,以将搜索结果按类别进行细分(例如Bing有时这样做)。
如果要为网站创建页面,并且决定将重点放在开发页面的特定术语上,则可能需要查看搜索引擎在这些术语的搜索结果中提供的建议,并密切注意这些建议。他们可能会提供一些有关更改这些页面的想法,或者,如果这些建议与您在网站上提供的内容有关,则可能会提供其他页面。
更新于2019年6月9日
在我看来,在我看来,可能的建议似乎更多地基于搜索量和搜索量。我知道这可能是一个过于简单的结论,但是最简单的解释有时是最好的?
嗨,约翰,
好问题。一世’有人认为,有根据的解释通常是最好的。如果该过程通常也很简单,那将是很好的,但是事实并非如此。’t always.
It’很可能部分根据查看量来选择可能建议的搜索次数。如果您在图书馆里,然后上了参考馆员’在服务台寻求帮助,以查找有关特定主题的信息时,馆员可能会问您是否要找到有关该主题的最佳资源或最受欢迎的资源,或者可能还会问您几个问题以缩小搜索范围对于。
如果Google在提供建议时像参考图书馆馆员那样,那么它可能会做类似的事情。
有时,建议会显示在搜索结果的顶部,当我看到这些建议时,它们通常会提供涵盖可能与我的查询相关联的不同主题的建议,其中某些主题可能会提供与搜索结果页面列表截然不同的结果显示在我的搜索结果中。这些建议可能给我各种各样的选择。
有时候,建议会出现在搜索结果的底部,并且在我的查询中它们常常是很受欢迎的选择–与我的搜寻结果有关’m seeing.
It’可能使用与结果查询底部不同的方法来找到结果查询顶部。它们有何不同?搜索引擎是如何提出它们的?
即使搜索引擎主要根据搜索号码进行选择,它如何确定要比较数字的建议?
We’幸运的是,我们对搜索引擎如何从白皮书和专利中找到了一些可能的解释,这些白皮书和专利来自搜索引擎的人们提供了一些线索。
并且,用于提供搜索建议的某些方法也可以用于扩展我们的查询,从而为我们提供更广泛的搜索结果。因此,它’可能值得花一些时间来更多地关注它们。
我使用seobook(免费)和我拥有的其他一些付费关键字工具进行了很多关键字研究。我忘了谷歌’的关键字建议工具,实际上只是去了Google,以了解他们对我当前正在写博客的关键字词组的建议。
感谢您的提醒。它’最容易记住的简单免费工具!
此关键字建议工具也存在于youtube中。尝试输入单词,然后会出现一个下拉列表,显示您可能正在搜索的可能关键字,并且这些关键字也是大多数人用于搜索的关键字。这对如何正确命名我的youtube视频有很大帮助。
希瑟,你好
这个帖子过去了’与Google关键字建议工具一样,它与Google可能建议的某些查询以及您搜索后的搜索结果有关’在Google上进行了搜索。它’除了Google之外,还应查看这些查询建议’的关键字建议工具,尤其是在进行关键字研究时。
嗨安德鲁,
除了在搜索栏下方的下拉列表中显示的预测查询建议之外,youTube还具有关键字建议工具。
嗨,比尔。像往常一样好东西。引起谷歌的注意’在关键字研究中,查询建议一直是我的基础。合理地创建具有相关锚文本链接比率的链接配置文件很有意义。
嗨史蒂夫,
谢谢。无疑,这些查询建议可以为您提供一些很好的提示,说明搜索引擎和搜索可能会发现哪些重要内容,无论您是否’在进行关键字研究,重新获得锚文本的想法,甚至只是搜索时重新查看它们。
谢谢帐单不错的帖子。实际上,当我第一次访问您的博客时,我是在第一次评论此帖子的。但是你没有’不批准我的评论。愿你认为我是垃圾邮件。但是我’我没有大声笑。无论如何,实际上我使用googler相关建议作为我许多帖子的关键字。谢谢
嗨阿拉曼,
有时候,有些评论会进入我的垃圾邮件队列或审核队列,并最终未获得批准。它’我可能以为您的帖子是垃圾邮件,对此我深表歉意。’t发布。我确实收到很多不喜欢的评论’似乎没有在帖子中添加任何内容,或者似乎只是人们获得链接回到其页面的唯一方式,而无意提出相关问题或观点,而这些问题或观点可能不会发布。
查看查询建议可以为关键字研究提供其他思路,因此绝对值得关注。
现在,我显然一直缺少很多信息。我听到了很多不同的做事方式,以至于我’我对研究的地方非常挑剔。这绝对是我信任Bill的网站。我从您的站点中学到的许多信息确实为我提供了我所需的其他功能。根据您要如何处理事物,查询可能很难处理。它们也可能非常令人沮丧,尤其是当它们没有为您提供所需的结果时。
嗨,托尼,
感谢您对我的网站的客气话,我’很高兴得知它对您有所帮助。
作为搜索者和网站所有者,我尝试着重注意搜索引擎如何解释我使用的查询以及网站访问者可能使用的查询。
It’看看不同的搜索引擎也可以向搜索者提供哪些查询建议很有趣。当您已经知道要搜索的内容时,其中一些似乎就不必要了。但是当你不穿’对该主题了解不多,有时它们会非常有用。