查询日志中的语义关系

分享是关怀!

在组织Web的过程中提供帮助的一种方法是使用人们在Web上所做的事情。

–Ricardo Baeza-Yates,摘自 Extracting 查询日志中的语义关系

当不同的搜索查询共享搜索结果中的多个页面时,搜索者之间的关联度如何?搜索者倾向于比其他结果更多地点击那些共享的结果?

如果你去雅虎’进行搜索并搜索词条[wcca],您在搜索结果中看到的第一个结果是标题为的页面“威斯康星州巡回法院。”如果您搜寻[威斯康星州巡回法院],’将在搜索结果顶部看到相同的页面。如果许多人在搜索这些术语中的每一个时都倾向于点击该页面的链接,而没有其他页面,’Yahoo可能会开始考虑那些查询词之间的联系非常紧密。

由于这种语义关系,搜索引擎可能会开始在原始查询的搜索结果顶部为搜索者提供对相关术语的查询建议。

Yahoo最近的一项专利申请探讨了这些类型的语义关系,并告诉我们,通过比较搜索者点击的搜索结果,它可能会学到很多东西。它基于在查询日志中找到的点击数据,描述了查询词的三种语义关系,其中跟踪了搜索者针对特定查询选择的结果。

同义词(密切关系) –共享基本等效的一组单击搜索结果的查询词。

较小但包含(包含关系) –其中,一个查询字词的点击结果集的大小小于另一个查询字词的结果,而那些点击的URL实质上包含在第二个查询的点击的URL中。

相关(较小的关系) –两个查询之间单击的搜索结果重叠的位置,但与上述两个关系的层次不完全相同–同义词和更少但包括在内。

在上面的示例中,如果搜索[wcca]和[威斯康星巡回法院]的人们大多点击了该搜索结果,“威斯康星州巡回法院通道,”搜索引擎可能会将这些查询词视为同义词。

搜索者点击哪些页面的选择被视为隐式用户反馈– searchers aren’t明确指出这些查询在某种程度上是相关的,但是当它们在搜索结果中为这些查询选择共享页面时,’假设这些术语是相关的。

搜索引擎将如何处理此信息?

它可能会在相关查询的搜索结果顶部提供查询建议,或者重新整理或扩展搜索结果以包括与其他查询字词也相关的结果。搜索引擎还可以使用这些关系以其他方式将查询与广告匹配。我们’告诉我们有关此过程的信息:

实施例可以检测网络的the语(例如,用户用于在网络上执行搜索的分类法)。

语义关系专利申请为:

Extracting 查询日志中的语义关系
里卡多·贝扎·叶茨和亚历山德罗·提比里发明
分配给Yahoo
美国专利申请20090164895
2009年6月25日发布
提交日期:2007年12月19日

从列出的发明者那里可以找到有关此主题的白皮书,该白皮书涉及ACM门户的订户在从查询日志中提取语义关系时可获得的专利申请。如果你’不是订户,有一个 影片介绍 里卡多·贝扎·耶茨(Ricardo Baeza-Yates)对此进行了介绍,我在这篇文章的开头也对此进行了链接。

Ricardo Baeza-Yates与他人共同撰写了三篇雅虎研究论文,其中引用了该论文,如果您愿意的话,也值得一看。’对搜索引擎如何使用查询日志感兴趣:

  • 搜索,Web 2.0和语义网搜索的重要性(pdf)
  • 查询日志图的派系分析(pdf)
  • 大型查询图的剖析(pdf)

I’撰写了一些有关搜索中同义词的文章。以下是其中一些:

上次更新时间为2019年7月4日。

分享是关怀!

7个想法“查询日志中的语义关系”

  1. 嗨人查找器,

    我同意您的看法,这是可以使Yahoo成为现实的方法’搜索更智能。我很喜欢这样的想法,即他们正在探索使用有关人们搜索方式的数据的方法,以使搜索效果更好。一世’曾经看到他们也在其他一些领域做到这一点。

  2. 哇,这个专利有趣的简介。我认为这是雅虎的明智之举’的一部分。除了简单地纠正拼写之外,还可以提高搜索的相关性或提供对特定术语通常有效的替代建议。感谢您的更新条例草案。

  3. 您 can see why Bing (Microsoft) wanted to group with Yahoo. Google offer this type of association with their ‘suggestions links’在搜索结果页顶部或底部的位置,取决于用户的感觉。再次向Bill撰写高质量的文章。你什么时候有时间睡觉?

  4. 嗨乔尔,

    您’重新欢迎。有趣的是,Yahoo实际上正在查看用户与搜索结果的互动,以得出关于这些结果可能如何相关的结论,以便他们可以进行诸如提出查询建议之类的事情。我在理论上喜欢这个想法,并且想知道它在实践中有多有效。

  5. 李嗨

    Thanks. 那里 may be some rhyme or reason why Google presents the questy suggestions that it does, where it does.

    我认为,放置建议的想法是,将更可能导致搜索者朝不同方向走的建议放在结果的顶部,而那些建议可以“additional” or “alternative”显示的结果信息位于结果底部。

    睡觉? ðŸ™,

评论被关闭。