用户意图和搜索查询的特征

分享是关怀!

搜索查询背后的用户意图

最近在加拿大艾伯塔省班夫举行的WWW 2007大会上的短发海报之一,是对来自三个不同搜索引擎的交易日志中的500万条查询进行采样之后,深入研究了搜索查询的分类。

他们使用该数据提出分类算法,然后将其用于“单独的Web搜索引擎事务日志 of over a million queries submitted 通过 several hundred thousand users.” 的results are interesting.

的article is Determining the User Intent of Web Search Engine Queries, from Bernard J. Jansen and Danielle L. Booth of Pennsylvania State University, and Amanda Spink of the Queensland University of Technology.

他们的发现表明,分类的查询中大约有80%本质上是信息性的,其余的查询在导航和事务性查询之间几乎均分。

作为后续措施,他们手动编码了400个查询,以与这些结果进行比较,并注意到其分类准确率约为74%。他们告诉我们,在其余查询中,“用户意图通常是模糊的或多方面的,这表明需要概率分类。”

作为此过程的一部分,他们为不同类型的查询定义了特征:信息查询,事务查询和导航查询。例如,以下是他们在信息查询中注意到的一些特征:

  • 使用疑问词(即,“ways to,” “how to,” “what is,” etc.)
  • 包含信息性术语(例如列表,播放列表等)的查询
  • 搜索者查看多个结果页面的查询

的“单独的Web搜索引擎事务日志” that they reviewed was from Dogpile, and they point to another longer paper that describes the study of that transaction log, which goes beyond identifying classifications for search queries. 的cited paper is:

Jansen,B.J.,Spink,A.,Blakely,C.和Koshman,S.
即将来临。 网络搜索器与Dogpile.com元搜索引擎的交互。 (pdf)美国信息科学技术学会杂志。

他们将Dogpile查询的研究结果与非元搜索引擎的研究结果进行了比较。该研究中一些有趣的统计数据,显示在本文的表格中。这里’瞥一眼其中的一些:

会话大小

1个查询 – 288,231 – 53.9%
2查询 – 88,875 – 16.6%
3查询 – 157,401 – 29.4%

每个查询查看的结果页

1 page – 1,052,554 – 69.07%
2页 – 253,718 – 16.6%
3页 – 217,521 – 14.2%

的rest are worth a close look.

在搜索过程中了解用户意图可能是将相关结果传递给搜索者的重要方面。此报告中信息搜索查询的百分比高于以前的研究’我看过这个问题。我们不是’告诉这是否是因为使用的日志是否来自元搜索引擎,但是它’仍然是值得考虑的结果。

WWW 2007文档中引用作为参考的其他论文:

  • Baeza-Yates,R.,Calderon-Benavides,L.和Gonzalez-Caro,C.2006。 的Intention Behind Web Queries。在“字符串处理和信息检索”中,(Spire 2006)。苏格兰格拉斯哥,电话:98-109。

分享是关怀!

关于9个想法“用户意图和搜索查询的特征”

  1. 法案–

    确实非常有趣,非常感谢您提出他的主题,并提供了一些很好的重点参考资源。

    好–至少我们现在知道,仍然有一些本质上是事务性的搜索!让我知道人们仍然希望在线进行交易。万岁,我们’仍然在这里是有原因的。

    I’d想看一项关于如何根据搜索查询确定某人在交易中走了多远的研究。我想这取决于查询的长度– right? Like –较长的尾巴=交易过程中的后期….?

  2. 嗨,杰克,

    谢谢。希望其中一些信息搜索和导航搜索也能导致事务搜索。

    I’我不确定较长的搜索总是表明查询是否是事务性的。有时人们在使用较长的查询时会缩短查询的时间,然后’找不到相关结果。

  3. Pingback:本周搜索引擎优化-6/1/07 |范博客
  4. 好东西比尔。持久数据仍然超越搜索查询的性质以及其背后的意图。花时间进行深入的关键字研究可以得出一个很好的内容策略,该策略既可以针对信息查询也可以针对商业查询(当然很有品味)。

评论被关闭。