Google可以阅读您的想法吗?处理预测性查询

分享是关怀!

今天早上发布的专利申请没有’涉及ESP,但确实尝试预期搜索者在寻找什么。该文件上有一些Google杰出雇员的名字。

搜索引擎中预期的查询生成和处理
美国专利申请20050283468
发布时间:2005年12月22日
提交日期:2004年6月22日

本文档的重点是更快地返回搜索结果,并使个性化设置使这些结果与搜索对象更加相关。

在我最近 Google收购 帖子,我提到的公司之一, 卡尔蒂克斯,专门从事个性化和加快搜索结果。我还链接到 专利申请 在那里,分配给 卡尔蒂克斯,其中涵盖了这些类型的问题。

在该专利申请中命名的发明人,Sepandar D.Kamvar,Taher H.Haveliwala和Glen M.Jeh,也是在本申请中列出的发明人。所以,它不应该’令人惊讶的是它涵盖了个性化和搜索速度。

摘要:

搜索系统监视用户对搜索查询的输入。在用户完成输入搜索查询之前,搜索系统会识别查询的一部分并将其作为部分查询发送给搜索引擎。基于部分查询,搜索引擎将创建一组预测查询。该过程可以考虑由用户社区提交的先前查询,并且可以考虑用户简档。预测查询将发送回用户以进行可能的选择。搜索系统还可以在预期用户选择预测查询之一的情况下缓存与一个或多个预测查询相对应的搜索结果。搜索引擎还可以返回与一个或多个预测查询相对应的搜索结果的至少一部分。

这种预测性查询专利申请解决的问题?

搜索唐’t开始直到搜索者键入完整的查询。这些可以在完全输入查询之前开始吗?

答案是肯定的。如果搜索引擎在键盘击键发生时捕获它们,并根据对搜索者正在寻找的内容的预测开始向搜索引擎发送部分查询,则可能会加快该过程。

它是如何工作的?

It’显示起来比说起来容易。预测查询专利申请没有’不用说了,但是请看一下Googleuggest,这似乎是预测查询的一个很好的例子。

我们做什么’t see with 谷歌建议 是用于创建该查询列表的一些技术,它显示在查询窗口下的下拉列表中。我们也不要’看不到个性化那些预测搜索的能力。我们不’t know if 谷歌建议 使用该专利申请中描述的方法。

显示的预期查询可以基于其他用户的先前查询(就像他们的条目在词典中一样),并且可以合并用户配置文件以选择要使用的词典和要提取的查询。

可以对预测进行缓存,以加快检索速度。如果从先前的搜索者缓存了相似的结果集,则搜索引擎可以获取结果,而无需将查询发送到搜索引擎的完整索引。

预测性查询专利申请指出,该搜索可以通过浏览器,工具栏或其他输入设备完成。

该文档的确说明了几种机制,可用于使搜索对于搜索引擎的用户而言非常快,包括一些进行上述预测的替代方法。

触发并产生查询

可以通过多种方式触发预测查询的开始点:

  • 输入一定数量的字符后。
  • 从搜索器开始键入起经过了一段时间之后。
  • 空格键条目或类似内容(例如连字符)。

最终结果将通过按下搜索按钮或键盘输入按钮或类似操作来触发。

预测查询可以在下拉列表中显示,例如 谷歌建议.

甚至在搜索者完成输入之前和他们可能选择预测查询之一之前,就可能显示预测结果。正如专利申请所指出的那样,这将使搜索引擎看起来非常敏感。

通过缓存从这些预测查询中产生搜索结果是可能的,这可以通过降低搜索引擎的工作难度来提高其整体性能。如果结果不是’t在缓存中,然后搜索引擎将从搜索引擎中检索它们’的逆项索引和文档数据库。

也可以用来帮助创建这些预测性查询的一种方法是使用“auto-complete”服务器,可能会尝试将词典条目与搜索者输入的内容进行匹配。当这些内容显示在下拉列表中时,再次像 谷歌建议,它们可以按字母顺序显示,也可以按顺序显示“基于代表每个条目与用户匹配的可能性的度量或分数’s search query.”

使用字典进行预测性查询

可能有多个字典可用来匹配部分查询。这可以允许个性化匹配查询的词典中的条目。

例:

使用的字典可以匹配用户个人资料中的一个或多个兴趣,例如“体育,音乐,新闻,金融,美食,流行文化等 ”

这些词典可以由用户或用户以前在搜索中进行的查询创建“community”的用户。这样做的好处是,这些预测性搜索可以由通常提交的搜索中的一个或两个组成,而最近的搜索仍可以由搜索引擎缓存。这有可能加快结果的返回速度。

字典中的条目

每个条目将具有一个术语部分(可能是查询的单个或多个单词术语),以及基于该术语当时的受欢迎程度的受欢迎程度值。我们知道,当我们查看Google Zeitgeist时,Google可以跟踪其在全球索引中的受欢迎程度。在流行度分数中跟踪这些值应该是可能的。

例:

输入“Bri”可能会返回以下内容作为预测查询:

  • 布里tain
  • 布里tish
  • 布里tney
  • 布兰妮·墨菲
  • 布兰妮·斯皮尔斯

注意,在此示例中,将大写字母考虑在内。在实现该专利申请的替代版本中,可能不是。

给出了一些其他示例,这些示例描述了此预测可以起作用的其他方式。

什么决定人气?

结果的受欢迎程度分数可以通过突发新闻报道或受欢迎程度,甚至上次选择查询时间来告知。流行度信息的最后一点可以存储在缓存中,并且可以包含“reuse count”显示进行查询的次数。

用户个人资料信息已存储,并且可能包含诸如娱乐者的偏好之类的信息。对于上面的示例,条目“Britney Spears” and “Britney Murphy”这样,在(1)匹配,(2)选择和(3)排序中比其他术语可能会得到更多的权重。

哪些术语被缓存?

选择一些预测性查询以将其搜索结果缓存起来,从而预测将其选为最终查询。

可以使用许多因素来选择要缓存的内容:

  • 人气度
  • 新近度
  • 预定义的指标,可能考虑用户个人资料。

选择这些查询后,将根据搜索引擎当前缓存的结果对它们进行检查。单个或多个缓存可能已就位,可能需要检查。

虽然可能会首先在缓存中查找这些预测查询中的许多查询,但是如果没有’如果高速缓存中有足够的术语达到某个阈值,则完整的查询(最后一个查询)将由搜索引擎执行,以查找反向文档索引和文档数据库。

这些结果可以缓存起来供以后使用。

在搜索中组合多个词

当输入单个术语并且生成预测查询时,搜索者可以包括第二搜索术语。这可能会触发一组新的预测查询,并为其分配可能分配分数的结果。

当输入第二查询词时,可以将基于这些查询词的预测查询结果的分数与来自第一术语的预测查询相结合,以更好地适合搜索者。

如果添加更多的术语,此过程可能会继续,从而使搜索者在键入查询时可以逐步构建一组搜索结果。

当搜索者通过按回车键或按搜索按钮等指示搜索完成时,与直接从文档数据库中进行完全搜索而不进行此事先处理相比,这些组合结果可能会更快。专利申请描述了这种术语组合的其他方法。

其他问题

可以用于实现该过程的一些不同的硬件和软件配置在专利申请的其余部分中进行了描述。

These include such things as the makeup of a query processor, an 自动完成 server, some details of the whole search engine, and how the search assistant mechanism used, such as a browser window or toolbar, would function.

还有其他可能的方法可以将该过程合并到搜索引擎的工作方式中,并且该专利申请仅定义了一些可能的方法。

分享是关怀!

23想法“Google可以阅读您的想法吗?处理预测性查询”

  1. 有趣的文章,比尔。它’令人印象深刻的是,如何将每个字符输入搜索查询来回发送信息以创建它’的建议。感谢您发布。您可能想在我们最喜欢的论坛上分享它。 =)

  2. 谢谢,加里克。

    这很催眠,可以在您打字时看到Google建议的内容。结果的缓存也很有趣。必须在其中进行一些涉及热门新闻故事的搜索,并查看建议的查询是否与那些热门新闻匹配。

    我想我’今晚玩一点,然后将其发布到论坛上。 ðŸ™,

  3. Hiya Bill。我拖了一点点您的档案,这个就出现了。搜索的长尾巴已经成为相当长一段时间以来的热门话题,而这篇文章是在长尾关键词短语流行之前出现的。从某种意义上说,尽管他们的预测文本系统确实旨在加快信息检索过程的速度,但长尾现象无疑是由谷歌建议及其同类推动的。我必须说,回顾过去确实是很有启发性的。

  4. 嗨,雅克,

    谢谢。我喜欢将该概念与预测性查询联系在一起。

    我知道在撰写本文时,我已经意识到长尾词的使用。克里斯·安德森’的《长尾连线》中的文章 http://www.wired.com/wired/archive/12.10/tail.html 于2004年10月问世,在推广这一概念方面做得很好。在此之前的很多年中,我已经看到了专注于长尾术语的力量。我非常同意您的看法,像Google建议这样的东西使更多的人意识到了它们。

  5. 显然,这对Google现在是有效的,但我一直想知道“suggestions”长大了。是根据我的搜索记录吗?大家’的搜索记录?一堆信息放在一起?

    显然是’有很多因素。 ðŸ™,

    不过,我确实喜欢他们这样做。搜索者的帮助’s point of view.
    再次感谢比尔!
    杰森

  6. 嗨杰森,

    它可能基于许多不同的因素。想象一下一个搜索引擎,它使用您所隶属的社交网络中的信息以及这些网络中您所连接的人所使用的词。不确定是否会有所帮助,但这将是搜索引擎可以采用的另一种有趣的方法。

  7. 在即时搜索结果或实时搜索结果上找到了2010年9月以来的旧博客文章,不得不说这篇博客文章已经非常老了。变化越多,它们保持不变的可能性就越大。 ðŸ™,

  8. 嗨金伯利

    谢谢。我想知道Google是否会以他们在本专利中描述的方式引入即时搜索结果。我可以将其标记为“Google在专利中描述的可能做的事情。” 🙂

  9. 嗨,马修,

    I was thinking that Google might start showing immediate search results sometime soon after they introduced the drop-down query 建议 to their main web search in 2008.

  10. 搜索的长尾巴已经成为相当长一段时间的热门话题,并且这篇文章是在长尾关键词短语流行之前出现的。

  11. 嗨,艾米,

    有了这些预测性查询建议,长尾查询可能是所提供的建议之一,但是’比这更重要的是。一直以来,这都是一个谜,这就是为什么Google会选择一些搜索建议的原因,而使用Google即搜即得的建议则比以前更明显。

评论被关闭。