为什么有时候最好的搜索结果不是’t总是最热门的搜索结果

分享是关怀!

当我们谈论显示在搜索引擎中的结果时,我们通常是在与这些结果的相关性和重要性相关的方面进行描述。

有时我们看到的结果,而我们却没有’可以看出,它们受到其他因素的影响,例如搜索引擎采取的减少其为将结果返回给搜索者所必须执行的工作量的步骤。

使用两层搜索结果

如果搜索有可能返回数千个结果,而人们只看这些结果的前几页,则搜索引擎可以批量提供结果是有意义的,并且可能最初只使用经过修改(且尺寸更小)的他们的数据库来回答搜索查询。

第一索引层可能会修剪掉许多潜在结果,以便保留更有可能在搜索的最高答案处返回的文档。返回给搜索者的第一批结果可以从该修剪的索引中获取。

尽管此方法允许搜索引擎快速返回搜索结果,但它可能会提供一个结果集页面,该页面会遗漏一些本应包含的结果。’在索引的顶层–这些文档显示在首先返回的页面后面。

Microsoft的Alexandros Ntoulas和UCLA的Junghoo Cho撰写的新论文, 具有正确性保证的两层倒置索引的修剪策略,着眼于避免“由于基于修剪的性能优化而导致的结果质量的任何降低,同时仍然实现了其大部分优点。”

添加正确性保证

本文为搜索引擎提供了有关如何使用搜索引擎的建议。“正确性保证”确保修剪后的索引中包含最佳结果:

在两层架构下,如何避免搜索质量的潜在下降?我们的基本思路很简单:只有在确定结果与完整索引的top-k结果相同的情况下,才使用p-index的top-k结果。

这种方法的问题在于,计算修剪索引的最高结果和完整索引的工作量要比仅计算完整索引的最高结果要多。当然,正确性保证不会’不需要每次有人搜索特定查询时都运行,’s where there’潜在节省计算资源。

The paper delves into how often a 正确性保证 should be run for different queries, and policies for pruning certain keywords and documents.

It’很好地讨论了搜索引擎的方式 ’倒排索引可以被管理和优化。它还涵盖了作者对现代商业搜索引擎如何对文档进行排名的假设。

分享是关怀!

3个想法“为什么有时候最好的搜索结果不是’t总是最热门的搜索结果”

  1. 我浏览了整个搜索结果列表,发现当我得到大约一千个结果时,我发现自己已经死了。那么,是按照大约前200个结果进行讨论还是在考虑前3个页面?

  2. 嗨托德,

    一个很好的问题。本文真的是关于“搜索引擎优化”被优化的是搜索引擎本身。

    It’有关有效使用搜索引擎可用资源的信息,以及人们浏览第一页之后的搜索结果的可能性。

    那里 is a statement in the paper that surprised me a little:

    最近的一项研究[16]表明,大约80%的用户最多检查结果的前三批。也就是说,80%的用户通常向搜索引擎发出的每个查询最多查看30至60个结果。

    如果大多数执行搜索的人(80%)正在查看结果的前三页,则可能会尝试针对前30-60个结果(其中有30-60个结果)提出数据库的第一层结果与特定查询相关的内容。仅对最流行的结果进行这样的操作,并且仅当人们实际在搜索它们时,才将它们包括在第一层中也可能是有意义的。

    因此,这可能取决于搜索某些查询的频率是否有’是第一层的结果。这可能取决于某些查询是否甚至有30-60个结果(有时’t)。可能包含的结果数量可能取决于查询本身。如果需要更多结果,则始终有可能进入第二层以检索这些结果。

  3. Pingback:找不到您要搜索的内容吗?这是为什么在布里斯班SEO博客上的一些原因

评论被关闭。