您如何估算搜索引擎的大小?

分享是关怀!

而且,您如何从该搜索引擎中获取随机页面?

Google的新员工Ziv Bar-Yossef于8月17日在Google上做了演讲,回答了这些问题。’s Index (video).

Ziv Bar-Yossef最近在 技术–以色列技术学院影片中指出,以色列几周前成为Google员工。在加入Technion之前,他是IBM Almaden研究中心的研究员。

该演示文稿基于获得2006年国际互联网大会最佳论文奖的论文: 来自搜索引擎的随机抽样’s Index

能够从搜索引擎获取随机页面’的索引可以提供有关该搜索引擎的一些有趣信息。该演示文稿比较了诸如Google,MSN和Yahoo中无效页面的数量,以及每个页面上文本的新鲜度以及它们索引的动态页面所占的百分比。

Ziv Bar-Yossef在美国的专利和专利申请:

分享是关怀!

关于2个想法“您如何估算搜索引擎的大小?”

  1. 嗨,亚历克斯,

    I’我有兴趣了解Bing未来的发展方式–搜索引擎之间的竞争可能是一件好事。

    那里 was a very interesting 在Cuil博客上发布 最近,它讨论了Bing,以及当Microsoft推出Bing时,他们增加了用于查找相关页面的排名信号的数量,但也显着减少了索引中的页面数量。这里’s a snippet:

    一项相当快速的测试表明,必应目前的规模约为Google的20%,因此已用其他排名信号替换了一半的索引。这意味着Bing索引不到10B页,这非常稀疏。从这个角度来看,自2003年以来,Google的规模并不小。

    我确实希望Bing的大小 ’的索引随时间增长。我的问题是,这样做的时候,它会显示出比其他搜索引擎(例如Google)更相关的结果吗?仅索引大小是’与搜寻背后的最终目标同样重要–向我们显示实际上对我们的问题有帮助的页面,这些信息和页面使我们能够执行我们想在线执行的任务。

评论被关闭。