雅虎使用查询历史记录来改善搜索结果?

分享是关怀!

如果有很大比例的人在搜寻“NY travel”在搜索引擎中选择标题为“飞往纽约市的机票”,搜索引擎应开始定义“NY” and “New York” to be synonyms?

搜索引擎可以从提供给搜索者的结果中学习吗?它可以根据返回结果的相似性以及人们面对这些结果时所做的选择来推断不同查询之间的关系吗?

如何设置搜索引擎,以便可以利用不同查询的历史记录返回相似的结果,并从输入这些查询的搜索者那里获得相似的选择?雅虎(Yahoo)的一项新专利申请探索了一种接近该结果的方法。

使用搜索引擎操作的矩阵表示来推断搜索引擎语料库中的文档
Shyam Kapur发明
分配给Yahoo!
美国专利申请20070094250
2007年4月26日发布
提交日期:2005年10月20日

抽象

在包括搜索引擎的计算机系统中,该搜索引擎接收查询并从文档索引返回包括零个或多个命中的搜索结果,一种后处理查询和结果的方法包括

收集搜索集,其中搜索集包括查询和响应于来自语料库的查询而由搜索引擎提供的至少一些搜索结果集,

将多个搜索集存储在参考符号存储中,

确定语料库中包含至少两个文档的分析集以进行比较分析,

从包含至少一个分析集文档的可检索存储搜索集中撤消,从而获得一组一个或多个搜索集,

生成分析集中的文档之间的推断,基于该推断在组中出现搜索集。

此过程可以研究大量查询和针对这些查询的大量搜索结果,并且可以帮助微调搜索引擎及其返回给搜索者的结果。

强烈建议阅读专利申请本身。那里’其中的一个奇数段为搜索引擎优化器提供了有关如何使用此处所述方法的建议,“reverse engineer” a search engine:

逆向工程

[0051]搜索引擎优化器(SEO)是为客户提供建议的组织,以使其页面在搜索引擎中的排名更高。一些建议是合法的(“成为受人尊敬的来源”, “使每个页面都集中在一个主题上”),而其中一些不是那么合法(“在隐藏文本中添加大量关键字”, “插入您的竞争对手’s trademarks”)的合法性可能与遵循该建议的搜索公众在网页上的排名有关。

无论哪种情况,通过使用搜索输入和输出数组执行搜索后分析,SEO都可以“reverse engineer”搜索引擎。值得注意的是,即使SEO无法访问通过搜索引擎的所有数百万个查询,它也可以生成一组代表性的查询,将这些查询应用于搜索引擎,并构建查询和结果矩阵。

无论搜索结果是否相关,研究和比较搜索结果是否可能都是相关的SEO最佳做法。’在此类专利申请中提出了建议。

It’不仅仅是一个问题“reverse engineering”搜索引擎,因为它了解与您可能要进行优化工作的术语相关的网络景观。无论如何’在主要搜索引擎之一的专利申请中看到这是一件有趣的事情。

分享是关怀!

关于11条想法“雅虎使用查询历史记录来改善搜索结果?”

  1. 这是一个有趣的应用程序,当我通读它时,我要看的东西之一就是Shyam Kapur参与的一些过去的专利申请。 重新排序 和increasing the relevance of the results of Internet searches.

    主要区别之一是“Reranking”人们首先尝试了解查询中的单位或概念,然后再查看这些查询与它们的搜索结果之间的关系,以及其他单位或概念与搜索结果之间的关系。这个不’一定要先专注于查找单位或查询,我认为这是探索查询与其关联的搜索结果之间的相关性的一种很好且有用的替代方法。

    我试图了解在专利申请中包含该段的原因,我’m wondering if it’从提供SEO服务的角度出发,试图将人们排除在开发利用专利申请中描述的过程的商业过程的过程之外。

  2. 当涉及到帮助搜索引擎理解单词,首字母缩写词等之间的关系时,我喜欢专利中的想法。它们’很明显,这是一件好事,我认为他们越接近真正理解单词,页面和站点之间的相互关系,这将是一件好事。

    您’没错,尽管它’s odd to see the 逆向工程ing part in a patent. It’这并不是完全令人震惊的新闻,但是看到搜索引擎提及它仍然很奇怪,更不用说专利了。

  3. 一种查看方式可能是搜索引擎比较类似查询的结果的一种方式,例如“New York Pizza” and “NY Pizza”.

    这些结果应该有很多重叠之处吗?可能是因为它们可能含义相同。点击每次搜索的某些结果可能表明搜索引擎进行了比较,但事实并非如此。 ’不一定只是可能会受益的点击结果。

  4. 因此,不仅可以通过指向站点的链接和站点上的关键字来对站点进行排名,还可以通过查询的点击来对站点进行排名。这是对搜索引擎算法的有趣补充,但是仅当您碰巧是搜索字词的前几页中排名最高的网站之一时,它仍然有用。同样,我认为这是有限的。

  5. It’现在肯定是搜索引擎开始思考改善搜索结果的新方法的时候了。我相信,个性化的搜索结果和其他方法将来会越来越普遍。它还应该使初学者更容易进行SEO,因为它应该打开更多的细分市场。

    无论如何,看看这是如何工作将很有趣。

  6. 我认为这对企业来说非常好。竞争对企业非常重要,而我’我很高兴Yahoo尝试为此做些事情。搜索引擎需要变得更好–接下来的十年将在网络上非常有趣。我们’仅仅在过去的一年中,我就看到了很多动静,很有趣的是,看到其他公司(即非Google)尝试通过抢回一些市场份额来实现这一目标。

  7. 我和先生结盟。威廉·斯劳斯基(William Slawski)回答:

    一种看待它的方法可能是搜索引擎比较类似查询结果的一种方法,例如“ 纽约披萨”和“ 纽约披萨”。

    .
    我说雅虎!保存并比较查询,并保存并比较搜索结果。
    AI(人工智能)由错误和结果集成在一起。
    (请为我的英语不好而打扰我)

  8. 嗯,我看到这篇文章发布于2007年,我想知道您是否对谷歌及其行为收集有了解?他们也疯狂地分析历史…who knows maybe it’是其排名因素之一。

  9. 嗨,马克,

    好问题。可以追溯到很多年前的专利申请中,有很明显的迹象表明Google一直在考虑使用用户行为信号对网页进行排名,包括Google’s patent filing on 信息检索和历史数据 从2005年3月开始。

    在过去的几年中,谷歌提交的许多专利申请都涉及页面排名,似乎确实包含了涉及搜索和浏览行为的某些方面。

    那里’还进行了一些讨论,并在PageRank上的第一篇论文中提到了使用实际Web使用数据的可能性: PageRank引文排名:将订单带到网络上,有关7.1估算网络流量的部分。

评论被关闭。