使用页面质量克服对新站点进行排名的偏见

分享是关怀!

网页质量得分和较新的网站

Pagerank是衡量页面受欢迎程度的一种方法,但据一些研究人员称,它存在缺陷。问题是新的页面避风港’有机会像带有更多链接的旧页面一样被浏览。

这样的问题将如何克服?一种方法是确定查看新页面的人链接到该页面并使用“future”PageRank的度量,以将结果返回给搜索者。

页面质量白皮书

在Junghoo Cho,Sourashis Roy和Robert E.Adams的论文中, 页面质量:寻找公正的Web排名 (pdf),研究人员试图解决这个问题。这里’他们如何描述它:

在许多最近的研究中,研究人员发现,由于搜索引擎会在搜索结果的顶部反复返回当前流行的页面,因此流行的页面往往会变得更加流行,而普通用户会忽略不受欢迎的页面。这个“rich-get-richer”这种现象对于新的高质量页面尤其成问题,因为它们可能永远也没有机会吸引用户’从长远来看会降低搜索结果的整体质量。

页面质量专利申请

他们认为,解决此问题的方法是定义一个新的排名函数,称为 页面质量,可以克服这种普遍性偏见。今早公布了一项专利申请,其中的Junghoo Cho被任命为发明人,他为 页面质量,并描述了这种系统如何工作。

无偏页面排名
曹俊虎发明
美国专利申请20060294124
2006年12月28日发布
申请日期:2005年1月12日

抽象

链接页面网络中的页面根据页面质量进行排名。

通过确定页面的链接结构随时间的变化来获得页面质量,这是通过对网络的链接结构进行多次快照来确定不同时间段的页面的链接结构而获得的。

链接结构由它们的PageRanks近似,页面质量由以下公式确定:Q .function。 (p).apprxeq。 D.DELTA时代时代公关时间(p)PR功能。 (p)+ PR功能。 (p),其中Q(p)是页面的质量,PR(p)是页面的当前PageRank,.DELTA.PR(p)是页面的PageRank中的时间变化,而D是该常数确定项ΔPR(p)/ PR(p)和PR(p)的相对权重。

专利申请与论文之间有很多重叠之处,并且不对专利中定义的过程进行概述,而是’我建议,如果您有兴趣了解有关此工作原理的更多信息,请在着手处理专利申请之前先阅读一下本文。

这些文档中有一些有趣的内容,例如,网站创建后要经历三个不同的阶段:婴儿阶段,扩展阶段和成熟阶段。

婴儿期是由网页用户几乎不注意到页面并且几乎完全不受欢迎的时间定义的。第二扩展阶段是页面的受欢迎程度突然增加。在成熟阶段,页面的受欢迎程度似乎稳定在某个特定值。

测量和比较PageRank走向成熟之路的变化可能会提供“future” PageRank, which would show how popular a page might be if people knew about it, and had the choice of whether or not to link to the page. Ranking pages based upon that 未来 PageRank instead of the present one may act to overcome the biased search engines have towards popular pages at the expense of new ones.

专利申请中的结论定义了过去十年左右的搜索引擎对网页排名之间的差异也很有趣:

在很高的水平上,我们可以将质量估算器视为第三代排名指标。第一代排名指标(在PageRank之前)主要根据页面的内容来判断页面的相关性和质量,而无需过多考虑Web链接结构。然后研究人员[12,16J提出了第二代排名度量标准,该度量标准利用了Web的链接结构。本发明不仅通过考虑当前链路结构,而且还考虑链路结构的演变和改变来进一步改善排名度量。由于我们在判断页面质量时会考虑更多信息,因此可以合理地预期排名指标的效果要优于现有指标。

页面质量结论

目前正在使用此过程吗?它’很难说,但我注意到 加州大学洛杉矶分校知识产权与产业研究办公室 包含有关正在开发的算法的页面,该页面不再可用。

无论如何’有趣的是,有一个示例说明搜索引擎如何使用时间度量以及页面排名变化的频率来影响这些页面在搜索结果中的显示位置。

分享是关怀!

3个想法“使用页面质量克服对新站点进行排名的偏见”

  1. I think that you may be right. 那里’考虑页面质量时,查看页面上的内容具有很大的价值。

    如果人们知道,页面质量的前提是人们可以链接到的内容’不一定是个坏主意,我认为它可能会改善Pagerank的基本概念。

    但是还有其他方法,我’我可能会在今天晚些时候写一篇关于这本书的文章。

  2. 因此,此问题的核心在于页面质量问题,但是页面质量意味着什么呢?如果没有很好的页面质量定义,就很难衡量PageRank对其排名产生的偏见以及其他排名算法捕获页面质量的程度。

    非常有趣的专利法案,我’我只读了点点滴滴,但我认为他们’重新爬错了树。最终的解决方案是判断页面’基于什么的质量’写在页面上。链接将始终是一种流行度指标,它可能会也可能不会始终反映页面质量。

    如果Google有或正在考虑成立AI团队,那我赢了’随时向他们发送工作申请ðŸ™,

  3. 我很高兴这里的人们追求一种更好,更公平的网页排名方式。我的网站设计基于通过内容和专业组织的商业广告画廊来最大程度地提高质量。我在2010年发布了该书,但正在努力发展自己的商业网站。我希望有一天,网站的质量能成为先例,这样高质量的网站才能获得更高的知名度,并希望能带来更多的销售。我努力设计和发布了该网站,并经过了多次修订,以达到您今天看到的最终结果。一世’有点沮丧,甚至使用Blast4traffic尝试产生更多匹配,但收效甚微。谢谢你让我弯曲你的耳朵。 [电子邮件 protected]

评论被关闭。