I’最近我看到了几篇长篇文章,列出了来自Google的排名信号,他们启发了我开始在Google+上撰写一系列有关排名信号的文章。很有可能我会继续在那里的系列工作,特别是因为我’已经获得了一些很好的反馈。
该帖子包括前七个信号,外加八个信号–Google中描述的同现矩阵’基于短语的索引专利。
I’我还尝试包含指向我认为对支持SEO信号的SEO感兴趣的人最重要的一些论文和专利的链接。’ve included.
这里 are the first 8 signals:
1.本地互连
这个正在进行的系列文章将探讨Google过去可能用来对搜索结果进行排名的一些不同排名信号。回应查询。
2001年,克里希纳·巴拉特(Krishna Bharat)向美国专利商标局(USPTO)申请了专利,该专利于2003年获得批准。它所做的就是获取搜索结果的前几位(前100名,前1000名,等等),并根据搜索结果的频率提高搜索结果“cited”或在其中彼此链接“local” setting.
根据该专利,搜索结果按照通常基于相关性和重要性(PageRank)之类的方式进行排序,然后再次对其进行检查,并将本地相关性得分添加到组合中以用于更改顺序这些结果中:

此外,该方法对所生成的文档集合进行排名以获得每个文档的相关性得分,并为所生成的集合中的文档计算局部得分值,该局部得分值量化了所生成的其他文档所引用的文档的数量文件集。
您可能已经听说过,克里希纳·巴拉特(Krishna Bharat)通过将Hilltop算法应用于Google的工作方式,重写了Google在2000年代初期的工作方式。的“other references”此专利的“部分”指的是巴拉特(Bharat)加入Google之前的一篇论文,该论文描述了Hilltop是什么以及它是如何工作的:
山顶: A Search Engine based on Expert Documents
谷歌 has since published several patents 和 papers that may boost or demote some 本地 results based upon other signals, since then 和 I’将包括本系列中的一些。
Ranking search results 通过 reranking the results based on 本地 inter-connectivity
2.枢纽和机构
想象一下,网络上的页面可能会获得2组分数。这些分数是为了“broad topic” queries, such as “我想了解摩托车”.
第一分数可以是权威分数,取决于它对这个广泛主题的回答程度。第二个分数可能是中心分数,其中收集了链接的汇编,这些汇编可用于查找该广泛主题的权威页面。
专利一’链接到,是由发明人在AltaVista时写的,并在Overture收购雅虎后由Yahoo拥有,然后Yahoo收购了Overture。其中一位发明人是该系列第一篇文章的专利发明人Krishna Bharat,另一位发明人是Monika Henzinger。建议您从任何一个中读取任何内容。
A paper 被引 in the patent is one that should be read 通过 anyone studying SEO 和 studying how pages may be ranked in search results, 通过 Jon 克莱伯格:
超链接环境中的权威来源 (pdf)
在继续申请专利之前,请尝试阅读尽可能多的论文。–如果您阅读和理解它,它将变得更加容易。
该专利的目的在于改进Kleinberg论文中的“枢纽和权威算法”,以防止在焦点集中于可能具有多个含义的术语(例如,Jaguar可能指的是Car品牌,的动物,以及来自杰克逊维尔的NFL足球运动员)。

专利和纸业’即使来自巴拉特(Bharat)和亨辛格(Henzinger)都曾在Google工作,但您仍会在他们的工作中看到Hubs 和 Authority得分要素。
3.可达性
我不能’不能帮助自己,但要发表这本– at a rate of one a day, it could take some time to get up to 100-200 ranking signals, 和 我不 ’t know if I’我有足够的耐心。 --
有了前几个信号,我’前面已经提到过,Google想要确定权限和中心的想法起着很重要的作用,而某些页面是应该被高度评价的重要资源这一想法由此而来。
该专利专注于查看从其他页面链接到的页面的用户行为信号,以确定这些页面的可达性得分。良好的集线器是倾向于导致权威页面的页面。在一定程度上’类似于对充当良好集线器的页面进行评分。
我写了一篇关于该专利的文章,标题为:
Does 谷歌 Use Reachability Scores in Ranking 资源资源?
因此,基于从那些页面到其他资源的链接质量的某种度量,那些页面是很棒的资源页面,这可能会提高这些页面的排名。

在史蒂文·利维(Steven Levy)撰写的有关Google的书中,我们得知Google重视“Long Clicks”作为质量的信号。该专利确实描述了Google如何确定长按是什么,但没有’t use it as a direct ranking signal. Instead, it uses 长按 to determine the quality of pages that link to many other pages that result in long clicks. Those pages would likely be good Hubs pages. 🙂
4.突发性
乔恩·克莱因伯格(Jon 克莱伯格)注意到有一天,在一年中的某些时候,他的电子邮件充满了特定主题,例如在期中考试和期末考试即将进行的那段时间,他的电子邮件将集中于考试和额外的办公时间。
他注意到这种行为也发生在Web上,其中某些主题将由不同事件,博客,新闻,搜索查询等触发。他查看了总统信息之类的档案,以查找可能重复出现的术语以及触发它们的事件,并开始考虑信息流。

当流量通过网络时,它不是’t持续不断地流动着,但是却突然爆发。有时会有爆发的模式。拥有热门话题的感觉,已经冷却的话题,可能是季节性的或受一天中的时间或一周中的某天影响的主题可能会很有用。
搜索引擎使用的许多排名信号列表都提到了类似“freshness”,并且诸如新闻或博客搜索之类的算法很可能会使用“freshness”作为一个重要信号,但是当搜索引擎充当参考源(如图书馆)时,有时会需要更成熟的结果。
When Monika Henzinger published patents for 谷歌 on 文件开始日期 对于在网络上找到的文档,这些文档的日期是根据它们首次发布或由搜索引擎首次抓取的时间确定的。有时,这些日期的排名可能会受到影响。这可能会受到一组搜索结果的相对年龄的影响。
因此,如果搜索“宣布独立”出现了更成熟的文档,则可能会优先显示较旧的文档,而且搜索结果可能会有所提高。在寻找“Windows 8.1”,搜索结果集可能会年轻很多,因此,搜索结果中可能会增加新文档。
如果搜寻量突然增加“Justin Bieber 能够ada”,网络的突发性可能会导致较新的文档排名更高,并且我们可能会看到“query deserves 新鲜”在新闻文章和较新的页面在搜索结果中上移的位置中使用算法。
唐’t call it 新鲜, because sometimes mature pages are the ones that move up.
在线信息流的时间动态(PDF)
5. 语义接近度
有些人看到这个词“semantic” 和 ask where the 语义的 markup or schema.org markup is. This post isn’t for 您.
一些人看到了标题元素,并且想知道它们在页面上通常比其他文本更大和更大胆的事实是否会使这些页面在标题中的单词排名更高。这个帖子是’t for 您.
你们当中有些人在页面上看到列表,但列表中没有’甚至从技术上讲,都必须使用HTML列表元素,因为该元素认识到列表中的任何项目都可以按不同的顺序排列,例如按字母顺序,字长或什至随机排列,并且这些列表中的每一个都具有同等的价值。列出其他项目。它们与其他任何列表项一样接近列表标题中的单词。
紧密联系对于搜索引擎和SEO来说是不可思议的。搜索“ice cream”以及包含短语的页面“ice cream”应该比包含该短语的页面更相关,并且排名更高,“我去商店买了奶油,然后滑到冰上。

列表项不仅与列表标题的距离相等,而且页面上的标题元素与标题内容中的每个单词的距离也相等。我知道这是因为’s covered in 谷歌’s definition of “semantic closeness.”
页面上的每个单词与该页面标题中的单词的距离相等。那’页面标题的语义是什么,’s included in 谷歌’s definition of “semantic closeness” as well.
As I noted above, no schema.org markup was required to have 语义上的亲密关系。 Meaning happens, 和 some HTML elements have meaning baked right into them, which goes beyond just how they present things on an HTML page.
因此,下一次您看到有人指出标题元素的使用与Google排名之间没有关联时,请询问他们是否考虑了语义上的亲密关系,并让他们挠头。如果他们不这样做’不明白,他们可能永远也不会。
Document ranking based on 语义的 distance between terms in a document
6. Page 分割
您可能会问自己为什么要使用Microsoft链接,说实话’可能是因为Microsoft比Google或Yahoo编写了更多有关页面细分的文章,并将其背后的思想和概念带到了更深处。

谷歌确实有一些与页面细分概念直接相关的专利,我在其中包含了“10个最重要的SEO专利” series.
不过,以下是Microsoft在白皮书和专利中描述的一些内容:
- A 块级PageRank,其中来自页面上不同块或节的链接将携带和传递PageRank,就像它们是使用PageRank的旧方法中的页面一样。
- 一种确定哪个是 最重要的街区 在页面上,尤其是具有多个主要内容部分的页面(例如具有多个故事的杂志模式),以便最重要的块中的文本应具有最大的相关性值。
- 一种基于以下方式分析和理解页面的不同块或段的方法 这些街区的语言特征或部分。
在句子的情况下,该块的内容是否大部分使用完整的句子,只有首字母大写,并且使用全标点符号?
在标题的情况下,该块是否仅包含单词/短语列表,并且大多数情况下是否包含其他链接?
该块是否包含版权声明,以便’最有可能是页面的页脚,并且从相关性的角度来看,页面中的文字应该排名很低吗?
这是我的一些帖子’我们已经在网页细分上撰写了文章,对于那些想要对该主题进行更多调查的人:
- 谷歌 和 Document 分割 Indexing for Local Search
- 谷歌’s Page 分割 Patent Granted
- Search Engines, 网页Page 分割, 和 the Most Important Block
- Breaking Pages Apart: What Automatic 分割 of Webpages Might Mean to Design 和 SEO
7.合理的Surfer PageRank
PageRank是一种算法,它似乎已将Google与当时的其他搜索引擎区分开来,但是很可能它从被放宽世界的那一刻开始就发生了变化。我可以’真诚地写关于90年代后期的PageRank,但想指出一个不同的模型。
并非页面上的每个链接都具有相同的权重,相同数量的PageRank,甚至可能也不具有相同数量的超文本相关性。几年来,我们一直在Google代表,甚至Yahoo和Blekko等搜索引擎中听到过这种消息,’有人告诉我们,某些链接很可能会被完全忽略,例如那些可能出现在博客文章评论中的链接。

正如该专利告诉我们的那样,Google可能会看到“terms of service”在页面上,并且不会自动向该页面发送太多PageRank。
你看到名字“Jeffrey Dean”列为该专利的发明人之一,如果您开始研究其他Google专利,则您’会经常看到它。他经常撰写有关Google一直在建造的涉及全球数据中心的技术问题,以及整个机器如何整体工作的文章。如果您有几天的时间来研究Google的专利,那’找他写的东西很伤人。他的“Research at 谷歌”页面可能会让您不知所措:
这些年来,有很多关于PageRank的文章,但是如果您还没有,’没读过有关《合理冲浪者》的文章’您确实应该了解从随机冲浪者模型描述的转换。
这里’我写了一篇博客文章,可以用作入门:
谷歌’s合理的冲浪者:基于链接和文档功能以及用户数据的链接价值可能会有所不同
8.共现矩阵
I’在过去十年中,我写了几篇关于基于短语的索引的文章,’可能是那个时期最重要的SEO主题之一。也是最被忽视和低估的国家之一。 谷歌拥有多项专利,它们描述了基于短语的索引的工作方式以及Google如何将其纳入其反向索引中。
基于短语的索引的发明者也是21世纪最大的搜索引擎之一,即Recall搜索引擎的发明者,该搜索引擎在Internet档案库中用作Beta版。帕特森(Patterson)离开Google与其丈夫汤姆·科斯特洛(Tom Costello)一起启动了Cuil搜索引擎。该搜索引擎据说启动时有1200亿页。 Cuil失败了,但Patterson很快回到Google担任研究总监。
在基于短语的索引中,有意义的好短语在网页上被识别,并以反向索引映射到那些页面。在用于查询的搜索结果集中,可以识别在前100个,前1000个或其他一些集中共同出现的短语。对于可能具有多个含义的单词或短语,可以将这些结果进行聚类,以便将有关类似主题的页面组合在一起以找到其共同出现的短语。

这些共同出现的短语称为“related words”并且当它们出现在可能针对初始查询排名的页面上时,Google可能会在搜索结果中提升它们。如果太多“related words”出现在网页上,但超出统计的可能性后,Google可能会将其视为垃圾网页。
谷歌可能会寻找这些“related words”在锚文本中的位置,并且可以根据正在进行的同现级别,对与锚文本关联的链接进行不同的加权。这里’摘自描述其工作原理的一项专利,’s interesting to give our discussion of the HITS algorithm above, how it refers to documents pointed to with highly co-occurring 相关词汇 as “expert documents”.
[0206] R.i.Q.相关短语位向量* D.Q。相关短语位向量。
[0207]此处的乘积值是主题锚词Q如何记录文档D的分数。此分数在此称为“入站分数部分。”该产品有效地加权了当前文档D’通过参考文档R中的锚定短语的相关位向量获得s的相关位向量。如果参考文档R本身与查询短语Q相关(因此具有更高价值的相关短语位向量),那么这将增加重要性当前文档D得分的分数。然后,将身体命中得分和锚定命中得分相结合,以创建文档得分,如上所述。
[0208]接下来,对于每个参考文档R,获得每个锚定短语Q的相关短语位向量。这是衡量锚词Q对文档R的关注程度的一种度量。此值在此称为出站分数组件。
[0209]然后,从索引150中提取锚定词Q的所有((参考文档,参考文档)对。然后,按其关联的(出站得分成分,入站得分成分)值对这些对进行排序。根据实现的不同,这些组件中的任何一个都可以是主排序键,而另一个可以是辅助排序键。然后将分类的结果呈现给用户。对出站分数组件上的文档进行排序,使与查询相关的短语更多的文档成为锚点的排名最高,从而将这些文档表示为“expert”文件。对入站文档得分进行排序,使锚词经常引用的文档排名最高。
基于短语的索引专利非常丰富,还有许多其他元素需要更深入地研究。在下面的文章中,我详细介绍了其中的一些内容,但是浏览其余的专利揭示了Google可以使用此共现矩阵的许多其他方式。
这些专利中有很多与我的帖子相关 10项最重要的SEO专利,第5部分–基于短语的索引
结语
这不是’到最后。但是我可能会赢得很多信号’包括在本系列中,因为实际上确实没有’很多支持他们。我的一些因素’在排名信号列表中看到的可能比其他任何东西都更神话,我可以解决其中的一些问题。
谷歌在任何时候都可能使用多种算法的可能性很大,而我们’有人告诉我们,搜索引擎每年会对页面在搜索结果中的排名进行大约500次更改。
I’将会进行探索,但是我希望我所包含的信号能够为想要自己进行更多研究的任何人提供起点。如果您愿意,请告诉我!
Great 文章 as always. 谢谢for the depth 和 details. I’我将阅读这篇文章几次。
您 are touching on things here which I have not read about before such as “Semantic Closeness”我就是所谓的“页面优化”,“Page 分割” thanks again!
嗨,比尔,您真好,可以将所有信息放到一个帖子中。您是要更新此帖子,还是将第2部分单独放置?
嗨约翰尼
谢谢–我想在这组排名信号中加入一些人们可能从未见过或看到过的东西,这听起来像我成功了。
嗨,伊万,
谢谢。我想我’可能会创建一个后续帖子,而不是直接添加到此帖子中。那给了我做我自己的机会’我们已经完成了第一个任务,并添加了一些其他文本和图像,以及可能的一些新信号。
法案,
这把所有其他“Google排名信号” posts to shame.
嗨,比尔,
这是一个非常有趣的阅读!了解Block Level PageRank给我留下了深刻的印象,我认为这将是处理来宾博客垃圾邮件的好方法,尤其是在作者个人链接方面。例如,可以使用较低的PageRank值对其进行标记和加权(当它们不是nofollow而是活动链接时)。当您链接到状态为“块级PageRank的文档可以在一定程度上反映Web的语义结构”时,在此情况下,文章后的生物部分中的链接可能会被贬值,如果它们不相关或与语义无关。页面上的文字。
在这方面,绝对没有必要因欢迎撰稿人并跟踪其链接而对网站进行惩罚–我认为,贬低某种过度开发的做法的效果可能比谴责并继续进行是一种更为成功和有见地的方法。捕杀女巫。您是否认为这是可能的,甚至可能已经在该领域使用?非常感谢您分享您的想法,并以比可读性更高的专利文档可读性和涉及性强的方式来汇总信息。
谢谢,迈克
我没’不要认为这是一场比赛,而是“我想看什么”当面临许多排名信号时。我决定想看的是有关这些信号的一些论文,专利或什至博客文章,这可能有助于引起人们对搜索引擎为何认为这些重要以及搜索引擎如何使用它们的想法。 --
嗨妮维娜娜
块级细分和PageRank论文非常有趣,它’Google很可能会限制评论中链接所传递的权重或价值。合理的Surfer PageRank方法也可能也会这样做。
感谢您指出论文中的那段引文,即如果生物与页面上的文本不相关或在语义上相互关联,那么如何将其忽略。它’像这样的陈述值得寻找和关注,因为它们表明许多排名信号之间存在关联。
I did have one of the search engineers from Blekko leave a couple of comments in the past when I wrote about, I believe it was Page 分割, who pointed out that they pretty much ignored links from comments
嗨Trond,
谢谢!这些绝对是我所要做的事情’我通常会一直在寻找,无论我是否’是否撰写博客文章。搜索引擎对网页进行排名时会看什么?一种类型的排名信号如何与其他类型相互作用? 谷歌如何在页面上找到相关性或含义或质量标志是我们所做工作的核心,这对于我们在创建新页面或帮助某人改善现有页面质量时要牢记至关重要页面。 --
谢谢乔瓦尼!
嗨,迈克尔,
Krishna wrote his 山顶 paper before he worked for 谷歌, 和 the 本地 inter-connectivity patent has nothing to do with 谷歌 News.
看到:
ftp://ftp.db.toronto.edu/pub/reports/csrg/405/hilltop.html
巴拉特(Bharat)是Google新闻的发明者,众所周知,他的名字是专门针对Google新闻的专利,该专利在过去几年中的连续专利至少更新了两次。
我不 ’无论如何,这并不意味着建议有兴趣学习Google排名信号的人阅读了Jon 克莱伯格’s work or Bharat’s paper on HillTop, or his patent on 本地 inter-connectivity. 🙂
我想你已经花了很长时间写这篇文章了。经过两次阅读,我的结论如下:’只有一个比尔·斯洛斯基(Bill Slawski)! --
优秀的阅读,比尔!
好吧,特隆,Bill是我遵循的最熟练的技术SEO之一,非常感谢您的所有文章-
嗨迈克尔
也许您可以分享其中一些文章以及Matt Cutts网站管理员视频,如果您还记得那一篇呢?
能够 您 tell us more about how 山顶 applies to 谷歌 News, since 您 insist that it was only used in 谷歌 新闻and no where else at 谷歌?
谢谢。
Krishna Bharat wrote 山顶 for 谷歌 News. 您 may have just mislead a whole new generation of SEOs into thinking that 山顶 has been running amok in the 网页search SERPs.
谢谢迈克尔
我真的不喜欢人们根据传闻提出论点,或包含他们不喜欢的话题’没有提供任何相关性,所以我问。我感谢您花时间做出回应,即使我没有’不能理解为什么要提出某些论点。
Bharat worked on a number of algorithms 和 patents for 谷歌, 和 many of those were on 网页Search rather than news search:
http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&u=%2Fnetahtml%2FPTO%2Fsearch-adv.htm&r=0&p=1&f=S&l=50&Query=in%2F%28krishna+and+Bharat%29&d=PTXT
I’想知道为什么要提出IP地址/域问题?那和什么有什么关系?您能否详细解释为什么您认为这很重要?谢谢。
That 谷歌 used 山顶 for 谷歌 新闻is well-documented, at least in the Indian media where they proudly hailed him for his accomplishment.
Matt Cutts 和 other 谷歌rs have also pointed out repeatedly that 谷歌 does not throw out results from similar hosts in 网页search. They cannot afford to do that. 山顶 was never used in 网页search 和 probably never well be.
人们可以搜索诸如“google” 和 “wordpress” to see that 山顶 is not being used to select 和 rank the search results.
To include 山顶 in a list of ranking factors that 谷歌 has used for general 网页search results is simply a wrong placement. It was never intended for that 和 at no time does it appear 谷歌 ever intended to use it that way.
他们还有其他算法可以防止在相同的域集下混乱结果。
不幸的是,SEO行业中的许多人花了很多年错误地告诉彼此,以及其他任何愿意听Hilltop负责的人。“Florida”在2003年(不是—Google于2002年在Google新闻中实现了Hilltop)。那个胡说八道终于消失了。
我现在怕我们’再加上SEO几年的时间,都将Hilltop作为一个因素,因为我们在这些事情上都给您很大的信誉。但是这一次,您很误会。仅Google员工的拒绝就应该表明这一点。我相信,甚至在马特(Matt)揭穿这个想法的网站管理员视频中也是如此。
谢谢迈克尔
我希望你’很快就会好起来。
书中有一段,“In The Plex”谈到克里希纳(Krishna)以及他加入Google的经历,以及他从事的第一项专利“网络连接分析。”本书的这一部分非常有趣,并讨论了他的HillTop版本。它’s at:
http://books.google.com/books?id=V1u1f8sv3k8C&pg=PA38&lpg=PA38&dq=in+the+plex+hilltop&source=bl&ots=BRvP8vdkfy&sig=ZhoOf8-frwSxOgCFseo4oVGwLyk&hl=en&sa=X&ei=iAEeU6DJA4Ht0wH6oICwCA&ved=0CDIQ6AEwAQ#v=onepage&q=in%20the%20plex%20hilltop&f=false
它没有’t refute what 您’说,还是支持我的话’我在说,但确实提出了不同的看法。
Local Inter-Connectivity专利于2003年被授予,但它早在2001年就已提交,这将更适合您的时间表
根据本地互连专利对页面进行修剪似乎是在计算本地分数时,并且不会’t阻止Google在来自相同域或IP地址的搜索结果中显示页面。请参阅本地互连专利的权利要求2和3。
仅因为显示了这些结果就不会’这意味着它们必须用于该本地分数–因此,本地互连是否有效’一定要被Google员工关于将来自相同域或IP地址的搜索结果包含在显示给搜索者的结果集中的说法所否定。
我的专利’一直与巴拉特有联系’s initial work on 谷歌 新闻(and 我可以’不能肯定地告诉您)是:
用于对新闻内容进行聚类的方法和设备
和
用于提高新闻报道排名的系统和方法
在里面 Bharat/Mihaila 山顶 paper,它的确看起来像是在Compaq上开始的,也许是在Bharat在Google上完成的,因为它给了他“current”地址是在Google处,但他在脚注中的简历告诉我们:
山顶论文(不一定在本地互连专利中使用)继续定义他的意思。“expert documents”以及如何通过在诸如页面标题和标题以及锚文本之类的源中找到特定的关键字短语来从较大的文档集中识别这些关键字:
I’抱歉,您不得不要求我进行研究。这是非常非常古老的新闻。
不过,这里有一些参考。一世’从采访开始,克里希纳(Krishna)谈论开发算法(从2001年底开始)—并且他当时已经在Google工作)。
http://www.niemanlab.org/riptide/person/krishna-bharat/
这里 is a 谷歌 Books citation (a biography from 2008). I have shortened it.
http://bit.ly/1kb2UeS
He joined 谷歌 in 1999, according to their bio page for him:
http://research.google.com/pubs/krishna.html
许多SEO放弃Hilltop(和LocalRank)的想法之一是Google将以某种方式对待托管在同一IP地址上的多个站点与托管在其唯一IP地址上的多个站点不同。马特(Matt)多次否定了这个想法,但我只有时间找到这篇文章,该文章仅涉及该思想的一个方面:
http://www.mattcutts.com/blog/myth-busting-virtual-hosts-vs-dedicated-ip-addresses/
有/有另一篇文章(或可能是一部视频),其中他使用Blogger或WordPress.com作为示例,说明了当Google在其SERP中显示相关结果时,如何无法忽略托管在同一域中的网站。
去年的这段视频概述了Google试图处理这种行为的一些方式,以应对收到的关于显示来自同一域的太多结果的投诉。他们努力“使其越来越难”以便单个域经常出现在搜索结果中,但是’确实,唯一的好信息来源就是它们所显示的。
http://www.youtube.com/watch?v=sxv-AvNPoh8#t=16
许多查询继续显示来自Web托管服务(例如Weebly,Tumblr,WordPress,Blogspot,Blog.com等)的多个子域。这仅取决于利基社区的定位位置或最受关注的主题。
The RipTide interview refers to him bringing 本地rank to 谷歌, as they call it “an adaption of 山顶.”
但是他们不’t say that is what is used for 谷歌 News.
它确实描述了一个听起来与本教程中描述的过程非常相似的过程。“用于提高新闻报道排名的系统和方法” 和 “用于对新闻内容进行聚类的方法和设备”专利,以及对“新闻文章排名”后续版本的专利。去年发布最新版本时,我花了一些时间深入研究这些内容。
I’对不起,比尔。我感觉不舒服。我猜这个周末这个错误的孩子对我打喷嚏。
山顶 looks at IP clustering (among other factors). But it is a 谷歌 新闻algorithm 和 so far there is no indication from 谷歌 that it was ever exported to any other part of their.
It was always an SEO mythology that 山顶 came out in 2003 (it came out in 2002). It was always an SEO mythology that Bharat developed the algorithm outside of 谷歌 (he was AT 谷歌 when he developed it).
But just look at the opening paragraph in the 山顶 paper itself: “…我们的算法对‘expert documents.'” That isn’网络搜索的工作方式。
http://ftp.cs.toronto.edu/pub/reports/csrg/405/hilltop.html
I’我将不得不离开它。
我觉得你’我会发现上面链接的采访很好地揭示了算法的作用。
嗨,迈克尔,
It’很难告诉巴拉特多少钱’在Google的职业生涯集中在Google新闻以及涉及网络搜索的内容上。它’告诉别人他是个好故事“在9/11事件发生后专心进行新闻搜索”但这可能意味着他工作的新闻部分从占工作的5%上升到10%。他当然没有’不要在9/11之后停止进行网络搜索,而只专注于新闻。
It’面试可能由于某种原因而使事情变得有些松散。我确实看了看他在Google工作的专利,并且(计入延续专利)他总共参与了42项News专利中的14项。
网页–作者的声誉评分
新闻– 用于提高新闻报道排名的系统和方法
网页–文件的人工锚点
网页–文件的人工锚点
新闻–浏览历史内容的系统和方法
新闻–检测新颖的文档内容
网页–使用实体检测进行查询重写
网页–使用用户请求信息和用户信息投放广告
网页–在文档检索中使用使用情况统计的方法和设备
网页– Search augmentation
新闻– 用于提高新闻报道排名的系统和方法
网页– Identification of 语义的 units from within a search query
网页–使用用户主题兴趣信息,使用具有一个或多个主题的文档来渲染广告
网页–在线内容提供者的身份验证
网页–链接信息的嵌入式通信
新闻–用于对新闻内容进行聚类的方法和设备
网页–确定链接文档的质量
网页–在文档检索中使用使用情况统计的方法和设备
网页–用于直接导航到目标文档特定部分的系统和方法
网页–识别给定内容的相关信息和/或与内容相关的广告相关联地呈现相关信息
新闻–检测新颖的文档内容
新闻–浏览历史内容的系统和方法
新闻– 用于提高新闻报道排名的系统和方法
新闻–联合和托管定制新闻内容的系统和方法
网页–使用实体检测进行查询重写
新闻–对文件进行排名的方法和设备
网页–使用用户主题兴趣信息,使用具有一个或多个主题的文档来渲染广告
网页–在文档检索中使用使用情况统计的方法和设备
网页–链接信息的嵌入式通信
网页–确定链接文档的质量
新闻– 用于提高新闻报道排名的系统和方法
新闻–用于对新闻内容进行聚类的方法和设备
网页–使用实体检测进行查询重写
新闻–检测新颖的文档内容
网页–在搜索结果排名中支持编辑意见的系统和方法
网页–在社交网络中请求和提供信息的方法和系统
网页–使用用户主题兴趣,使用具有一个或多个主题的文档来渲染广告
网页–估计网络搜索引擎覆盖率的方法
网页– Identification of 语义的 units from within a search query
新闻–显示屏的图形用户界面
网页–在搜索结果排名中支持编辑意见的系统和方法
网页– Ranking search results 通过 reranking the results based on 本地 inter-connectivity
他列出的大多数白皮书“research at 谷歌”页面也关注新闻以外的网络主题,只有一对看起来与新闻有关–
http://research.google.com/pubs/krishna.html
The 本地rank patent removes pages from the 本地 score calculation that are from the same domain, host, or IP address to keep links from those pages from influencing the 本地 scores because they are affiliated.
这与Google在来自相同域或主机或IP地址的搜索结果中显示页面无关。它们可以被列出和显示,而不必作为该计算的一部分。
嗨,迈克尔,
The 本地score doesn’不必给Google供电’的知识图。它尝试根据特定主题查询的搜索结果在这些查询的最高搜索结果之间的链接来对这些搜索结果重新排序。
如权利要求1所述:
主题由查询定义,“expert” pages are the hub pages within those top results, 和 the authorities are the pages that tend to be linked to 通过 the Hubs pages, which improve in ranking based upon the old scores 和 the 本地 scores.
Since 山顶 comes from his DEC days 和 LocalRank is an adaoptation of 山顶 we can agree I am playing fast 和 loose with the terminology 和 the dating (I was feeling nausauous earlier 和 not trying to be precise — sorry).
但是,我的观点本质上是通过采访得出的。克里希纳·巴拉特(Krishna Bharat)’Google的工作是捆绑在Google新闻而不是网络搜索中的。整个采访都集中在巴拉特如何在9/11之后改善新闻搜索方面。
山顶’对主题权限的要求是’知识图(我可以想到)之前的任何Google技术都提供了支持。也许他们在LocalRank上绘制了知识图,但是那’s a far cry from 山顶 being a ranking factor.
山顶 uses Host Affiliation to achieve differentiation in its search results. It restricts documents from a group of affiliated hosts. 您 can see from point 23 in the updated LocalRank patent (Cf. http://1.usa.gov/1cKudwR),它执行相同的操作。原始专利申请于2001年1月30日提交。
他的2012“10th anniversary” post about 谷歌 新闻recaps the basics:
http://googlenewsblog.blogspot.com/2012/09/google-news-turns-10.html
问候法案,
谢谢so much for 您r approach to sharing SEO. 您r attention to detail is the best.
由于对话框的增强,我也更喜欢这篇文章。我期待着阅读更多。
虽然我不能声称自己拥有全部知识,但类似的帖子始终使我学习并加深我的理解。我继续在我的复合SEO模型中添加元素,因为它与如何使用站点SEO来包装内容有关,您的博客是主要的贡献者。
嗨斯科特
您’re welcome. It’有趣,但如果您每天努力学习更多知识,’对此保持一致,你’一段时间后,您会知道多少,这会让您感到惊讶。 --
嗨艾特拉
谢谢。有时我确实想知道我是否’在帖子中包含了足够的可行见解和信息。我经常知道我可能会针对我所做的事情采取哪些更改或采取的行动’我写过,我不知道’不一定要写永远持续的博客文章。很高兴得知您正在撤出应该有用的内容。
谢谢比尔,这是我写的一篇很棒的文章’我会再读几次。
我特别感谢您的观点“Don’t call it 新鲜, because sometimes mature pages are the ones that move up.”有时感觉就像我们被“freshness”专注并需要记住,有一个非常重要的成熟空间,或者正如我所说的那样,它有时是常绿的。
I also thank 您 for explaining the 语义上的亲密关系。 It is something that always made sense to me, 和 I always felt it had significance, but thanks to 您r explanation here, I’能够更好地与他人交流。
谢谢Bill for posting this info…我总是能够从您的帖子中收集一些对我来说很重要的信息。
我坚信要利用(适当地)我知道的短语(经过有限的研究)与某个特定的排名利基同时出现,这与您在下面介绍的内容类似。优化页面时,我每天都会利用这种类型的知识/评估。我试图弄清楚什么“相关字词过多’s’看起来并试图保持在我认为的范围内‘average’排名靠前的页面。
“这些共同出现的短语称为“相关词”,当它们出现在可能针对初始查询排名的页面上时,Google可能会在搜索结果中提升它们。如果页面上出现太多“相关词”,超出了统计的可能性,那么Google可能会认为该页面是垃圾邮件。”
我永远找不到“advanced”发布有关SE算法和信号的信息。迪登’t fully, but it’肯定加了书签。
我认为,如果我阅读并理解了您发布的每个链接,它将使我的SEO体验至少提高20%。您刚刚确认我,网站不同部分的链接具有不同的价值,“Segmentation”.
Tnx,绝对值得一读!
你好
谢谢比尔。很棒的文章,我将尝试翻译成德语。对于我们的SEO来说,最基本的知识是对我们的SEO所做的最大努力。
训练我们的大脑是一个很好的锻炼。
现在,这是每位SEO顾问都需要阅读的文章。一世’我将是第一个承认它的人’(对我而言,这不是一本易读的书,但是)’这绝对是SEO业务中每个值得他们精打细算的人都必须阅读的内容。谢谢比尔。这里’s to more.
很棒的文章,比尔。不幸的是,我’我遇到了很多人,他们几乎只是将PageRank作为排名因素,而’从那里分支出来。
能够’等待本系列的其余部分!
真是太棒了!超级深入我’我将不得不再次阅读几次。
我可以’不能对我的客户施加足够的压力。一世’我很高兴你提到那件事。它’人们很难理解这个概念,或者也许我’我解释错了。谢谢!
Bill,一如既往,您可以向那些长期关注诸如“Semantic Closeness”在没有命名之前。
我希望Searchmetrics可以从中得到一些线索。没有花哨的东西,但纯事实。我喜欢你的表现方式。它是如此有益。谢谢。
外行的有趣读物… thank
您
能够 I ask regarding this statement
“The 本地rank patent removes pages from the 本地 score calculation that are from the same domain, host, or IP address to keep links from those pages from influencing the 本地 scores because they are affiliated.
这与Google在来自相同域或主机或IP地址的搜索结果中显示页面无关。它们可以被列出和显示,而不必作为该计算的一部分。”
“What effect does “removes pages from the 本地 score calculation ” – where more than once website with niche 和 本地ity share the same host 和 IP address – have on SERPS?
嗨,尼尔,
By “local rank”,它们指的是特定术语排在前10名或前100名左右页面中的文档– 和 that’被视为一组搜索结果中的局部性。他们可能会删除一些可能彼此相关的页面,以免给过多的相关页面以太多的荣誉或收益。