SEO再次不死(配置文件,短语,实体和语言模型)

分享是关怀!

SEO和关键字匹配

我不’记得我刚开始打电话说我做SEO的时候,我没有 ’早在1996年,我在第一个内部SEO职位上就获得了正式头衔。我想到了这个角色,他是网站管理员,市场经理,IT部门,技术顾问,还做了其他需要做的事情。一个朋友’的姐姐在Digital Corp工作,她有一天向我们发送了一封电子邮件,内容涉及他们已开始的一项名为Alta Vista的新服务。

那’可能是当我们刚开始认真考虑搜索引擎及其对企业的帮助或损害的潜力时。当Google出现时,我们对搜索变得更加认真。

早在Google开始流行之前,领先的搜索引擎就跻身Alta Vista,Excite,Infoseek和Lycos的行列,其论文名为 什么 is a tall poppy among web pages? 由Glen Pringle,Lloyd Allison和David L. Dowe撰写,探讨了可能的决策树,这些搜索引擎用来尝试确定搜索引擎如何对页面进行排名。

他们给了我们以下可能的排名信号列表:

  1. 关键字在URL中出现的次数。
  2. 关键字在文档标题中出现的次数。
  3. 文档标题中的单词数。
  4. 关键字在元字段中出现的次数–通常是关键字列表和说明。
  5. 关键字在第一个标题标签中出现的次数<H?>.
  6. 第一个标题标签中的单词数。
  7. 关键字在文档中出现的总次数,包括标题,元数据等。
  8. 文件长度.

那个名单没有’与如今被称为页上SEO的SEO分析类型相差太大。但是,如果您仔细查看该列表,则其重点是将文档中的关键字与查询中使用的关键字进行匹配。

当Google带PageRank进行搜索时,我们开始更多地考虑指向站点的链接的重要性以及这些链接中的锚文本。但是SEO’似乎仍将重点放在查询中使用的关键字是否也用于文档的页面或指向文档的链接上。

重新排列搜寻结果

2003年11月,Google的情况发生了变化,许多网站获得的舒适排名突然发生了变化。该更改被称为“佛罗里达更新”,这是在网站站长世界论坛上开发的一种命名不同Google更新的做法,这种更改似乎每4-5周就会发生一次,就像飓风一样。关于可能引起排名变化的变化有很多理论。

我喜欢但赢得了’谷歌的一项名为“专利”的专利中探讨了导致排名剧变的原因 Ranking search results 通过 reranking the results based on 本地 inter-connectivity.

什么’该专利的有趣之处在于,它描述了一种方法,该方法从Google提取一定数量的热门搜索结果以进行特定查询,然后根据它们之间的链接方式对它们进行排名。例如,如果您查看搜索结果中显示的前100个页面,并查看哪些页面链接到这些结果中的其他页面,则与这些页面链接最多的页面的排名可能会有所提高这些查询。

本地互连 这种方法可能是或可能不是佛罗里达更新的变更的原因,但是它描述的重新排序可能会导致所看到的变更。

I’撰写了许多关于其他可能的重新排名结果的帖子,搜索引擎可能会使用这些帖子来重新排名和过滤结果,并且其中许多过滤器也是搜索发展的一部分。其中一些帖子汇编了许多重新排名方法,并展示了我们采用的许多方法’从关键字匹配的早期开始,我们就继续前进:

超越网络发布者和关键字匹配

许多methods described in those posts still rely upon a certain ranking approach that looks at the kind of onpage factors that I listed above combined with information about links from web publishers. But they mostly ignore one of the more interesting kinds of data that the search engines have all been collecting for years –搜索者实际上如何使用网络,他们如何:

  1. 执行搜索,
  2. 浏览网页
  3. 在搜索会话期间优化查询
  4. 点击某些结果
  5. 跳过其他搜索结果
  6. 在页面上花费更多或更少的时间
  7. 收藏,保存或打印其他页面
  8. 以其他方式与浏览的页面和查看的搜索结果进行交互。

我今年早些时候写了一篇文章, Google改进的网页分类,用于排名和个性化搜索,该专利描述了Google如何根据网页为网站,查询和用户创建的个人资料对网页进行分类。它背后的基本思想’与我在2007年回写的一篇有关Microsoft专利的文章有很大不同– 通过跟踪用户,查询和网页的三元组进行个性化.

两者都以某种方式描述了搜索引擎如何从基于关键字匹配的显示页面转变为基于实际用户行为和潜在的搜索意图推荐页面的搜索引擎。

该帖子的摘录:

想象一下,一个搜索引擎跟踪每个用户(u),在他们对搜索引擎执行查询(q)时,查看他们点击了哪些页面(p),并将这些选择收集在他们称为“三胞胎”的位置数据表示为–(u,q,p)。

然后,考虑到搜索引擎可能会映射并比较这些信息的三元组,以查看进行相似搜索并面临相似结果的人们之间存在哪些类型的关系和关联。然后可以将该信息用于个性化显示给个人的结果。

想象一下,搜索引擎不仅开始响应这种类型的用户数据而显示页面,还开始花费更多时间来提出可能的查询细化,以获取搜索背后意图的核心–搜索者是否正在尝试解决某些信息需求或情境任务。

当人们谈论搜索引擎时,“semantics”到搜索描述中’s often a discussion on mathematical models that might be used to try to understand the 意思ings behind words. 那里’有时是指2003年与Google合并的Applied Semantics公司,但从表面上看,Applied Semantics带给Google的方法似乎与Google一起使用’s advertising.

今年早些时候发表的Google专利,我在 基于概念的搜索:应用语义学和Google describes how the Applied Semantics method could be used in Web search, providing a more interactive approach to search that involves showing suggested query refinements that may expand original queries to go beyond keyword matching to get at the 意思ing behind a query.

的 globalization of search also 意思s that search engines need to understand multiple languages and return results to searchers around the globe. Google has hinted at becoming a multilingual search engine with the development of language models. 的se language models are also a key to looking beyond keywords found upon a page.

例如,如果您要使用类似“auto mechanic,”并将其翻译成法语,然后再翻译回英语,那么在该翻译中可能会发现一些合理的结果,例如“car mechanic,” and “automobile mechanic,” and “auto mechanic.” In my post Google同义词更新, I described some of the approaches to 同义词 that Google might be using to expand queries for searchers that broaden search results in reasonable ways.

短语和命名实体

Several patent filings from Google look beyond matching individual keywords in a document to identifying and discovering phrases that have unique 意思ings.

搜索引擎有时通过在搜索中不包含一些非常频繁出现的单词来索引某些单词。像这样的字词“a,” or “the,” or “on,” or “of,” would be passed over. But sometimes those frequently occurring words added 意思ing in the right context.

Google发布了一项有关的专利 意思ingful stopwords and stop-phrases 几年前。如果您搜索单词“matrix”您倾向于看到有关数学的结果。如果您搜寻“the 矩阵 ,”您往往会看到有关同名电影的结果。

Google的另一组专利文件描述了搜索引擎如何区分“good” phrases and “bad” phrases, and rerank search results based upon whether or not a certain number of 好 phrases appeared in a top number of search results. For example, if you searched for “baseball stadium,”搜索引擎可能会查看前100个结果,并计算出其他“good”短语出现在那些结果中。包含更多这些同时出现的短语的页面(直至特定点)可能会在搜索结果中得到提升,并且排名更高。

我今年写了一篇文章 短语和短语过帐列表, about the second generation of patents from Google that explored how the search engine might implement a phrase-based indexing system to rerank search results 通过 creating post lists that indicate which 好 phrases pages within its index might contain. Again, the idea is that if a page tends to use many of the same phrases that other pages on the same subject use, it’更可能与该主题有关。

基于短语的索引系统还会查看指向页面的锚文本,并且可能会给使用共同出现或相关短语的单词和短语的链接赋予更多权重。

进一步看待短语的想法,可以说某些单词和短语是“entities,”因为它们指的是特定的人,地方和事物。约翰·韦恩(John Wayne)和帝国大厦都是实体。品牌是实体,思想是实体。

搜索引擎可能会查看网络上的网页,并提取有关特定网页的信息“named 实体,”并收集该信息以提供问题的答案,例如“约翰·韦恩何时出生。”

当对站点和实体之间的关系似乎有一定程度的信心时,它也可能尝试标识查询中的实体,并将这些实体与特定的网站相关联。以下帖子提供了有关命名实体如何影响搜索的一些示例:

结论

搜索引擎从关键字匹配的早期阶段开始发展,其中包括将用户行为数据整合到排名页面中,创建统计语言模型,使用诸如应用语义学之类的语义本体变得更具交互性,理解短语的方法。更好地理解短语何时可以指代特定的人,地点或事物等等。一世’我只是沿着这个杆子沿其所沿许多方向刷表面。

SEO is becoming more complex, but the ultimate goal is still to try to find useful and 意思ingful results for people trying to fulfill informational and situational needs. Search is changing, and the way that people search is changing as well, whether they try to use a conventional search engine, or even attempt to have a network of friends and associates provide answers on social sites.

如果您对基本SEO的想法与上述1998年的清单相呼应 高大的罂粟花 paper, with backlinks and PageRank thrown in for 好 measure, you’今年年初发生类似Google MayDay排名变化之类的事情时,您会迷惑不解,从而减少了基于长尾查询的许多网站的访问量,而增加了其他网站的访问量。

这是最后的“SEO is Undead” series.

该系列的第一篇文章, SEO不死 1 (Links and Keyword Proximity) 研究了自SEO成立以来,关于链接的想法以及与页面上其他关键字的接近程度可能如何转变。

该系列的第二篇文章, SEO之子是亡灵(Google咖啡因和新产品改进),更深入地探讨了搜索和SEO有时会发生什么变化。

什么 changes have captured your attention over the years?

分享是关怀!

有83条想法“SEO再次不死(配置文件,短语,实体和语言模型)”

  1. 嗨,比尔,

    I’ve非常喜欢这个系列,非常感谢您的发帖。我认为Google’s ability to profile both users and websites is massively powerful, and this, tied in with 本地 search is really going to be have a big impact on SEO in the near future.

    I think the days are numbered for directory-based websites topping the results for 本地 search terms… profiling businesses and their websites 通过 utilising tools such as Google Places is already beginning to drive 本地 search, and will get better overtime.

  2. 我同意Trillo所说的Google’本地搜索的最新变化将产生重大影响。更改也完全有意义。它’现在正在发生,但很快我们’将会看到从移动或手持设备进行搜索的巨大转变。越来越多的人正在使用具有GPS功能的智能手机,并将其用于搜索。有了这些手机,您’本质上是搜索‘local’ wherever you are.

  3. 比尔·斯劳斯基–像Google这样的搜索引擎发生了多少变化,绝对令人惊讶。 SEO永远不会保持不变,只要技术不断进步,搜索引擎就会使用这些方法对网站进行排名。

    但是,我认为赢得搜索引擎优化的基础’变化不大,而时髦的SEO策略将成为一种记忆。

    With that being said, I feel if you learn the fundamentals of 好 SEO practice you won’不必担心所做的更改。

  4. 嗨,比尔,

    这篇文章给了我鸡皮b。我曾经回想起2004年,当我刚开始从事SEO文案写作时,我们的导师过分地谈论了佛罗里达州和Big Daddy的更新,这影响了排名靠前的既有网站。

    It’阅读这些搜索基础知识总是很高兴,并提醒您搜索和SEO的发展速度如何。

  5. 不要假装有一个花哨的答案!
    对我而言,当我学习安尼尔·达什(Anil Dash)赢得比赛时,这是一个激动人心的时刻,我读到他的举动…是的,它们非常基本,但是后来Google进行的调整引起了我的注意…(佛罗里达)。阅读您的文章,我有很多东西要学习。再次感谢您的分享!

  6. 当您退后一步并讨论讨论的SEO时,情况确实发生了变化。我认为,这种快速的变化告诉我,SEO不仅将继续保持重要地位,而且’重要性将继续增长,想要生存的SEO公司将像游戏本身一样迅速变化。

    On a side note, I actually have a little beef with Google looking beyond matching individual keywords in documents so as to identify and discover phrases that have unique 意思ings and here’s why…我经常在论坛上发帖,并且喜欢有个时髦的头像。我偶尔会更改它们,每次搜索关键字时“avatar”在Google图片中,去年,我不得不在图片结果的页面和页面中进行搜索,只是找到了一个’引用爆炸的电影…也许他们应该退一步…

  7. 我的第一个SEO职位与您相似—我是一个通用的网站管理员/设计师/网络专家/打印机修复程序/ Windows升级程序/等,负责为小型企业提供访问公司网站的流量。手工编码的html和完全静态的页面的时代。我有点想念他们,但大多数都不会’t.

    事情肯定发生了很大变化。我记得将垃圾邮件白色文本放在白色背景上确实有效。我记得更新没有’t.

    It’在相当短的时间内,事情的变化真是令人印象深刻,但是我’我也对多少保持不变感到惊讶。标题和URL的完全匹配仍然有助于节省时间。完全匹配的域名,甚至更好。较长的文章似乎经常仍然等同于增加权威。将关键字丰富的段落向左偏移数千个像素相对比较普遍,并且我上次检查仍然有效。

    搜索引擎更加智能,并且它们确实考虑了趋势/用户意图/等等。但他们的核心’仍然依赖非常原始的信号。和我’我真的为此感到惊讶。

  8. 我发现结果之间的转换越来越快,而且似乎Google一直在测试点击率’为用户确定最佳价值。另外,对于Instant,似乎设计,布局和信息体系结构将在获得更高的点击率(CTR)甚至更高排名方面发挥关键作用。
    干杯

  9. 尼斯条款条例草案。很大的因素和观点。继续在SEO Undead系列下发布。

  10. 很棒的系列!我真的很喜欢反对“SEO is dead”我们看到的帖子每隔几个月就会弹出。早在2007年,我就在SEOmoz.org上撰写了几篇博客文章,讨论Google如何使用用户统计信息来影响搜索。当Google强调诸如“Bounce Rate”在2007年的Google 分析工具(分析)测试版中使用。喜欢这些东西。

  11. 的 SEO已死 discussion seems like a moment of collective insanity on the part of social media affectionados that may be having difficulty with ROI calculations. 另一方面,令我感到惊讶的是,用户体验指标似乎并不是算法中更大的因素。这方面有什么进展吗?

  12. 由于某种原因,我从未想过将Google专利视为试图掌握其全部工作方式的一种方法。感谢您指出我的方向。作为SEO的新手,我一直担心将来的更新会如何影响我的排名,因此至少要跟上搜索引擎的神秘面纱非常重要。

  13. 我不知何故来到了系列的中间…
    一个有趣的发展是SEO对社交媒体的影响…我的预测是有一天这将是巨大的… for now it’少数人(包括Google)必须弄清楚如何进行播放。

    感谢您的系列。

  14. 事实是,谷歌已经开始落后于用户的意图’使用整个即时Google搜索因子进行搜索。结合网站预览(您可以在其中看到网站的预览)’s homepage from google) plus the merging of 本地 places results into the organic searches are three major drastic changes, all within the last month or so.

    从事SEO业务的部分原因在于适应能力;您必须像变色龙一样,时刻准备着应对突如其来的变化,众所周知,谷歌正在不断发展。它使您想知道几年后将如何确定搜索;反向链接是否会变得相关或完全过时?

  15. 感谢您详细的充实。是的,语言将是驱动力的结果,因为Google仍在努力教给AI更好的语言技能和对相关性的理解。这将是不断完善和调整的过程。我们仍然看到非常糟糕的结果以及相当不错的结果。由于学习单词的困难“mean”他们使用的字词接近度和频率等不精确的标准。如果你看语言,他们’在过去的一年中,他们曾经经常与SEO社区进行交流,“synonyms”. Humans create 意思ing. Machines, no matter how sophisticated, can only parrot that process using artificial constructs. Understanding those constructs will ultimately give the insight into unlocking the SEO puzzle.

  16. 伟大的帖子再次!必须提供给您,因为它每次都为我们提供了如此深入的知识…一如既往地受到信息的启发,就像我提到的以下事件发生时一样’甚至不知道什么是SEO :)…

    附注:比尔,您能给我发邮件到我的收件箱吗,我需要和您谈谈…将邮件放在上述电子邮件中。谢谢

  17. 一如既往的好帖子,我’我真的很喜欢最新的。

    关于您选择的“短语化”,令我震惊的是,我认为它有些倒退。我知道许多其他研究指向同一方向,但我 ’仍然不确定这是否暗示在主题内使用常用短语会导致排名上升或相反。

    我认为詹姆斯·乔伊斯(James Joyce)是一个非常有趣的例子。乔伊斯或多或少独特的语言将使他陷入困境。寻找自己的Finnegans Wake willn’请显示他的网站(如果他是30年代那种写博客的人),因为他将是唯一使用他的短语的博客作者。当然乔伊斯是一个极端的例子,但我’d claim it’有效。例如,一个真正革命性的SEO博客将谈论别人不做的事情’t,因此排名不高。

    It’不过,这仍然是一个非常有趣的话题,如果您想撰写更多有关它的信息,那将会很好。

  18. pingback的:SEO是僵尸!最终“ SEO已死”(或未死)资源列表:1997年到无限期| SEOptimize
  19. 嗨,戴夫,

    谢谢。佛罗里达州的更新是许多对话的主题,很多人都对Google如此干枯的网站访问量感到愤怒。这些网站所有者中,太多人可能过多地依赖Google的访问量,而没有完善他们的营销计划以吸引来自其他地方的访问者。

    大爸爸的更新没有’直到2005年下半年才发生,它的变化更像Google Caffeine,’直接更改排名算法,而是Google用于网络搜索的软件和硬件的基础架构升级。

    大爸爸的主要变化之一可能是更大的索引,包含多个部分,其中一些页面包含在主要索引中,并收集了有关它们的全部排名功能,而其他页面则位于扩展或补充位置索引,其中收集了有关排名信号的较少信息。马特·卡茨(Matt Cutts)在这里写了一些更改(以一般方式):

    有关Bigdaddy数据中心的反馈

    搜索肯定正在迅速发展。任何SEO可以做的最重要的事情之一就是尝试跟上。 --

  20. 嗨Trillo Digital,

    最近,随着Google Place Search的变化,本地搜索无疑已经走在前列,本地搜索结果显示为与常规网络搜索结果一致,而不是在与这些结果分开的单独框中显示。一世’我尚未确信这些结果的排名方式没有任何改变,而是改变了它们的显示方式。但是显示方式的改变似乎使它们更加突出,并且可能影响更多的人点击它们。

    那里’在基于位置的目录站点中仍然有一些价值,并且最近有一些相当大的站点获得了一些关注,例如Yelp和我’我不确定他们很快就会消失。但是,我想你’没错,对于人们访问企业的Google Place页面而不是其中一个目录中的企业资料页面而言,Google可能会感到非常高兴。

  21. 嗨,迈克尔,

    谢谢。一世t was a fun series to write. To paraphase something Matt Cutts said recently, don’不要看Google现在的位置,而要看他们将来的位置。或正如韦恩·格雷茨基在他面前说的那样:

    我滑冰到冰球将要到达的位置,而不是它的去向。

  22. 嗨,戴夫D,

    好点子。我预计在5年左右的时间内,通过移动设备访问Web的人数将使通过台式机或笔记本电脑进行访问的人数相形见war。电话更便宜,更易于携带,并且无线接入有很多可能性变得更加普及。基于位置的服务和应用程序也在以惊人的速度增长。本地搜索和移动搜索以多种方式联系在一起。

    We’我们还看到了未来的可能性,即网络浏览在大多数人的娱乐中心中可能会占据更加重要的位置’带网络功能的电视和流电影租赁服务。

    什么 does it 意思 for search, for searchers, for the Web, and for SEO when people start visiting the Web more frequently on tiny handheld screens or super large televisions? For mobile searches, you’没错,无论您去哪里,都有可能成为“local.” It’许多企业和组织都没有这样做’目前没有太多的网络存在应引起注意–能够被移动搜索者轻松在线找到,可能是一个巨大的竞争优势。

  23. 嗨杰森,

    这些天到底是什么基础。 1998年这篇论文顶部文章的列表显示了一些信号,这些信号被认为有助于网页排名,但是我们’几年来,谷歌一直在听他们调查200多个排名信号。微软在其有关Ranknet排名系统的页面之一中指出,他们查看了500多个排名信号。那些天’t “trendy SEO tactics,”而是搜索引擎已经改变的现实。

    It’我认为SEO的基本要素可能与您认为的根本不同。我被要求参加一个关于“Basic SEO,”和其他一些人一起,我们被告知彼此讨论我们每个人将要呈现的东西。有些人想谈论页面标题和标题的重要性。其他人则想讨论链接和锚文本。

    当我提供一些我想讨论的主题时,其他人则告诉我,我的建议是高级SEO,对于读者而言,它们太复杂,太难了。但是,他们关于基本SEO的想法可以追溯到我在我的帖子中提到的1998年列表,而忽略了诸如通用搜索以及对新闻,视频,本地搜索,博客等的优化。今天’SEO的基本知识与昨天截然不同。

  24. 嗨,JC,

    我还记得与Anil Dash进行的Nigritude Ultramarine竞赛。网路上的大多数人’t Anil Dash, and don’没有他所做的那种联系和追随者。在佛罗里达州发生更新之后,阿尼尔(Anil)在2004年赢得了比赛,而且很可能是来自其他博客的链接而赢得的–许多主题链接可以有所作为。

    关于搜索和SEO历史的书可能很有趣,也很有趣。

  25. 嗨,马克,

    SEO最具挑战性的事情之一就是变更。它们也恰巧使SEO如此引人入胜。

    我同意您的观点,即Google有时会尝试为您做思考,并猜测您的意图而没有给您机会告诉它’过于专注于你本来的东西’t interested in.

    I mentioned the Applied Semantics approach to 意思ing based search because the method that they present in their patent on web search involves a more interactive type of search where you might be asked something like “Do you 意思 images from the movie ‘Avatar’?”让您有机会专注于这些内容,或者将其从结果中滤除。一世’我猜测将来我们可能会看到更多这类查询优化类型的查询。

  26. 凯文,你好

    的 early days of SEO were fun and challenging, though sometimes the challenges were things like designing a template to generate bulk invoices from quickbooks, rather than doing keyword research or tweaking HTML. 我不’千万不要在纯静态网站上对HTML进行全局更改– a lot of work.

    我和某人一起工作,有时会读到一些与搜索引擎排名策略有关的内容,并进行更改,例如在白色背景上添加几行白色文本,却没有意识到搜索引擎可能会冒犯他人。实践。

    搜索引擎看到的许多信号仍然有效,因为’对他们非常怀疑。页面标题中的关键字–标题应该是页面的内容,这样才有意义。网址中的关键字–如果标题和URL都具有相同的关键字,并且这些关键字也出现在页面的正文中,则它们将成为这些关键字的有力佐证。原始信号,但比其他信号更可靠。搜索仍然有很长的路要走。

  27. 嗨,杰里米,

    我有一些涉及“SEO is Dead”不时出现的帖子。

    我喜欢看到以深思熟虑的方式挑战和批评SEO行业的帖子,这些帖子要求我们变得内省,并仔细研究我们的工作,如何展示自己以及如何应对某些挑战。

    例如,当Google开始引入个性化搜索,以便每个搜索可能针对同一查询看到不同的搜索结果时,有很多帖子都在质疑SEO所涉及的人们可能会如何回应。最近,有几篇文章看到社交媒体和社交网络的影响力和影响力日益增长,以及诸如Facebook之类的网站的流行以及这可能对SEO产生怎样的影响。

    那里 are people who say that the true test of character isn’不一定是您每天如何与他人互动和互动,而是当您发现自己处于尴尬的境地时,’再次受到挑战,批评或轻视。您如何应对这些类型的情况为您以及您的身份和身份提供了一些见识。

    许多“SEO is Dead”我们看到的类型信息来自不知道的人’不太了解SEO,或者谁不知道’您对搜索,搜索引擎以及搜索引擎的发展情况了解不多。其中有许多目的是为了吸引流量而写的,并且经常用与电子邮件垃圾邮件发送者,网站黑客以及为adsense类型的网站创建质量很低的人员相同的画笔来描绘专业的SEO。

    我其实在那里’如果他们能够激发SEO行业内的人们讨论如何使行业变得更好并提高我们向网站所有者提供的服务的质量,并谈论诸如转化率,分析和用户之类的东西,那么它们在这些类型帖子中的价值-行为。寻找与SEO相关的纯排名的日子已经过去–查看转化,可用性,号召性用语和跳出率(在何时何地具有一定价值)已进入SEO领域,这是一个可喜的变化。

  28. 嗨,钱德,

    我认为在过去的5年或更长时间里,搜索引擎似乎越来越成为推荐系统,’s something I’已经指出了一段时间。

    我们在搜索工程师的访谈中以及有关搜索引擎的文章中看到一种标准的股票声明,其重点是对搜索引擎进行更改以提供以下内容:“给搜索者最好的用户体验。”我认为在大多数情况下’s true –搜索引擎正在响应人们搜索方式的变化,无论是真实的还是感知的。例如,诸如Twitter和Facebook之类的社交网络已经得到了巨大的发展,搜索引擎已经在为这些系统建立更快的索引,开始更快地显示来自它们的结果,并使得从可能与您有联系的人那里找到信息变得更加容易在这些类型的网络上。

    我也同意您在Google中的新预览。即时预览可能会影响希望从Google接收流量的网站的外观,我认为它可以说明搜索引擎如何在Web的发展中发挥作用。

  29. 嗨,兰迪,

    我确实认为’关于社交媒体和搜索如何相交并相互影响的重要讨论。一世’我不确定讨论应该在以下方面展开“SEO is irrelevant,” or “SEO现在已经死了,新国王就是SMO.”多年来,搜索引擎一直在关注社交信号,包括用户生成的内容,论坛和博客,Flickr,Facebook和Twitter,以及许多其他领域的社交信号,这些领域对于发布您的想法和观点以及有关世界的信息构成了障碍。网络已经大大减少。 SEO也一直在关注这些信号。

    另一方面,令我感到惊讶的是,用户体验指标似乎并不是算法中更大的因素。这方面有什么进展吗?

    该语言是非常熟练的技术,但是Google’s patent 基于大型数据集的文档排名模型生成 是Google提供的众多工具之一,旨在研究如何使用用户行为来影响搜索引擎的排名。

    这里’是该专利的摘录。

    为了随后的讨论目的,储存库220(图2)中的数据集可以包括多个元素,称为实例。存储库220可能存储超过5000万个实例。每个实例可以包括三元数据:(u,q,d),其中u表示用户信息,q表示用户提供的查询数据,d表示与作为查询结果而检索到的文档有关的文档信息数据以及用户选择和未选择的文档。

    可以为任何给定(u,q,d)提取几个特征。这些功能可能包括以下一项或多项:

    –用户u所在的国家/地区,
    –用户u提供查询q的时间,
    –用户u所在国家/地区的语言,
    –用户u提供的前三个查询中的每个查询,
    –查询q的语言,
    –查询q的确切字符串,
    –查询q中的单词,
    –查询q中的字数,
    –文件d中的每个字,
    –文档d的统一资源定位符(URL)中的每个单词,
    –文档d的URL中的顶级域,
    –文档d的URL的每个前缀,
    –文件d标题中的每个字,
    –指向文档d的链接中的每个单词,
    –查询q的文档d上方和下方显示的文档标题中的每个单词,
    –查询q中的单词与文档d中的单词匹配的次数,
    –用户u先前访问文档d的次数,以及
    – other information.

    在一种实施方式中,存储库220可以存储超过500万个不同的特征。

    虽然该列表仅提供了搜索引擎可能查看的信息的一小部分样本,并包含了许多有关页面上以及链接和查询中出现的单词的信息,但它也暗示了与用户交互也可能被收集,例如页面上可能的停留时间,页面是否被加书签,保存或打印等等。

    所有搜索引擎都一直在积极收集有关人们如何使用搜索引擎,网络本身以及它的信息。’他们可能会使用大量的用户互动数据’我们收集了侏儒在其索引中有关网页内容本身的信息量。面临的挑战可能不仅在于收集该数据,还在于如何使用它。

    存储有关涉及用户,查询和文档(u,q,d)的特定三重信息的信息是朝着建立推荐引擎的一步,该推荐引擎考虑了针对用户(和用户组),网站,查询和用户的丰富的配置文件信息互动指标在使用该数据方面发挥着重要作用。

  30. 嗨,EPC,

    您’重新欢迎。我注意到很多年前,我如何通过关注白皮书和专利等主要搜索出版物,来寻找有关搜索引擎如何工作的新问题。有时也有一些答案,但通常他们提出或暗示的问题会更有趣。

  31. 嗨,阿尔贝托,

    我觉得’这确实是一个非常重要的问题–搜索和社交媒体将如何一起发展。我也认为’搜索引擎的人们已经探索了几年了。它’绝对值得探索,质疑,探索和测试。我同意’它将会变得巨大,并且在某些方面已经是。网络在不断发展,变化和发展,与书籍不同,对话是实时进行的。

    在某些方面,搜索引擎是查找信息存储库的一种方式,而在其他方面,它们则是查找正在进行的对话并进行交互的方式。

  32. 嗨乔,

    有趣的一点。

    当人们撰写有关搜索引擎和相关性的文章时,我往往会感到困惑的一件事是,当涉及到该术语时,他们将许多不同的事物归纳在一起“relevance.”

    几种不同的相关性:

    –当网页和查询包含相同的单词时,网页可能与查询相关。
    –当网页属于同一分类时,即使它们的字词相同,网页也可能与查询相关’t used 通过 both.
    –当网页满足查询所需的信息需求时,网页可能与查询相关,即使相同的词不是’t used in either
    –如果网页再次提供满足特定情况需求的响应,则该网页可能与查询相关,即使查询和网络文档中的术语没有’t match.

    字词的接近度和频率对搜索引擎专注于关键字匹配,并试图区分所有包含查询中所有关键字(或其中大部分)的页面在20世纪90年代找到相关页面很有帮助。

    A lot of approaches have developed, and have been developing that look at other information. For example, a statistical 机器学习 translation approach that uses language models to do things like translate a query from one language to another, and than back again to try to find words with similar 意思ings with a high level of confidence.

  33. 您好徐社,

    我认为Google和其他搜索引擎的新发展背后的许多想法真的不应该’太令人惊讶了。

    Google Instant背后的想法已经渗透到Google超过6年了–他们在2004年申请的专利中对此进行了描述,因此’s not something that’真的是所有新东西。像Google Instant Preview一样的预览已经在ask.com等网站上提供了多年。

    对于可能从事SEO的任何人来说,找到可能出现的提示并能够适应它们都是一项宝贵的技能。问自己很多问题,例如“如果反向链接完全失去了其在搜索排名中的价值,该怎么办” is a 好 question to ask, and to prepare for. Afterall, Google’s deal with the exclusive right to use PageRank is supposedly expiring in 2011. 什么 does that 意思 for website owners? 🙂

  34. 嗨,马丁,

    谢谢 you very much. 您 raise some great points.

    期限“phrasification” isn’这是我创造或创造的,而是来自Google’的专利。从摘要本身:

    Phrases in a query are identified based on possible 短语化s.

    不管我们俩是否都发现它,我都认为’重要的是要了解来自搜索引擎的一些想法和假设,值得一提的是,搜索引擎可能会使用哪些方法来识别出现在查询中的短语。

    在某种程度上,我可以与乔伊斯建立联系。我不’搜索诸如以下字词的用户获得了很多访问“phrasification,”但是我发现写这样的话题值得努力,这既出于我在探索这样的话题时学习的立场,又是因为我能够分享和教育,并且希望能在某种程度上获得娱乐。一世’d即使我没有写过短语化之类的东西’该博客没有任何访客。 --

    我可能会写更多有关基于短语的索引的文章。

  35. 嗨,比尔,

    感谢您的见解和评论。我相信Google会在不久的将来开发或至少尝试开发类似于Facebook的推荐系统“likes”. I’ve seen great shifts in traffic on sites that have many 喜欢, and what is the original PageRank algorithm than popularity?

    将此内容添加到玩家的社交/小众背景中(例如,学术界中的人们喜欢某些页面上的研究论文要多于其他论文),而您(从Google’的观点)让自己摆脱了垃圾邮件发送者的困境。但是,在这里,Google可能会在游戏的相关性与收入之间发挥作用-

    干杯

  36. I’ve read over at another blog about seo being undead and a picture of a zombie was featured. And I think zombies are that best things that can describe seo. 您 think it’s dead, but it’s not, it’s still alive and it’的感动。很棒的帖子!

  37. 嗨比尔,(对不起我的英语)

    谢谢’s代表此系列文章。
    我使用此评论是因为我想听听您的相关信息,并且可以将其用于信息检索。
    I know my question is stupid : everybody knows that a 好 is very important. Ok, but i’d除了:olala你什么都听不到。 ’不知道!哦,这个人是搜索引擎优化专家,他问有关标题的问题,依此类推…
    但是事实上

    谢谢’s a lot.

  38. 我认为下一个主要影响力(搜索技术之外)将是不可避免的对网络中立性的破坏,并经常考虑它将如何影响行业。

  39. 感谢Bill为您提供的历史课程以及关于SEO如何发展的最新信息。搜索引擎的关键应保持不变,即提供满足其搜索者需求的内容。我们只需要通过提供巨大的价值和解决问题的方法来实现这一目标,这将使搜索引擎,搜索者,网站管理员和广告商获得成功。

  40. 谢谢比尔的精彩系列。随着事情变得越来越复杂,有时’人们很容易错过树林。我发现,如果我通读了专利,然后花了几天的时间就停止学习和实践Google的所有工作’的高级搜索功能,进行了单字和多字长尾测试,我开始听到Google试图告诉我什么。一路上的即时搜索结果又是另一声耳语。

  41. Bill 谢谢s for perspective, you seem like you witnessed the creation, the freezing and refreezing of SEO. Although SEO has only been around 14 years, roughly, the growth in this industry is unbelievable. 那里 is so much competition nowadays to not only build communities and quality content, but rank for keywords and phrases.

  42. 嗨,马丁,

    谢谢。即使我只关注重点,并尝试提出一个想法,也可能需要很多时间来围绕专利创建博客文章。我希望我有时间对遇到的每项专利进行非常彻底和完整的分析,但这将花费更长的时间。

  43. 嗨,钱德,

    It’Google可能会开发类似于Facebook的明确推荐系统’一样,但他们的搜索结果本身正在发展成为一种推荐系统,该系统基于某些观看者根据所使用的特定查询访问的网站。遵循以下原则“与您搜寻类似内容的人&这样查看了以下页面。 ”

  44. 你好朱利安

    网络中立性的消失确实有可能破坏我们所知道的网络,而不仅仅是搜索。我希望挑战它的人们仔细考虑他们可能产生的影响。他们造成的伤害可能大于所获得的利益。

  45. 嗨,埃里克,

    感谢您的客气话。

    有时候,我读到的某篇文章可能需要一段时间才能对我产生影响。那里’就像花费一些时间进行大量搜索,并观察和探索以帮助其中一项专利的潜在影响沉没它一样。有时候专利提供的问题比答案更好–并且花费时间来了解如何回答这些问题。

  46. 嗨,马特,

    我愿意,并花了很多时间研究和试验SEO。我认为仍然适用的一件事是,即使竞争似乎有所增加,但创造力,创新和独特的方法对于希望在网络上获得成功的人非常有用。

  47. It’SEO多年来的发展非常有趣。它的性质,相关性都发生了变化,并使简单的搜索引擎Google跻身世界第一’最相关和最强大的公司。我很喜欢阅读这篇文章和所有回复。

  48. 比尔,像往常一样,您已被钉在头上。像以前的评论者一样,我对这篇文章感到鸡皮ump。“optimising”Google成立一年后创建的网站,现在的变化是巨大的。我们的SEO公司在那段时期发生了许多变化–有些不错,有些不太好。正如我之前写过的文章所讨论的那样,我只是希望Google坚持改进算法的变化,而不是搞砸即时信息等。如果他们这样做,我认为SERPS会更加稳定,我们作为SEO的生活’s会容易得多,不要’t you think?

  49. 嗨克里斯,

    谢谢。此时,我’我们已经期望Google和其他搜索引擎会有所改变。如果他们没有’如果变化不大,SEO会更容易–给大家。由于它们确实经常进行更改,因此对于那些了解并有时甚至预见到更改的人们而言,这有时可能是一个优势。

  50. 我已经注意到,专注于社交媒体优化(SMO)的SEO专家可以很轻松地掌握Google搜索结果的顶部。我认为这是一个需要紧急关注的领域,否则您可能会落后于排名。

    约翰

    SEO专家和市场经理

  51. 很棒的帖子

    什么s great about the development of SEO is that its getting more logical and easy to understand. Even people with no technical education can now preform seo tasks and get results.

  52. 嗨,约翰,

    I’我不确定那里’SEO如何使用社交媒体与自然搜索排名之间的相关性。搜索引擎使用多种信号来对某些查询和关键字的页面进行排名。社交媒体的使用可能有助于诸如吸引注意力和页面访问量,以及增加书签和指向这些页面的链接的数量,但是还有许多其他方法可以做到这一点。

  53. 嗨Sturla,

    I’m not sure that I would say that SEO is getting any easier, or any more logical. 那里 are many basics of SEO that people can follow that can help get positive results, but there are other aspects of SEO that it can be really helpful to have a deeper understanding of to take advantage of.

  54. 太震惊了!一世’在Howie推荐电子邮件后,已经阅读了许多博客文章‘鲨鱼永不眠’ Schwartz. It’就像我在Dialog Information Services担任法律和政府信息规范时在布尔时代经历的时间扭曲一样。公司专利和商标。听起来可能很奇怪,但我觉得自己像是一个远离农场的农民,回来时会感觉到并闻到一些新鲜的变质土壤。用手指滚动–甚至品尝一下。阅读您对搜索的看法以及从研究专利(和支持文件)之类的原始文件中获得的见识,是多么令人耳目一新。谢谢我的新搜索朋友。愿您继续分享您最赞赏的调查和见解。

  55. 你好比尔,

    感谢您通知我们SEO的最新进展。

    我喜欢语义匹配。使事情变得容易。

    让我困扰搜索的一件事是人气的价值。

    如果站点与搜索相关,则它是相关的。

    传入链接的数量应该无关紧要。

    More links do not 意思 the site is more relevant or that the quality of the information is better. More links often just 意思 someone did more marketing.

    Google过度奖励那些对最受欢迎的搜索字词进行最多营销的大公司。

    如果google在所有最相关的结果中轮换显示,并且由于链接更多而不偏爱一个网站而不是另一个网站,那将是比较公平的。

    什么 would be interesting is if google offered users several different ranking algorithms.

    安德鲁

  56. Bill,我首先要说的是,我没有与SEO,计算机工程或IT应用程序有关的任何资格,而只是涉及到我在此Blog上阅读的讨论时的外行。我是一位企业主,希望利用互联网及其各种门户来改善我的产品在互联网所达到的巨大市场基础上的营销。说的够了。
    我很高兴阅读您的帖子,尽管您的想法和评论不止一次地朝着我无法理解的目的地前进。但是,您可以将讨论主题的基本概念整理成某种形式,这样我就可以收集与我试图找出的内容非常相关的知识,成为一种我可以理解的形式。 (谢谢!)我记下了您撰写的许多主题的笔记,这些对我的营销和SEO工作有帮助。 (我的另一面就是喜欢尝试找出技术人员的东西。)
    我之前从未发表过任何回应,因为我觉得自己不足以为我没有专门知识的领域的技术人员增加任何价值。几天前,来自另一个人朱利安·扬(Julian 您ng)的简短回复令人不安。这让我有些害怕。我知道这通常不是技术性的,您可能不希望扩展某些内容,而这可能只是投机性的,并且您可能只能表达关于“网络中立性”的意见。 。我读了您对朱利安(Julian)的回复,这确实让我开始思考如何解决这个问题。它可能会撼动互联网上商业和社交运作方式的核心。我的警报是合理的还是可以在技术上进行调整的?我做错了吗,还是会严重破坏SEO的工作方式?我了解这一点,您可能不想在本博客中进行深入研究,但是您的意见可能会产生比您想表达的更大的影响力。再次感谢您,我像往常一样期待阅读您将来的博客和评论。请保持好的工作状态!

  57. 法案,

    谢谢 you for continuing to provide an in depth discussion of SEO. Google continues to evolve and although SEO is not new, search engine capabilities are advancing. A great example of this is in how videos are read and ranked 通过 Google. 的 new addition of video site maps and real voice soundtracks are a 好 indication of tech advancement as well as algorithm changes.

    希拉
    网络营销杜鲁

  58. 嗨安德鲁,

    在开发诸如PageRank和HITS之类的链接分析系统之前的几天里,当您在搜索引擎上执行搜索时,它会尝试将查询词与在文档中找到的词进行匹配。它不会’t do the best job in the world of ranking those is some 意思ingful order, and chances were that the documents or information you might be trying to find would be buried pretty deeply within the search results.

    通过查看页面链接的质量和数量,可以使页面根据页面上的内容进行排名,并且指向页面的链接实际上是对仅将查询中的关键字匹配到页面的一种改进。链接分析方法存在缺陷,市场营销通常会在链接的频率上发挥作用,但是依赖页面内容本身以及过去仅依赖于页面的系统存在更多缺陷像这样的方法很容易对页面进行高排名,这些页面使用了诸如隐藏文本和在meta标签和内容中填充关键字之类的技巧。

    Google确实会查看页面上的内容以及指向页面的链接,这是排名过程的一部分,但是Google还开发了许多其他方法来对页面进行排名和重新排名。一个例子是我在上文中提到的基于短语的索引方法,还有很多其他方法。 Google试图了解查询是事务型,信息型还是导航型查询,并可能根据该分析对页面进行不同的排名。 Google可能还会尝试查看查询背后是否有地理意图,如果存在,则可能显示与特定位置有关的结果(可能是搜索者所在的位置)。 Google可能会根据各种因素(例如,他们如何解释搜索意图)或根据您最近输入的先前查询来决定使用多种不同的排名算法。

  59. 保罗,你好

    感谢您发表评论并分享您的想法。我努力尝试使我撰写的专利和论文中遇到的许多想法尽可能地易于使用,同时仍保留其某些风味。它’s really 好 to hear from someone who doesn’有技术背景告诉我他们正在从我的帖子中学到新知识和有用的东西。

    网络中立性已经存在很长一段时间了,没有任何人明确立法。但是,像Comcast这样的公司可以控制网络上传输的某些内容,并可以在电影发行等领域与其他一些企业竞争,’可能会威胁到网络的中立性。

    It’s a topic that I’我考虑过写作一段时间,’今天在联邦通信委员会前举行的有关该主题的听证会,可能会影响我们的能力和能力’t see on the web.

    网络中立性:美国有望批准互联网访问新规则

    我可能会在今天晚些时候或明天发表有关该主题的文章。

  60. 嗨kipesiva,

    I’我不确定文档的长度是否对页面排名如此重要。虽然它’在页面上具有一定数量的内容以使其更有可能被该页面上出现的术语编入索引非常好,搜索引擎可能会尝试“normalize”页面的长度’不适当地影响页面在其上的单词排名的好坏。

  61. 嗨Shira,

    Those are 好 points –谢谢。随着网络的发展,搜索者对查找视频等事物越来越感兴趣,搜索引擎努力使它们更易于查找,而SEO必须包括更多地了解搜索引擎如何对视频进行排名。

  62. 法案,

    什么 an interesting perspective you have being involved with search engine happenings since the early years. 我不’拥有相当多的经验,但是我认为此处的讨论表明Google在识别真实价值方面变得越来越有效。

  63. 嗨尼克,

    谢谢。拥有经验是一件很棒的事情,但也有一个开放的思想,想尝试和学习新事物的经验。谷歌’未来的路线图确实在于他们能够为使用网站的人们提供更好的价值和更好的体验。他们’一直在为网站所有者和网站发布者以及与之合作的设计师,开发人员和顾问提供更好的工具,例如Google 分析工具(分析)和网站站长工具。他们 ’ve在许多方面也变得更加透明,包括在博客,帮助页面和帮助论坛等地方进行更好的交流。

  64. 嗨,比尔,
    真棒的技巧和观察。我现在是我的第一个内部seo职位,即使在今天,我仍然难以描述我的实际职位。这绝对有帮助。信不信由他们让我在合同中写我自己的工作描述。哈哈。很棒的博客,为进一步使用添加书签。

  65. 嗨,比尔。

    只是想对您说新年快乐,希望您过一个愉快的圣诞节?

  66. 克里斯,你好

    谢谢。圣诞节过得很愉快,有机会见到一些我以前没有的人’t seen in a while. I hope your holidays were 好 ones as well.

  67. 优秀的职位;它确实表明SEO的世界发展非常迅速。
    感谢您分享此信息。

评论被关闭。