搜索引擎会查看URL中的关键字吗?

分享是关怀!

URL中包含关键字是否会影响排名?

在网页的URL中使用关键字是否有任何价值?搜索引擎会查看您可能包含在页面地址中的关键字,并将这些关键字与搜索引擎中页面的内容相关联吗’s index?

如果是这样,搜索引擎将如何查看页面URL中指示的网址,并将其分解为有意义的部分以标识关键字?

将URL分解为多个部分也可能会导致搜索引擎对网站页面进行爬网。

雅虎(Yahoo)最新发布的专利申请为我们提供了一些有关如何提取页面URL中的关键字并对其进行排名的想法,以及如何使用过程中发现的信息来确定首先要从网站上爬网的页面。

URL标记技术
由克里希纳(Krishna Leela Poola)和阿伦(Arun Ramanujapuram)发明
分配给Yahoo
美国专利申请20090083266
2009年3月26日发布
申请日期:2007年11月6日

搜索引擎将查看许多不同的信号以确定Web上的页面是什么,并尝试根据可能指示这些页面的主题或内容的关键字对页面进行排名。

这些关键字中的许多关键字是从页面内容本身中提取的,但是搜索引擎可以查看与页面相关的其他信息,例如页面的地址。

通过使用一种算法,也可以从页面的URL中提取关键字,该算法可以将URL分解为各个组成部分,了解这些URL的结构,并从URL中找到的不同部分中删除候选关键字。 URL中的关键字可能不是强大的排名信号,但可能会影响排名。

网址的一部分

专利申请为URL的不同部分提供了定义:

方案 –URL的此部分标识用于访问资源的Internet协议,例如HTTP或FTP

权威 –URL的一部分,用于标识文档或资源所在的主机服务器或域名。

路径 –这是权限或域名后的斜杠字符后的信息,它标识特定的页面或资源

查询参数 –可能出现在路径中的字符串,可以分解为名称和值对,例如“category=shirts”

碎片 –片段标识了页面中可能在URL中指向的子部分,通常以“#” symbol

专利申请中的这五个不同组成部分的示例:

http://www.yahoo.com:80/shopping/search?kw=blaupunkt#desc

在此URL中,方案为“HTTP”

权威是“www.yahoo.com:80”其中显示了域,还包括端口号“80” in this instance.

从技术上讲,路径是第一个斜杠之后的所有内容:“购物/搜索?kw = blaupunkt#desc”

本示例中显示的查询参数是“kw=blaupunkt”

该URL的一个片段是#desc

为关键字和网络搜寻标记URL

该专利申请描述了一种可以将URL分解成部分或组件以从URL中提取关键字的方法。这些关键字可用于对网页进行分类以进行Web搜索,并在为这些网页提供广告时了解有关哪些网页。

将URL分解为组件甚至更小的部分称为“tokenizing URLs.”除了帮助搜索引擎在URL中查找关键字之外,它还可以影响网站页面的索引编制:

URL标记化生成的标记也可以分配有Web文档的功能,以提高Web搜索的效率。 URL标记化也是群集网站URL的第一步。群集URL允许标识Web文档中具有更多相关性的部分。因此,当通过搜索引擎对网站进行爬网时,Web文档的某些部分可能会被列入白名单并应被爬网,而其他部分可能会被列入黑名单且不应被爬网。这将导致更有效的Web爬网。

结论

雅虎在专利申请中提供了大量细节,内容涉及如何将URL分解为各个组成部分,以及如何从这些组成部分中提取关键字以及提供不同的排名。如果你’对在此过程中如何处理您网站的网址感兴趣,它’值得花一些时间处理专利申请本身,以掌握技术细节。请记住,此专利申请中的过程可能不是Yahoo目前可能正在使用的过程,

注意事项 –更改页面的URL,特别是如果这些URL已经存在了一段时间并且被搜索引擎索引了,这是不应该的’在开始时,无需仔细考虑,也无需使用谨慎的方法,这样可以将更改的风险降至最低。这种方法可以包括使用适当的重定向(永久301重定向)指向指向网站页面的外部链接的任何新URL,实际上将内部链接中的URL更改为指向网站本身上新地址的URL,以及其他可能有助于网站保留其在搜索引擎中的排名。搜索引擎对网站页面URL更改的反应方式可能会因一个搜索引擎而异,并且一段时间内,这种更改可能会对网站页面的访问量产生负面影响,无论如何仔细地执行这样的更改。

ps。这里很不错的关键字研究简介:如何选择关键字和关键字短语的变体– SEO Basics (Sorry –不再可用。

分享是关怀!

关于46的想法“搜索引擎会查看URL中的关键字吗?”

  1. 您关于不更改已被牢固索引的页面名称的建议是明智的。您可能会舍弃多年索引良好的页面,而这可能无法带来回报。一世’d而不是冒一个在Google中执行的非关键字丰富网页名称,而不是冒用关键字丰富名称的风险。一世’甚至要警惕更改已被长期索引的页面标题和描述。

  2. 嗨,亚当,

    谢谢。这些都是很重要的。

    那里’将网页放置在Web上以支持站点或业务始终是风险因素,但是了解更改背后的潜在风险很重要。我会很犹豫地更改页面的URL,甚至更改长时间以来排名很高的页面标题和描述。有时可能值得冒险,但是也应该考虑其他替代方法。

  3. pingback:Links for March 26th | jonathan stegall: creative tension
  4. pingback:Keywords negli URL viste dai Motori di Ricerca | Seo Point - Posizionamento e SEO
  5. pingback:How To Choose Keywords and Variations of Keyword Phrases - SEO Basics
  6. 不’t Google’的搜索引擎已经可以做到这一点了吗?我几乎不再使用Yahoo作为搜索引擎。我发现Google已经在‘tokenizing’ keywords in urls.

  7. 嗨人查找器,

    我尝试使用各种搜索引擎,以注意所看到的差异。

    Google可能会做类似的事情’s not easy to tell.

    我没有’并未直接从Google看到有关在关键字中查找URL的任何信息,但是它们为我们提供了一些有关如何尝试理解不同URL的有趣信息。我的帖子 用相似的文本(DUST)解决不同的URL 与Ziv Bar-Yossef共同撰写的一篇论文有关,他在论文发表时就加入了Google。

    该论文来自2006年,描述了搜索引擎如何在不同的URL中发现相同的内容。它们将URL和URL的一部分分解的方式涵盖了与本Yahoo专利申请相同的基础。唐’不知道Google是否采取了下一步措施,以从部分网址中提取关键字,但是’s possible.

  8. 很高兴看到您添加了301永久性重定向建议。没有它,SERP中的一天就消失了。哎呀。害怕。

    PS,感谢您的链接。 ðŸ〜‰

  9. Heay Bill,对我来说很有趣,因为我使用相同的方法来解析机器人的url,以访问页面优化。尽管Google尚未对此做任何具体说明,但是您可以在PageRank原始论文的两行之间进行阅读,其中将对URL进行分析是链接上下文分析的一部分。 IMO,如果您已经优化了站点链接体系结构和页面对象,那么网站管理员用来链接到您的链接文本就没有那么重要了,因为优化的URI结构包含该短语。

  10. 嗨金伯利,

    是的,在不使用301重定向来让搜索引擎和其他访问者知道的情况下更改页面地址是很可怕的。 ðŸ™,

    您’再次欢迎您访问链接。我喜欢你的例子。如果人们开始考虑在其页面的URL中包括关键字,那么他们应该选择能有所作为的优质关键字词组。

  11. 大卫,您好

    我很高兴看到他们也在本专利申请中提及片段。我不’t believe that I’曾经在搜索索引结果中看到过带有片段的链接,但事实并非如此’这意味着这些内部页面链接中的信息可以’搜索引擎可以更好地理解页面的内容。

    I’m not sure that I’之前,也没有人提到搜索引擎注意URL中的单词来确定爬网的重要性顺序。

    URL中使用非ASCII字符是’在这里讲过,但是我’确保URL中出现空格之类的问题经常发生,以至于’这是必须解决的问题。

  12. 我一直想知道搜索引擎如何处理URL的片段/锚(#)部分,特别是在内部链接中。
    Google可能比这更先进。没有’看不到任何非ASCII字符。例如。给出一些有关如何使用URL设置爬网优先级的有趣想法。

  13. 嗨,特里,

    有趣的是,您使用了类似的方法。我认为它’必须密切注意站点上页面的URL结构,以了解页面的搜索友好性,并避免同一页面以不同的URL显示在站点上。

    劳伦斯·佩奇(Lawrence Page)早年合着的一篇论文确实告诉我们,Google在抓取页面时可能会非常注意URL:

    通过URL排序进行有效爬网

    用于确定要爬网的页面的重要性指标之一是页面的位置,该位置通过查看其在URL中的位置来确定:

    位置指标。页面P的IL(P)重要性是其位置的函数,而不是其内容的函数。如果URL u指向P,则IL(P)是u的函数。例如,以结尾的网址“.com”可能被认为比带有其他结尾的URL或包含字符串的URL更有用“home”可能比其他网址更有趣。有时使用的另一种位置度量标准认为,斜线较少的URL比斜线较多的URL更有用。所有这些示例都是本地指标,因为可以简单地通过查看URL u对其进行评估。

    大型超文本Web搜索引擎的剖析,URL本身的文本是’讨论,但是使用锚文本和与该锚文本相关联的文本来理解链接中指向的页面的重要性。的意思“与锚文本关联的文本” isn’并非真正在论文中定义,并且可以包括来自URL本身的信息以及来自链接周围文本的信息。

    由于Google小组一直在仔细研究要抓取的URL的内容和结构,并在仔细地研究用于索引目的的链接,因此,自这些论文发表以来的十年中,’在网址中使用单词可能会在指向所指向页面的内容索引中发挥作用。

  14. pingback:Der SEOdiotische Wochenrückblick - KW 13/09 | Der SEOdiot
  15. yes , keeping keywords in url are really good for SEO but some times it creates problem too . I have changed old urls of my website few days back but Google has not indexed them till now . 我不’不知道那可能是什么原因

  16. pingback:»Pandia搜索引擎新闻摘要3月29日
  17. 好贴

    域名是很难更改的部分–因为它主要是您的公司名称。如果要优化排名,URL的最后部分必须包含关键字。

    某些人查询参数可能会破坏页面的排名,甚至使它无法建立索引。我知道Google不想索引您网页中的搜索结果,但在我对查询参数进行100%投票之前,仍然必须看到一些确凿的证据。

  18. 嗨,迈阿密网页设计,

    您是否为旧URL设置了301重定向,以指向页面外部访问者的新URL?这可以帮助搜索引擎找到您移动的页面的新位置,还可以帮助可能通过搜索引擎,其他页面上找到的链接,可能已经保存的书签,旧链接的访客访问您的网站。在电子邮件,新闻通讯或印刷材料中。

    您是否真的更改了网站链接中的URL,以使用新的页面地址代替旧的页面地址?

    当进行这样的更改时,它也不是 ’尝试在至少一个新地址上找到至少指向这些页面的圆顶的新链接,并尝试对指向旧地址的链接进行更改(如果合适且可行)是一个坏主意。

    如果你’ve created an XML sitemap for the site, did you update it with the new URLs. 如果你 don’没有HTML站点地图,在其中添加新地址的站点地图也可以提供帮助。

    即使您完成所有这些类型的操作,即使更改了旧页面的URL,搜索引擎也可能需要一段时间才能更新其索引。它’进行此类更改的风险之一。

  19. 嗨,斯汀,

    我同意您的域名–人们应该对更改域名进行漫长而艰苦的思考,尤其是如果某个网站已经存在了一段时间并且指向它的链接很多。如果迫切需要进行更改,则值得冒险这样做。此类原因可能包括诸如更改公司名称或业务模型或业务所有者,完全重新命名公司,更改法律要求,突然提供更好域名的事情。并非每个域名都是企业名称–随着人们注册越来越多的域名,越来越难找到域名。

    我不’t同意URL绝对必须包含关键字,但是我确实相信,URL很可能是搜索引擎在确定页面内容以及与之相关的查询词时可能考虑的另一个排名信号。

    Excessive amounts of query arguments in a URL or directory levels may hinder the indexing of pages. 那’这是另一个帖子的好话题。

  20. 嗨尼克,

    Very good observation. Google has had a way to search for keyword phrases in URLs for years, which means that Google has been indexing keyword phrases in URLs. 我不’认为这意味着我们可以’不过,我们无法从该专利申请中学到一些东西。

    雅虎专利申请引发了许多有关URL中关键字的问题,并提供了一些可能答案的提示。

    我们不’无法确定URL中是否存在关键字会使页面对该关键字的排名更高。

    或者,如果网页的发布者使用adsense之类的广告,则搜索引擎是否可以使用URL中的关键字来决定要在网页上显示的广告。

    我们也避风港 ’从搜索引擎可以直接看到他们实际上如何看待URL中的单词和符号,并从中提取关键字并将这些关键字与URL中的其他关键字进行比较。搜索引擎已经发布了几本白皮书,介绍如何探索URL来识别显示同一页面的不同URL。 Google早期的白皮书之一告诉我们,搜索引擎正在避免索引包含以下内容的页面“cgi” within their URLs.

    我发现真正有趣的一个部分是,该专利申请还增加了一个概念,即搜索引擎可能会着重于根据出现在其中的关键字来抓取某些URL,然后再抓取网站的其他页面(而不仅仅是可以执行的可执行文件可能会出现在cgi bin中)。

  21. 谢谢李(商业荣耀目录),

    I’我也不知道在URL中放置关键字有多少价值。我认为它’s likely that there’与在页面标题,页面标题,指向这些页面的链接的锚文本中或页面本身的内容中使用关键字相比,URL中关键字的重要性要低。

    可以选择花费大量时间来重写此网站的URL以包含关键字,也可以花费相同时间来撰写博客文章,’d宁愿写博客文章。 ðŸ™,

  22. 我所见过的关于该主题的最有见地的帖子之一!

    尽管某些搜索引擎会查看网址中的关键字,但我相信‘rewards’在URL中放置关键字的比例很小。但是,嘿,所有这些小的SEO调整加起来。

  23. 伟大的伴侣…这里也有很多讨论。

    我认为您应该尝试将关键字添加到url中,但是如果您已有网站,则不要更改它,那不是很重要

  24. 我认为,如果您有任何与您的网站相关的文字,则应该始终对SEO友好。搜索引擎会读取所有内容。

  25. 嗨尼克,

    好点子。许多网站在搜索引擎中的排名都很高,但其网址中没有关键字,但事实并非如此’考虑使用它们并明智地使用它们会很受伤。

    我非常喜欢开发具有良好层次结构的页面,这些页面具有定义明确的信息结构,有意义的目录名和文件名,对于搜索引擎以及创建这些页面并进行维护的访问者以及设计人员和开发人员而言都是有意义的。

    那’我真正想要的东西’在这篇文章中讨论–精心设计的URL如何为使用网站的人带来价值,而不论搜索排名中URL中关键字的潜在价值如何。如下所示的URL具有人眼的意义:

    “http://www.example.com/books/philosophy/kant/critique-of-pure-reason.htm”

    它为人类访问者和搜索引擎提供了网站结构的提示,这对于潜在访问者可能更具吸引力,当潜在访问者将URL视为页面搜索结果的一部分时,他们可能单击页面链接这些搜索者正在寻找该特定书籍以及同一作者的其他书籍以及该类型的书籍。人们还可以在其浏览器地址栏中反向修改该URL,以查看该URL是否指向该作者的更具体页面,例如:

    “http://www.example.com/books/philosophy/kant/”

    搜索引擎会阅读所有内容,有时人们也会阅读。 ðŸ™,

  26. 谢谢,卧龙岗

    我同意你的看法。如果你’在重新启动新网站时,一定要考虑在URL中包含关键字。如果您有一个现有站点,那么您可以做些其他事情,而不是更改URL,这会带来更大的影响,并且给它们带来的风险也较小。

  27. pingback:»Mehr Erfolg beim SEM | seoFM-搜索引擎优化和在线市场营销人员的德国PodCast播客
  28. 在我的经历中,Google确实会寻找与原始内容相关的关键字,因为Google更改了算法,现在只寻找新内容,因此,正在制作原始内容的博客作者走的是正确的道路。

  29. 比尔,很棒。

    我非常喜欢它的推文。

    考虑到URL对搜索者的参与度的影响以及SERP中关键字加粗的可点击性,无论是否对教科书SEO产生了直接或直接的好处,URL中包含关键字似乎都是理所当然的。

    干杯,

  30. 嗨阿里

    我觉得’很好。新颖独特的内容可能是Google的目标之一,尤其是在新闻和博客文章方面。对于其他类型的搜索,这些因素可能并不那么重要。例如,有关《大宪章》或《美国宪法》的最佳报道可能不是新鲜新闻或鲜活页面,而这些文件都没有’多年来变化不大。

  31. 嗨,肯,

    感谢您的推文和您的客气话。我同意–在搜索结果中使用看起来似乎相关的URL似乎可以使人们更有可能将搜索结果跟随到页面上。很棒的标题和摘要’t hurt either. 🙂

    I’自从这篇文章以来,我发现了其他有趣的研究’我可能会在不久的将来写这篇文章。

  32. pingback:Why URLs Should Contain 您r Keywords
  33. 只要这句话是确切的,它’令人难以置信的强大功能,即使不是确切功能,也可以帮助一点,但效果却不那么…

  34. 每个人对此问题都有不同的看法。我也有看法。对我而言,在URL中使用关键字没有任何意义。当您分析两组网站时,其中一组在URL中有关键字,而另一组则没有,那么在这么多的参数上,一组带有URL的关键字的得分总是比其他一组低。

  35. 大家好

    I’我们已经看到在网址中没有关键字的情况下排名很高的网站,以及在网址中没有关键字的情况下排名很高的其他网站。一世’我不确定比较不同的网站是否有帮助,因为这些网站的排名很有可能还会受到许多其他信号的影响。

  36. 我认为网址中的关键字是搜索引擎排名算法中非常重要的因素。但是,在进行任何更改之前必须非常小心,因为页面可能已经排名不错。另一个原因是,可能已经有许多网站链接到特定页面,并且通过更改URL,所有这些链接都将丢失(尤其是如果没有从旧网址到新网址的301重定向)。

    在这种情况下,处理其他现场因素(页面副本,页面标题,链接结构等)比调整URL更为明智。

  37. 您好Stefanos,

    我完全赞成你–理解这样做的好处和潜在风险确实很有意义。我们知道Google可能会使用200多个排名信号来将查询与页面相关联–并且某些信号可能比其他信号提供更大的权重。

    如果某人的网站大约有1,000个页面,URL中没有关键字,并且使用无关键字URL指向这些页面的许多链接,’返回并更改所有这些URL的好主意远不在于改善页面本身以及指向这些页面的链接中的内容和关键字。花费更多的时间和精力来创建新内容和新页面也可能更好。

  38. Google绝对不会’请勿使用带有关键字的静态网址。在副标题下的SEO入门指南中“URL结构的良好做法” they state:

    “带有与您的网站相关的单词的URL’的内容和结构对于浏览您的网站的访问者来说更为友好。访客会更好地记住他们,并可能更愿意链接到他们。

    避免:使用过多的关键字…”

    他们甚至提到“…将其动态URL重写为静态URL…”

    标记

  39. 嗨,马克,

    关于该建议的一件事有些有趣 搜索引擎优化入门指南 (pdf)是’建议这些单词可能对页面排名有所帮助。相反,他们告诉我们:

    1.访问者可能会发现其中包含单词的网址更加友好
    2.网页中的单词可能会受益于网址中的单词
    3.当指向页面的链接使用URL而不是锚文本时,URL中的词可能有助于搜索引擎更好地了解页面的含义(并且可能通过指示URL中的词与文本之间的相关性来帮助进行排名。页面上的内容)。
    4.页面的URL显示在搜索结果中,并且其中带有单词的URL可能对潜在访问者更具吸引力。

    这些绝对是决定是否在页面的URL中使用单词时值得考虑的一些好处。

  40. pingback:Why URLs Should Contain 您r Keywords | Straight North 在 ternet 标记eting 博客
  41. 是的,搜索引擎会查看URL中的关键字。尽管这些KW不如标题标签中的KW那样强大,但它们仍然非常重要。 Google和其他搜索引擎会在标题标签,元,H1,页面术语,传入链接和来自托管域的链接中查看URL是否与KW协同工作。当所有这些匹配时,URL KW为您要排名的术语提供更多功能。

  42. 嗨,卡梅隆,

    这是那里的那些地区之一’直接来自搜索引擎的信息稀缺,例如专利,白皮书或博客文章中有关URL中关键字的实际值和权重的信息,因此’很难了解它们可能具有多少实际价值。

    那里 are plenty of websites that rank well for different terms that don’在网址中包含关键字,但是将其包含可能会有一些优势。至少,当您在URL中包含关键字,并且有人使用您自己的URL链接到您的页面时,您的确会在URL中获得这些关键字的值作为锚文本。

评论被关闭。