海边的SEO⚓

直接从搜索引擎学习SEO

搜索引擎如何辨别图像是否为广告图像

分享是关怀!

最近,许多人都指向 谷歌’s Panda update as one that considers things like how much 广告ising and where 广告isements are located on a web page as indications of the 质量 of a Web 现场.

Of course, there are likely other factors that the search engine would consider when scoring a 现场 based upon 质量 signals, but the ratio of 广告ising to content seems to be an important signal.

张贴在其他两个海报之间的墙壁广告图象的​​某人的图象在砖墙上。

许多网站都依赖广告作为收入来源,并且能够提供与访问者的信息和交易需求相关的广告’一件坏事。许多称为内容农场的网站主要提供足够的信息,以使其页面在某些术语的搜索引擎中排名很高,而没有提供与这些术语相关的主题的范围和深度的信息。

他们的目标是吸引访问者,并使他们点击在其页面上找到的广告。这些内容农场网站中的某些网站通过使用在Web上其他页面上找到的内容来进行此操作,无论是否经过许可或对该内容进行许可。其他人雇用人们以很低的价格写文章,然后拒绝’不能过多地关注该内容的实际质量。

在Google上’在Webmaster Central帮助论坛上,一位Google搜索工程师为那些认为自己受到Panda Update负面影响的人启动了一个话题“shouldn’t”已经。在撰写本文时,该主题有700多个回复, 想你 ’受最近算法更改的影响了吗?在这里发布。

由于广告似乎是更新中考虑的内容之一,因此,我认为很高兴看到Microsoft发布的专利申请探讨了用作广告的图像与非广告图像之间的差异。’t。我认为有些人在投放基于文字的广告,例如Google’■Adsense可能会考虑将某些文字广告替换为基于图像的广告。一世’我不确定这会带来很大的不同。正如微软专利所指出的,有很多方法可以确定图像是否是广告。

Microsoft专利申请是一种机器培训方法,可以不断学习,能够通过查看与图像相关的一系列功能将图像分类为广告。专利申请是:

图像分类为广告图像还是非广告图像
李明京,李志伟,李东方,王斌发明
分配给Microsoft
美国专利申请20110058734
2011年3月10日发布
提交日期:2010年11月12日

抽象

广告图像分类系统训练二进制分类器以将图像分类为广告图像或非广告图像,然后使用二进制分类器将网页的图像分类为广告图像或非广告图像。在训练阶段,分类系统生成表示图像的特征向量和指示图像是广告图像还是非广告图像的标签的训练数据。

分类系统训练一个二进制分类器,以使用训练数据对图像进行分类。在分类阶段,分类系统输入带有图像的网页并为图像生成特征向量。然后,分类系统将训练后的二进制分类器应用于特征向量,以生成指示图像是广告图像还是非广告图像的分数。

虽然这是微软’在获得专利的过程中,谷歌很有可能会查看非常相似的信息,以区分是广告图像还是非广告图像。’t.

那里 are a number of reasons to distinguish between 广告ising and non-advertising images. One is that a search engine wouldn’想要在其图像搜索结果中包含作为广告的图像。另一个可能是要了解与非广告内容相比,页面上有多少广告。

与分类相关的特征类型

的patent filing provides us with four different possible feature types that the search engine might look at, and examples or reasons why these features are useful in determining whether or not an image is an 广告。 These include text features, link features, 视觉布局功能 or content features.

文本功能会查看可能与图像相关联的单词,这些单词可以在图像的URL,图像中的ALT文本或图像周围的文本等地方找到。这些词可能表示图像是广告,包括类似“pop-up” and “advertisement.”

Link features are ones involving where links associated with an image might point. Does the image link to a page on the same 现场 where the image is found, or to a different location which might be an 广告isement server or a web page where an 广告ised item might be purchased.

A 视觉布局功能 identifies where an image is visually laid out within a web page.

图像的内容特征与图像本身的内容有关,并且可以包括:

  • 图片的长宽比,
  • 图像格式,
  • 无论图像是照片还是图形,
  • 图片大小
  • 图像不同颜色的数量,
  • 图像灰色区域的百分比,以及
  • 图像是否具有高对比度的指示。

这些内容功能中的某些功能可能有助于确定图像是否为广告图像。

We’该专利的作者告诉我们,长宽比可能有助于识别往往又短又宽的横幅广告。

的image format can identify images with multiple frames (used to provide animation).

在照片和图形之间进行区分很重要,因为大多数广告往往是包含有关广告报价信息的图形。

尺寸非常有用,因为广告必须至少具有一定的尺寸才能引起注意。

图形中使用的颜色数量很重要,因为广告图像通常比非广告图像具有更少的不同颜色。

灰色区域值得考虑,因为“广告图像通常具有变化的灰色阴影作为背景。”

Contrast is looked at because an 广告isement image usually is created to have sharp contrast.

结论

尽管该专利提供了搜索引擎如何确定图像是否为广告图像的许多示例,但搜索引擎可能还会看到其他事物。

在类似Google用来根据搜索结果对搜索结果进行排名的系统中“quality”的网页数量,当搜索引擎查看网页上的广告时,’不仅要看基于文字的广告,还要看作为广告的图像。

分享是关怀!

52个想法“搜索引擎如何辨别图像是否为广告图像”

  1. 法案–尽管此评论与广告分类无关,但我们正在测试图像分类的影响。以前,我们在网站上主动重用图像,以便利用快速下载缓存的图像的优势。但是,自从Panda更新以来,我们正在尝试裁剪图像,以便带有图像分类系统的搜索引擎可能会在网站上看到它的其他独特内容。现在就开始阅读此测试。鉴于这样做会降低我们网站的可用性并降低下载速度,因此除非我们看到搜索排名的积极结果,否则我们不会扩大我们的工作范围。

  2. 广告图像分类无疑会为搜索引擎造成利益冲突。惩罚图片广告过多的网站,除非它们是Adwords展示广告,否则Google将从财务上受益。我并不是说Google偏爱其广告发布商,因为如果发现广告发布商的负面宣传可能会超过收入增加带来的好处,但这是Google利益冲突的另一个例子。

  3. 以便’s what they are calling the latest google (spank),err..update. Interesting. I find it humorous to be looking for something online and find a forum post from 5 years ago that is not even relevant any more at the top of page one and some 文章 that is exactly on point buried on page 15. 我不’认为Google可以将相关性编程为AI。只是在说 ’.

  4. “专利的作者告诉我们,长宽比可能有助于识别往往又短又宽的横幅广告.”

    这听起来像是您可以做的少数有用的事情之一,因为纵横比和布局在某种程度上在整个行业的大部分范围内都是标准化的。

    但是否则’太含糊,浮躁且与核心用户体验无关。它’即使绝大多数用户都没有,alt文本如何在Google上大幅度提升了’不知道什么是替代文字,更不用说了。

  5. 听说Google正在对其进行修改’s algorithem, I wasn’确保会发生什么变化。我知道它正在改变’的搜索引擎,但图片方面是已知的,我还没有’t heard this before—I’我敢肯定,一旦我们弄清楚’会变成别的东西。

  6. 我认为,如果将非常大的图像广告分解成几部分,您仍然可以在相当长的时间内消失。我认为工程师还需要做一些工作来使该系统防弹,同时它总是会打击一些无辜的人。

  7. 嗨,Tracy,

    I’m afraid that I’我不确定裁切图像以使其具有不同的尺寸是否会对Google产生太大影响’的图片相似度搜索技术,但听起来确实像是一个有趣的实验。

  8. 嗨桑迪,

    那里 are a few different reasons for a search engine like 谷歌 to take a step like this. 的simplest one is that it really doesn’想要索引广告图像并将它们与出现在其上的网页相关联。

    It’对于搜索引擎而言,’t将搜索者引导到有用内容很少并且被广告覆盖的页面,无论这些广告是基于文本还是基于图像。我相信广告是许多网站的非常有效的商业模式,而我’我在此不反对或反对在网页上使用广告。相反,我认为人们会发现搜索引擎如何区分广告图像和非广告图像会很有趣。’t,尤其是考虑到Google’熊猫更新,该更新似乎与网页上广告的数量和位置有关。

  9. 嗨,Max,

    I’我不确定您将alt文字作为排名信号的类比在这里如何应用。包含大量广告的网页以及在大多数页面访问者希望看到内容的地方做广告是用户在网页上体验的重要组成部分。那些访客不’不需要精通纵横比,图像分辨率,替代文字的使用或其他相关主题。当您访问页面时,您必须向下滚动浏览大块的基于文本的广告和基于图像的广告,查看设置为使其看起来像页面导航的广告,依此类推,’可能不会被访问者视为良好的体验。

  10. 嗨,凯西,

    我认为Google将是最后一个说他们’ve开发了一种人工智能,可以区分相关页面和不相关页面,还是质量较高或较低的页面。我们’距离计算机能够查看页面并做出这种判断大概还有很长的路要走。相反,我们拥有的是一种算法,该算法会查看页面中的某些信号,以将其与其他页面进行比较。它’像这样的系统很可能会基于编程到其中的假设以及它所包含的数据而存在缺陷。’给出了更高质量的网站的示例。

  11. 嗨,迈克尔,

    谷歌一直在对其进行更改和修改’定期对算法排名超过几年。 谷歌的代表像他们的网络垃圾邮件负责人Matt Cutts一样,公开指出他们’每年平均约有400次更改。

  12. 嗨安德里亚斯,

    很好,尽管我怀疑有人可能已经考虑过将在这样的分析中找到的图像分解成不同的图块的可能性。那不是’这是许多设计师所关心的一种罕见的方法,这种方法涉及人们窃取图像,加载时间以将这些图像切成碎片的事情。

    的“视觉布局功能”专利中描述的“图像”可能是一种识别图像何时进行平铺的方式。

  13. 大卫,您好

    I’我不确定这本身就是一个太大的问题。

    通过执行诸如减少图像中的颜色数量之类的方法来减小文件大小,可能会使该图像的潜力看起来更像是广告,但是’只是众多功能中的一项。该算法确实很有可能’不要对任何一项功能都施加太大的压力。诸如图像指向的位置可能比快速加载图像的优化程度更好。

    I’d also say that optimizing the file size and an image size are usually worth doing, especially if you use a number of images on a page and the original sizes can negatively impact the loading times of a page. I see too many 现场s where images are way too large.

  14. 另一个很棒的帖子,尽管我怀疑Google’的算法(以及其他搜索引擎的算法)已经非常善于区分图片和广告;那里’s one simple –尽管有点肤浅–这个测试,那个’查看图片搜索中返回了多少广告。在大多数情况下,返回的广告数量很少。

    具有讽刺意味的是,即使在‘advert’返回的大多数结果都是非广告。

    一个重要因素’错过了该职位(除非我’却忽略了它)是广告在页面上的位置,它与您先前在页面细分中的帖子之一相关联。广告通常位于几个关键区域。

    干杯

  15. 这是有趣的条例草案;但是,持怀疑态度的人有Google误读某些图片并曲解它们的危险。
    他们可能需要为照片被误判的人建立帮助热线。

  16. 嗨,比尔,
    即使我’我有一些更商业的网站已经使用了近4年时间(例如,一个实际的商品需要通过货运运送给客户),加上我认为所有页面的质量和描述性内容都很完善,当我感到惊讶时,我从Google排名中的第3位升至第1位’的变化。而且,那时,我没有’甚至在网站上的任何地方都没有任何外部广告。

    从那以后,该特定网站的页面排名有了一些改善(回升,现在为2/10)–现在我有一些外部广告–有些没有照片,有些没有照片。我猜这些算法只是我无法理解的一点。但是,我只是不断插手,尽我所能添加适当的内容。它’当您的网站只处理特定数量的产品时,有时可能会很困难。有时在那里’那时只有这么多人可以写。

    凯思

  17. 出色的信息,图像在排名中起着重要作用,我认为图像的价值超过了文字,这是因为图片的价值超过1000字

  18. 法案you write some interesting topics that I can sit and discuss forever, my comments on this could be larger than the post itself.

  19. 嗨,两步走,

    We’在同一波长上–在阅读专利时,我问自己的第一件事是,我记得在Google上看到多少张广告图片’的图片搜索。虽然这似乎是一个粗略的衡量标准,但我认为’值得考虑的一个。

    该专利确实包括“视觉布局功能”其中涉及图像可能在页面上出现的位置。专利没有’我没有详细介绍这些功能,而我做了’也没有,但我同意你的看法’是一种可以与细分过程配合使用的东西,它可以在确定图像是否为广告时添加更多要检查的东西。

    我似乎有人在侧边栏中放置图片,通常在其他位置放置其他广告,这些位置可能是来自flickr帐户的旋转图像或可能用于帮助描述或定义网站不同部分的图像。因此,单独放置图像可能不是一个强烈的信号– but that’这就是为什么该专利中的过程着眼于一系列信号的原因。

  20. 嗨,戴夫,

    那里’总是有机会让Google及其算法误读或误解某些内容。那’我之所以努力像我一样关注这种专利的部分原因。此专利就可以了’s own isn’确实是一个重大突破,但它确实为我们提供了有关搜索引擎在确定图片是否为广告时可能要进行的分析深度的许多详细信息,并且提出了许多问题,我们可以问自己一个问题:搜索引擎可能正在解释它在我们网页上看到的内容。

  21. 嗨,凯西,

    您看到的工具栏pagerank有点误导。它应该仅与PageRank绑定,并向我们提示指向页面的链接的数量和质量。它’的更新频率不是很高,因此只能看作是过去某个时间点的页面排名的快照。

    Signals that might help determine how relevant a page might be for a particular query, or the 质量 of the content of our pages isn’我们可以从工具栏的页面等级中学到一些东西。

    如果您网站上网页的排名从3变为1,则’原因可能是您可能丢失了指向该页面的某些链接,或者链接到您的页面可能失去了某些页面排名。但是工具栏的pagerank没有’不会告诉您任何有关Google对您网页上的广告或内容质量的看法。

    现在,如果您网站上的网页’t在工具栏中显示任何pagerank,这可能是因为该页面比Google上次更新工具栏pagerank时的页面新,或者可能是Google缺乏’t对该页面进行了检索并建立了索引。你可以用一个“site”搜索以查看它是否包含在Google中’s index (see 谷歌的此页面 有关其搜索运算符的更多信息。

  22. 嗨Michal,

    那里’不能否认页面或文章中正确图像的价值。您可以向某人描述一只鞋子,但是在他们在线购买之前,您确实需要向他们展示一张鞋子的图片(更好的是,从不同角度看几张图片)。您可以将新闻事件告诉某人,但是帮助他们形象地了解发生的事情的图像极大地增加了该故事。

    我不’不知道图像本身是否比页面上的文本具有更大的权重,因为与图像相关联的许多排名往往都依赖于与那些图像相关联的文本–文件名,替代文本,标题,可能还有围绕图像的一些文本,但是我认为,当将这些类型的信号添加到页面上的其他基于文本的信号中并很好地匹配时,确实会产生影响。看我几年前的帖子, 搜索引擎如何使用图像对网页进行排名

  23. 嗨,詹姆斯,

    谢谢。一世’我发现自己在博客文章上写评论,想知道我是否应该接受我的建议’已撰写并将其转为博客文章,并带有原始文章的链接,而我’有时会这样做,并像其他时候一样发表评论。它’决定哪种方法最好的方法并不总是那么容易,但我感谢您提出的意见。

  24. 嗨,比尔,

    “Google feels about 广告ising on your pages or the 质量 of your content”.

    So 谷歌 has an issue, if a 现场 that sales widgets is indexed for the keyword “we sale widgets” but also displays 广告ising that is not related too widgets?

  25. Pingback:Google可能正在决定“Ad” Images
  26. 关于任何种类的图片和SEO,我只花了两美分:

    正确使用替代标签(属性!)很有用
    首先使用人类的Alt标签,其次使用Google
    以可访问的方式描述图像
    我猜想Alt标签会受到严厉监视–向他们发送垃圾邮件,后果自负
    使用空的ALT作为设计元素,使用描述性文字作为图片
    意见–优化的ALT标签与指向页面的链接一样有用
    没有这个词’锚文本中的。它’s second order.

  27. 有趣的思想和信息。它’d看到从搜索中删除的广告横幅数量很有趣。这似乎困扰着我这个问题– what if you’重新专门在图像搜索中搜索广告?似乎有点难以评估。

  28. 感谢您提供的信息。

    I’可以肯定的是,搜索引擎可以分辨出广告和图片之间的区别。对Google图片搜索的检查可能会证实这一点。我觉得你’正确地说,熊猫更新似乎主要与广告的数量和位置有关。

    I’我是否想知道主要与慈善相关的链接横幅广告,是否可以将这种横幅广告用作商业广告?

  29. 我想知道网络中有多少图像与商业广告相关,多少与某些内容相关,我的意思是,如果考虑百分比,它的外观如何,因为对于Google来说这可能是个大问题,因为我认为现在确实有很多广告网站。

  30. 你们觉得吗’s possible to “overuse” the ALT tags for images? I recently re-did my 现场 and optimized the ALT tag for each individual page (about a 30 page 现场). I didn’只是重复关键字,我想我在ALT标签中有一个句子。太过分了吗?

    Great information here, I love reading this 现场!

  31. 嗨,比尔,横幅广告大部分都符合IAB尺寸,即300×250, 728×90, 160×600.我在一个月前和一个星期后在横幅中搜索产品之后创建了横幅,该横幅出现在Google图片搜索的第一行。在阅读您的帖子后,我今天才对其进行了检查,并且该帖子未在首页中显示。这个特殊的横幅当时’包含在Google广告管理系统或OpenX中,只是一个简单的锚链接。也许考虑到文件命名约定campaign-name_300x250_en_v1.gif;用尺寸命名文件是很标准的。
    但是,我发现例如首页的自定义尺寸横幅仍在索引中,’t不在Google图片搜索结果的第一部分。看来是Google’s got IAB’的标准广告尺寸编号!
    感谢您发布帐单!

  32. 嗨,戴夫,

    我说的是:

    最近,许多人都指向 谷歌’s Panda update as one that considers things like how much 广告ising and where 广告isements are located on a web page as indications of the 质量 of a Web 现场.

    我的很多文章和论坛评论’曾经看到提到这些事情是可能的,但是Google’一定是这样说的。我认为对Amit Singhal和Matt Cutts进行的Wired采访使我们对Google对此次更新的评价有了更好的了解– TED 2011: 的‘Panda’ That Hates Farms: A Q&与Google的顶级搜索工程师一起

  33. 嗨,彼得,

    我同意您的观点,正确处理替代文本可能会非常有帮助。

    当涉及到搜索引擎试图区分图像是广告还是非广告时,替代文本可能会有所帮助,但是我认为搜索工程师正确地希望在制作图像时能看到尽可能多的信号区别。

    I’这篇文章并不是在谈论人们以恶意方式使用图像,而是一个搜索引擎可以更好地理解页面上图像目的的过程。

    那里 can be a few reasons for making this distinction. A couple of them could include:

    1.搜索引擎可能不会’t want to fill up image search with 广告ising images
    2.如果搜索引擎在页面中包含缩略图(就像他们经常对新闻报道所做的那样),则他们希望使用支持故事的图像,而不是附带故事的广告。

  34. 嗨,克里斯蒂安,

    我不’我们不知道Google对显示图像(在图像搜索中是广告还是从图像搜索拉入网络搜索)的兴趣如何。我想他们会避免这种情况。

  35. 嗨,周杰伦,

    我认为搜索引擎仍会将作为非营利组织广告的图像视为广告。我认为他们的重点更多地在于他们认为搜索者在执行搜索时希望看到的内容。

  36. 嗨尼克,

    一个相当于单词的句子作为替代文本可能不会’t be a problem. I’m not sure that I’曾经见过应该将一定数量的单词或字符用作图像的替代文本,但是W3C确实建议当替代文本开始变长时,请使用较长的desc。

    我确实认为’s possible to 过度使用 alt text, and in some pretty spammy ways. I’我见过人们这样做。我猜是这样’如果您将大量垃圾内容放置在图片的替代文字中,则可能会损害页面的排名。

  37. 嗨,比尔,

    信息丰富,以至于上周五在伦敦SEOmoz研讨会上被Rand Fishkin引用。作为行业的新手,我一直在寻求吸收尽可能多的信息。我肯定有时会到达信息过载的地步。我的怀疑在SEOMoz研讨会上得到了证实,您的博客是可信赖的消息来源。幸运地出席了会议,我提到您的网站是社区热烈推荐,并且一定会再来的。

    干杯!

  38. 嗨,金,

    感谢您与在图片搜索中展示(或不展示)的广告分享您的经验。我写的专利是微软’s rather than 谷歌’,但是我肯定会说Google做了类似的事情。

    It’搜索引擎可能对横幅广告的标准大小和文件名标准都有很好的了解。有趣的是,您的自定义尺寸横幅广告已编入索引并显示在Google中’s image search.

  39. 丹尼尔,您好

    很高兴认识你。

    感谢您分享有关兰德的信息 ’提到我的帖子。我没有’t know he mentioned it. 那里 is a lot of information to absorb about SEO, which is why I like spending a lot of time with the patents and whitepapers from the search engines, and part of the reason why I share information about those here. I consider my blog to be my workbook –一个我可以重新研究并与他人共享研究的地方。

  40. 你说“专利的作者告诉我们,长宽比可能有助于识别往往又短又宽的横幅广告”这是否意味着我们应该避免使用与广告类似的任何图像尺寸或确切尺寸?这里有任何澄清吗?

  41. 我可以想象alt文字在确定中的作用很小。阿仁’很多广告图片搜索引擎想避免由精明的在线营销人员制作吗?这对其他人有意义吗?我将其理解为所有传统方式中的决定性因素,但为了区别广告,似乎较少的操作领域将变得更加重要。

  42. 好吧,我确实认为替代文字不相关(非常简单,以至于使蜘蛛感到困惑)但是我不知道’不明白的是..如果我的图像(照片)具有很高的对比度(并且有人),则它们可能会受到此新评估系统的影响。
    但是,如果在一个网站上上传了1000张图像,那么我只有100张图像,那么所有网站都可以受到此问题的影响吗?或者只有放置100张图像的页面可以?

  43. 古斯塔西莫,你能重提这个问题,甚至对我来说还是有点困惑:/

    根据页面内容,图像名称和许多其他因素(可分析替代文字),替代文字与定义最相关。

    如果您有高对比度的照片?您是说高分辨率(宽度和高度更大的图像)吗?

  44. 嗨赫曼,

    I’m not suggesting or advising that you do anything to purposefully manipulate the way that you use images on your 现场, but instead rather sharing information from Microsoft’他们如何尝试分析在网页上找到的图像的专利申请。

    如果您将页面上的图像用作内容,则可能不会’不想将它们解释为广告。如果您使用图像作为广告,您可能不会’不想将那些解释为您内容的图像。该专利描述了许多因素,这些因素解释了它们可能如何区分两者,似乎它们’在区分广告和非广告方面做得很好。

  45. 嗨,约翰,

    I’我不确定营销人员为什么真的希望他们的广告形象被视为广告以外的东西。我同意搜索引擎在做出决定时可能会更多关注除alt文字之外的其他内容。诸如在页面上的位置以及图像可能链接到的位置之类的功能可能比所使用的替代文本更有帮助。

  46. 嗨古斯蒂西莫

    像詹姆斯一样,我’我不太确定你在问什么。

    此过程着眼于许多不同的功能,以试图区分广告图像和非广告图像。’t,因此,如果您的非广告图片倾向于高对比度(广告中经常使用的功能),但不要’不能满足许多​​其他功能,例如链接到人们可以购买产品或服务的页面,很可能仅靠高对比度是无法做到的’不要将它们归类为广告。

  47. Pingback:您网站上的广告数量是否会影响您的可链接性
  48. Pingback:您网站上的广告数量会影响您的可链接性吗? | WebPro新闻

评论被关闭。