Google如何以及为什么会估算IP地址后面的用户数量

分享是关怀!

当您到达网页时,该网页的所有者可能出于多种原因开始收集有关您的访问的信息。最常收集的信息之一是 互联网协议(或IP)地址。 IP地址是可以与您访问Web的方式和位置相关联的数字。

使用IP地址作为数据点的困难

您的IP地址可能已分配给用于连接到Web的服务器或路由器,或者 代理服务器 要么 防火墙 它位于您使用的计算机和Internet其余部分之间。您可能会在与他人共享的计算机上上网,该计算机是在家里或在图书馆等公共场所,或在装有其他计算机的办公室中。您可能在同一台计算机上与室友或家人共享一个IP地址,或者通过同一IP地址使用多台计算机。

每次您访问互联网时,可能会为您的互联网访问分配一个唯一的IP地址,或者可能由路由器每周通过宽带提供商租用一个IP地址,如果该租约不存在,则可能会更改 ’通过在租用期结束后的一定时间内登录来自动更新。如果您通过办公室访问网络,则您访问的页面可以看到的IP地址可能是您公司的IP地址’s 防火墙.

当您通过诸如AOL之类的服务进行连接时,您可能会与许多其他人共享IP地址,因为您是通过代理服务器连接到Web的,该服务器可能会缓存其他人访问的页面–因此,如果您访问其他人最近看到的页面,则可能会看到该页面的缓存副本存储在代理服务器中,而不是访问该页面最初发布时所在的服务器。

本周授予Google的一项专利描述了搜索引擎如何能够使用多种不同方法来估计通过单个IP地址访问网络的人数。

为什么搜索引擎可能会估算IP地址后面的用户

Google为什么要能够估计一个IP地址后面可能有多少人,并在可能的情况下进行区分?

该专利告诉我们,原因有很多–能够通过IP地址估算有多少访客访问您的站点,这对确定以下内容很有用:

  • 从一个或多个IP地址访问页面是来自单个用户还是来自多个用户;
  • 从一个或多个IP地址中选择的广告是来自单个用户还是来自多个用户;
  • 来自一个或多个IP地址的服务器资源是来自单个用户还是来自多个用户;
  • 有多少用户访问网页或网站;
  • 有多少用户查看了某些广告展示次数;
  • 用户访问页面的频率。

Google可以通过多种方式使用此类信息。例如,Google在查询会话期间收集有关用户行为的信息,以便他们可以看到搜索者在搜索有关特定主题的信息时如何修改其查询,以试图了解搜索或一系列搜索的意图。 Google提供的许多功能受益于能够区分不同的搜索者,从大量搜索者那里收集数据以及汇总和分析该信息,例如:

  • 拼写更正建议,
  • 查询优化建议,
  • 确定搜索背后是否有地理位置意图(并可能显示地图和当地商业建议),
  • 个性化或定制搜索结果,以及
  • 搜索结果多样化

能够了解IP地址以及IP地址背后的特定用户是由哪些搜索以及与Google进行的其他互动,这在以下方面也很有用:

  • 为了确定点击欺诈是否正在发生,
  • 确定搜索和点击以及与搜索结果和广告的其他交互是否可以自动化
  • 确定搜索和点击以及与搜索结果和广告的其他交互是否可能是手动的,但可以证明有意操纵用户行为数据
  • 向Google等公共工具的用户提供数据,例如Google 分析工具(分析),Google Website Optimizer,Google’s Conversion Tracker
  • 分析搜索趋势,以与Google Insights for Search,Google Trends,Google Trends for Websites和Google Hot Trends等工具配合使用
  • 分析Google内部流程的趋势,这些趋势可能会确定某些主题和某些网站(包括新闻和博客结果)的受欢迎程度(或突发程度)
  • 确定网站或广告的受欢迎程度
  • 确定如何“Sticky” a site is
  • 收集用户数据以确定要为网站显示哪些站点链接
  • 运行许多其他过程,这些过程依赖于个体之间的区别来跟踪和衡量用户行为数据

虽然Google使用网页上以及网页链接中的信息来确定搜索结果中网页的排名,但过去几年的许多专利申请和白皮书强烈暗示着Google也正在密切关注用户行为数据确定人们对网络上的不同网页,视频,新闻结果,博客以及其他类型的文档或对象的关注程度。公众关注度可能会影响某些网站对不同查询的排名。

Cookie和其他客户端标识符

当您访问网页时,其所在的服务器可能会将文本信息发送到浏览器,每次您访问该页面时,该信息就会发送回该服务器。此信息被称为Cookie,可用于验证您的身份(这样您就不必’不必每次访问网站时都要登录),以及进行用户跟踪,并维护特定信息,例如您对网站的偏好以及’进入购物车等等。

但是有些人故意在浏览器中禁用cookie以避免被跟踪。

Cookies可以是估计有多少人通过特定IP地址访问Web的解决方案的一部分,但是当人们在其浏览器上关闭Cookie时,还有其他方法可以提供帮助。

该专利将Cookie和有关您的浏览器以及其他一些计算机设置的信息称为客户端标识符。

这些浏览器参数和“user-agent”参数可以包括以下内容:

  • 屏幕设置信息,例如屏幕高度/宽度,可用高度/宽度和颜色深度,
  • 时区,
  • 历史记录的长度,
  • 无论是否启用Java,
  • 插件数量
  • 哑剧类型
  • 连接到网络的连接设备或程序的类型,无论是台式机还是移动浏览器,屏幕阅读器或盲文浏览器,
  • 主机操作系统
  • 语言
  • 等等

因此,可以通过查看该IP地址的唯一一组用户代理和/或浏览器参数的比率来估算可能位于特定IP地址的用户数量。有关浏览器和其他客户端参数的信息可用于“区分不同的用户。”

Google专利是:

确定一组一个或多个互联网协议(IP)地址背后的用户数量
Deepak Jindal,Rama Ranganath,Gokul Rajaram和Fong Shen发明的
分配给Google
美国专利7,761,558
2010年7月20日授予
申请日期:2006年6月30日

该专利提供了大量细节,说明他们如何尝试分析Cookie和客户端标识符数据,以估计有多少不同的用户可能在不同的IP地址访问网络,以及他们可能在其中使用的一些假设和规则。分析。一些示例包括:

  • 除非共享计算机,否则只有一个IP地址上的单个cookie最有可能是该地址上的单个用户。
  • 出现在IP地址混合处的单个cookie可以是单个用户,其IP地址在每次连接到Web时都会动态更改,或者在连接到Web时在物理位置之间移动。
  • 具有多个Cookie的单个IP地址:
    • 在一段时间内使用少量Cookie的情况,可能是单个用户通过不同的浏览器或计算机访问,也可能是定期清除或重置其Cookie的某人
    • 在一段时间内包含大量Cookie的人可能是通过代理服务器访问的人数

有些Cookie的寿命很短,不到一天,而我们’再次告知可能会将其从此过程中过滤掉,因为它们可能来自不’t接受cookie,或仅接受会话cookie,或来自首次访问者,每天清除cookie的人,甚至是垃圾邮件发送者。

说到垃圾邮件,该专利告诉我们,可能会保留一系列已知的垃圾邮件代理和IP地址,这些列表可用于从估计中排除有关特定IP地址背后有多少人的信息。

此过程也可用于尝试编译可疑IP地址列表,例如看起来似乎只有一个用户但其印象或转换次数异常多的IP地址。这样的IP地址可能被列为垃圾邮件地址。虽然专利没有’t描述了其他可能将地址与垃圾邮件活动相关联的模式,’像这样的系统也可能潜在地查看许多其他信号。

结论

作为搜索者,网站所有者或SEO,您为什么要担心Google如何估算使用不同IP地址的用户数量?

一个主要原因是搜索引擎收集的有关来自不同IP地址的访问的信息可能会影响像Google这样的搜索引擎在识别点击欺诈,将用户行为数据纳入搜索排名,从关键字中删除搜索量信息等领域的运作方式自动化查询或检查排名的人员提供的工具,而不是搜索有关特定主题或查询字词的信息。

It’还可帮助您更好地了解Google可能收集有关使用它提供的工具的人员的信息以及什么样的信息。

在浏览器上关闭Cookie不会’表示Google可能无法区分您的搜索和可能与您共享IP地址的其他人的搜索–Google可以并且很可能会使用其他信息来了解在另一个IP地址后面有多少人,其中可以包括您使用的浏览器以及您的附件’已安装在其上,用于浏览的窗口的大小,浏览首选项等。

分享是关怀!

关于21条想法“Google如何以及为什么会估算IP地址后面的用户数量”

  1. 我认为将真正的搜索查询与排名检查查询分开绝对有利于关键字工具中数据的强度。我认为这也可以为许多使用互联网并可能共享相同IP的数字代理机构提供帮助… avoiding the “we’re sorry…但您的查询看起来类似于自动请求” Google error page

  2. pingback:Mehrere Nutzer,eine IP:Wie Google Personen-Anzahlenschätzt-SEO.at
  3. 嗨,马特,

    我们在Google上看到的搜索量数字有多么有用’的关键字工具?我们不’我们不知道Google在显示数字时会有效过滤自动和手动排名检查的情况。我不’不知道避免这种情况有多容易“您的查询类似于自动请求”信息。我知道我做十次以上就可以看到“allintitle”连续键入搜索。

  4. 我很确定他们没有’t从关键字报告中过滤掉自动查询。至于他们正在分析的信息,所有信息都可以被欺骗。但是,必须希望这样的应用程序相对复杂(如果有的话)相对较少。

    几乎可以肯定的是,自该专利发布以来的2-6个月内,将会有许多欺骗这种数据的人。

  5. 嗨,迈克尔,

    It’s likely that you’关于缺少对自动查询的过滤,以及将来可能会欺骗该专利中提到的许多信号,这是正确的。一世’我不确定是否会授予专利权。谷歌’s 隐私政策常见问题 还记录了许多相同类型的信号:

    服务器日志

    与大多数网站一样,我们的服务器会自动记录您访问我们的网站时发出的页面请求。这些“服务器日志”通常包括您的Web请求,Internet协议地址,浏览器类型,浏览器语言,请求的日期和时间以及一个或多个可以唯一标识浏览器的cookie。

    这是一个典型的日志条目的示例,其中搜索“ cars”,然后细分其各个部分:

    123.45.67.89–25 / Mar / 2003 10:15:32–
    http://www.google.com/search?q=cars
    Firefox 1.0.7; Windows NT 5.1– 740674ce2123e969

  6. 嗨安德鲁,

    代理服务器的使用肯定会产生误导。这是他们在专利中提到的事情之一,也是他们除了使用IP地址之外还使用其他信息(例如Cookie或与某人相关联的特征)的原因之一’的浏览器和用户代理。

  7. EFF正在运行一项名为“Panopticlick”通过指纹获取有关每个冲浪者独特性的合理数据。您可以自己运行测试,然后查看在哪里标识您的系统 panopticklick.eff.org。我的普通笔记本的摘要是:“您的浏览器指纹在迄今为止测试的1,100,076中似乎是唯一的”。如果EFF知道,Google和Yahoo也知道…

  8. 嗨,迈克尔,

    确实,如果有人试图找到使自己的信息不被测量和记录的方法,那么他们确实拥有一些可能有用的工具。我不知道使用Web的人中有百分之多少会利用您所指出的应用程序。

  9. 嗨,马丁,

    感谢您指出Panopticlick页面。我记得前一段时间碰到该项目,并考虑过在此添加一些内容,但是’不记得名字了,没有’记得它与EFF有关。

    他们指出了另一个有趣的网站,该网站可让您测试从浏览器中可以收集到哪些信息: 浏览器间谍

    这两个网站都让人眼前一亮,尤其是像 浏览器间谍 CSS漏洞利用 页面,该页面可能会告诉您最近是否访问过许多网站,例如Twitter,Facebook或eBay。

  10. 嗨,蒙特利尔网页设计师,

    我们知道Google有时会 定制或个性化 搜索结果基于您以前使用的查询,无论您是否登录Google或接受Cookie。我们不’不知道如果您的浏览器设置为不接受Cookie,是否会这样做,但这可能值得测试。

    如上所述,Google确实收集了大量基于用户的数据,在许多情况下,这对于他们查看查询会话非常有用,而不仅仅是来自搜索者的单个查询,这将要求他们能够识别出哪里查询会话中的每个查询都来自。对此的一个问题是,他们是仅从登录自己的Google帐户的人员收集信息,还是从被cookie跟踪的人员收集信息,或者甚至包括可能未登录且可能已禁用c​​ookie但能够由其浏览器和用户代理的配置确定。它’可能是这样。

  11. 我认为这对SEO来说是个好消息’,因为它没有提到反向链接,因为我们知道通用的链接’值很多。因此,我们可以假设SEO是否将方法从IP需求链接到网站’不用担心Google吗?

  12. 嗨,澳大利亚SEO,

    I’我不太确定我了解您的问题。您是否担心Google如何跟踪涉及指向站点链接的IP地址?我怀疑’尽管Google一直在关注着它’很难说搜索引擎可能或可能不使用该信息。它’例如,如果搜索引擎从其标识为已列入黑名单的垃圾邮件站点的IP地址中看到链接,则可能会影响链接可能(或可能不会)传递多少权重。

  13. 很棒的文章。

    当我查看Google 分析工具(分析)的统计信息时,’我很确定自己的访问次数也计入全球访问者人数。那么Google如何通过IP来区分访问量呢?不会’如果他们减少我的拜访会更有效吗?

    谢谢

  14. 嗨米格尔,

    我认为Google是有目的地进行设置的,因此,如果使用Google 分析工具(分析)的人想要过滤其IP地址,则他们必须自己做。当您注册GA时,由于多种原因,您使用的IP地址可能不是您经常使用的IP地址。他们不会自动过滤掉您的IP,而是’我把这个决定留给你。

    这里’s的描述,来自Google之一’s help forums:

    允许Google 分析工具(分析)忽略我自己对网站的视图的设置在哪里?

  15. 非常感谢,酷又如何从一个IP地址获取所有信息。
    P.S,如果你不’如果不想让他们监视您,您可以使用网络(torproject.org)。

  16. 想象一个拥有数百名员工的大型企业,其中只有一个IP地址。这对于Google来说是头疼的事情。但是您是对的,他们不仅必须检查IP,还必须确定谁在后面以提供自定义体验。

评论被关闭。