雅虎探讨互联网活动如何预测事件结果

分享是关怀!

两名男子在一家算命店外,上面有一个标牌,上面写着每卖出一件商品就免费阅读。

想象一下,您运行一个搜索引擎,并且找到了一种基于Internet活动(例如浏览和搜索历史记录,搜索结果中的页面点击次数,对社交网络应用程序执行的操作)相当精确地预测某些事件的结果的方法。这些活动可能涉及诸如美国偶像的获胜者,政治选举结果,周末电影收入或音乐专辑销售,体育赛事的出席率或不同节目的电视收视率。

你会用这种力量做什么?

今天获得授权的Yahoo专利申请探讨了搜索引擎如何使用有关人们在网络上的行为方式的数据来预测此类信息。

雅虎做出这样的预测有多成功?

请记住,雅虎最初是 开始了 名称“Jerry and David’万维网指南,”并改用Yahoo这个名称,部分原因是对他们来说,Yahoo是“另一个分层的恶意Oracle。” As an “oracle,”搜索引擎应该能够做出预测。

例如,该专利描述了他们如何获取有关人的信息’在网络上的活动,例如“ 雅虎Buzz索引,并创建一个可以预测电影在财务上的成功的系统。从专利申请中:

例如,考虑电影Wall-e.TM。于2008年6月27日周末发布。Wall-e.TM的Buzz得分。在开始的周末结束的7天期间,该数字是45.92。根据上面的预测算法140,预测应用程序104将预测大约周末开放票房收入大约6191万美元。

可能要注意的是,该周末Wall-e的实际票房收入为6,300万美元,这表明该方法的准确性。

专利申请是:

根据相关的互联网活动预测事件的结果
由Anurag Kumar,Supereeth Hosur Nagesh Rao和N. S. Sekar发明
分配给Yahoo!公司
美国专利申请20100205131
2010年8月12日发布
提交日期:2009年2月9日

抽象

本发明的特定实施例针对用于基于与这样的事件相关联的互联网活动来预测事件的结果的系统和方法。例如,可以确定与一个或多个事件相关联的互联网活动度量。互联网活动度量可以至少基于与事件有关的特定搜索词的流行度。事件的结果也可以确定。

可以分析所确定的互联网活动度量和一个或多个事件的结果,以生成用于预测后续事件的结果的算法。例如,可以确定与特定后续事件相关联的互联网活动度量(例如,至少基于与后续事件相关的特定搜索词的流行度),并且该算法可以应用于互联网活动度量以进行预测特定后续事件的结果。

结论

该专利申请在可以使用的预测算法以及其他一些示例后面提供了大量细节,但是我’我不确定这是否是Yahoo中最令人印象深刻的Oracle型专利’s IP closet.

早在2008年,我写道 搜索未来事件的技术, 在文中 Yahoo上的Oracle:使用Yahoo News搜索未来.

分享是关怀!

关于19条想法“雅虎探讨互联网活动如何预测事件结果”

  1. 关于短期事件,我相信这个预测系统将是相当准确的。绝对有可能。我在某个地方读书(不幸的是我没有’记得在哪里)Google在实时处理Twitter数据。看起来您现在可以在基于嗡嗡声发布结果之前获得结果。感谢您的分享,比尔。

  2. 这太好了,难以置信。但是6119万美元的收入预测确实接近实现的收入6300万美元。因此,我认为事件结果的预测确实是可能的,而且令人信服。

  3. 很棒的帖子!我喜欢您在博客中提出的所有技术要点。说到预测未来,在阅读了您的文章之后,我根据该Yahoo专利写了一篇博客文章,您可能会发现它很有趣。我在想这对网络营销意味着什么–具体来说,如果Yahoo现在拥有的这项技术成为主流,’互联网营销人员试图改变事件的预测,因此可能改变这些事件的实际结果吗?它’这是一个非常有趣的想法。再次感谢!

  4. 嗨,马克和安德鲁,

    It’很难说这个系统可能有多精确,但是我很想看到更多的预测/结果,而不只是它们包含在Wall-E收入中的预测/结果。希望Yahoo的某人将发表更多论文,以使我们对这个系统的准确性有一个了解。

    我没有’没有看到有关Google试图使用Twitter数据做出类似预测的任何信息–将不得不寻找。谢谢。

  5. 嗨,迈克尔,

    谢谢。有趣的帖子。

    I 认为 to a degree, internet marketers do often try to use search volume data to try to make predictions, 通过 looking at things like search volumes for keywords when doing keyword research.

    雅虎在专利文件中告诉我们,像他们这样的系统可能对剧院所有者有用,例如帮助剧院所有者确定要放映的电影,为电影院中的特定电影分配多少空间以及他们放映多少电影应该有。

    营销确实经常涉及引起关于新主题的嗡嗡声,改变公众讨论以及改变未来事件的结果。这样的工具可能有助于做出有关遵循方向的决策。

  6. 未来的新营销理念。精神计算机热线…er…网站。连接,每月或一次支付费用,并从世界上最好的心理计算机上获得心理阅读!有什么想法吗?

  7. 很有意思。我刚读完《 The Predictioneer》’布鲁斯·布宜诺·德·梅斯基塔(Bruce Bueno De Mesquita)的游戏。使他对这个概念很感兴趣。搜索引擎不是公共服务,至少不是三巨头,但也许它们可以从相关的主要指令中得到提示。

  8. 有能力可靠地预测财务损益吗?哦,我可以’想象不到有什么不好的结果。
    例如,人们开始依赖Yahoo’的财务预测算法,然后它可以预测灾难,因此每个人都可以纾困–整个市场都崩溃了,这成为一种自我实现的预言。

    在这个故事和 这个 关于CIA和Google的合作‘recorded future’, I’m 认为ing about getting some tinfoil and folding it into a hat.

    不过,作为营销人员,我’d喜欢看数据。

  9. 我希望我能找出何时能中奖!开玩笑,因为我’我没有找到答案是可以预见的。

    预测的艺术,或更确切地说是预测的科学,因为我猜想事实是基于事实,尤其是Google和Yahoo搜索都在大规模使用它。在截至2010年5月29日的四个星期中,Google占美国所有搜索的72.17%。仅以为四分之三的美国人每天都在使用Google搜索,就可以提供有关市场的大量信息,被这两家大公司使用。

    当然,随之而来的是Twitter和其他社交媒体网站的嗡嗡声,这些嗡嗡声也提供了有关当然被视为消费者的用户的许多信息。

  10. 我理解该专利的要点,但是只有12%的互联网冲浪者使用Yahoo!。他们不’无法访问Google ’的在线活动数据库。因此,我想知道他们的预测使用这么少一部分人口的准确性如何。喜欢看更多的预测。大声笑…

  11. 嗨杰森,

    It does sound a little silly that way, but I do 认为 that it might be possible to come up with some interesting business decision making tools based upon information about internet activity.

  12. 嗨,Pavlicko,

    当我们开始基于算法进行决策时,决策的风险会变大还是变小?’关于如何获得这些算法的结果有很多信息吗?我会说那里’在这种情况下会有相当大的风险,并且可能导致自我实现的预言。

    话虽如此,我’d也希望看到数据。

  13. 嗨,SEO Bever,

    非常好点。预测似乎确实是搜索引擎提供的内容的核心。 PageRank本身的概念是对您可能会从Web上其他任何地方到达某个页面的可能性的预测。概率,置信度分数和统计语言模型是搜索引擎许多功能的核心。

    无论搜索引擎是否提供了明确的预测引擎类型,它们为响应我们的许多查询而提供的信息都会并且经常确实会影响我们的行动和做出的决策。

  14. 嗨,阿里,

    如果Yahoo每月提供超过30亿个查询的答案,这就是我所说的’从一位正在为Yahoo制作片段摘要(并且现在在Bing工作)的Yahoo搜索科学家那里可以看到,我会说,’大量的信息试图进行分析和理解。一世’我不确定在样本量较小时是否会出错。 ðŸ™,

  15. 关于此主题有两点:

    1)作为营销人员和业余社会学家,我发现“raw search text”人们实际表现的迷人指标“think”关于一个主题。例如。有5种选择–10个逻辑词来描述一个主题,其中两个占上风,并获得80%的展示机会。什么是查询字符串中的第三个单词? Google是全球潜意识的(操纵)版本。

    当然,您可以从中获得一些乐趣。例如,我遇到了一家SEO公司,该公司将其客户排名第一“polite euphemism”客户过去曾描述他们的业务(’这是每个人都想要的名片上的东西),而其他人很少。他们宣布胜利并继续前进。客户现在在每月2,000个搜索的关键字中排名第一。并且实际上没有使用客户用来描述服务的六个较大的关键字(每月500,000次搜索)列出,但是该公司有效地“blinded”从他们自己的自我排名。多亏了Google Adwords和Alexa,量化差距ðŸ™,很容易

    第二–搜索很好,但是我’d非常喜欢用来运行事件驱动的对冲基金的Linkedin。想象一下一个提要,该提要是公司更新配置文件的频率(特别是如果您可以检测到所涉及的隐身级别)–有多少人关闭了自动发布功能)….

    我怀疑对这种情况的正确建模将比典型报纸提前几周…

  16. 嗨,约翰,

    我有一个喜欢浏览大公司网站并寻找高管人员的朋友’命名并在LinkedIn上查找他们的列表,以查看是否有列表,以查看他们是否仍在为公司工作,了解他们的工作等等。有趣的是,很多时候企业网站继续列出离职几周甚至数月的员工’如LinkedIn所示,向左移。我认为人们认为LinkedIn作为网络工具足够有用,并且是一种获得新工作的方式,人们可以比以前的雇主更快地在那里更新自己的个人资料。

    It is interesting to 认为 about how popular search terms related to specific events might tell you something about those events, but I agree with you that 领英 seems to be an interesting place to gather data as well.

    Vanity keywords can be extremely harmful to businesses> It eludes me sometimes why someone might want to rank for a term that no one will search for, to their own detriment.

评论被关闭。