搜索引擎如何在决定在网络搜索中显示新闻时使用地理和人口信息

分享是关怀!

搜索引擎如何选择是否在网络搜索结果中显示新闻项以及何时不显示?

如果您住在弗吉尼亚州的比尔顿,当您搜索有关布鲁克林的信息时,您可能对纽约布鲁克林的车祸消息不太感兴趣。如果你’关于布鲁克林的信息,并且想查找有关威斯康星州公园的度假信息,您可能不太担心威斯康星州彩票中的最新中奖号码。但是,如今正在搜寻有关与墨西哥湾接壤的一个州的信息的人可能会希望看到有关该地区漏油事件的消息。

最近发布的Yahoo专利文件描述了他们如何使用基于搜索引擎的预测系统’的查询日志,以决定是否显示新闻结果。预测系统结合了与查询和搜索者有关的地理信息以及有关如何“newsworthy”一个位置可能是要做出决定。该专利告诉我们,它可能会创建类似的预测模型来确定是否也显示其他类型的结果。专利申请是:

搜索结果选择中基于地理的预测的系统和方法
由Rosie Jones,Fernando Diaz和Ahmed Hassan Awadallah发明
美国专利申请20100161591
2010年6月24日发布
申请日期:2008年12月22日

抽象

公开了一种用于使用地理空间信息来确定一个或多个预测度量的系统和方法,该地理空间信息可用于确定是否在搜索结果中包括信息的类型。

预测度量包括以下可能性的度量:如果搜索结果中包括信息类型的项目,则该用户将选择或点击针对其确定了预测度量的信息类型的项目。非限制性地,一种这样的信息类型是新闻。

在专利申请中’在说明中,我们显示了一个预测系统可以分析查询,以预测某人是否会对搜索结果中显示的新闻感兴趣。它将查看搜索者提交的查询以及历史数据(例如以前的查询),以决定显示哪种类型的结果。

历史数据是从一定时间(例如几周)的查询日志中获取的。它可能包含那段时间内提交的几百万个查询,并且包含与每个查询字符串相关的信息,例如:

  • 使用的搜索词
  • 显示给搜索者的搜索结果
  • 这些结果中包含的页面类型的详细信息
  • 是否显示新闻结果,以及是否显示新闻结果(如果有)
  • IP地址或其他指示搜索者位置的信息
  • 查询并单击或选择信息
  • 搜索者来自的地区的人口信息
  • 查询中确定的区域的人口密度信息
  • 从查询中提取的地理信息,例如地名
  • 距搜索者的地理距离和查询中指示的位置

可以使用Yahoo专利中描述的过程来标识查询的地理位置 地理位置提取,它在查询中查看类似于地名的事物,并根据它们可能是地理地名数据库中包含的场所的可能性对它们进行评分。

专利申请的作者告诉我们,测试表明’两者之间的相关性“查询位置置信度”以及点击新闻结果的可能性。例如,我们被告知包含地名的查询获得新闻点击的可能性是不包含地名的查询的两倍。

据推测,搜索者在寻找新闻时也倾向于更频繁地使用国家和州名,而在寻找诸如服务和企业之类的非新闻结果时,他们更频繁地使用城镇名。

也可以为地点名称分配点击概率,这是对位置的度量’s “newsworthiness.”

The newsworthiness click probability of a location can be influenced 通过 the amount of 有新闻价值 events that have happened at the location. The patent provides some examples. For instance, a query that includes “kosovo” or “pakistan”比包含地名(例如)的查询更可能导致点击新闻结果“cedar point” or “utah”.

从诸如美国人口普查局人口数据之类的来源获取的搜索者所在位置的人口密度,也可以用于预测该搜索者​​是否可以点击新闻结果。我们’重新告知,与人口密度较低地区的搜索者相比,人口密度较高的地区的搜索者对新闻更感兴趣,点击新闻结果的可能性高20%。

搜索者之间的距离’地理位置和查询中指示的位置可用于做出有关搜索者是否更有可能点击新闻结果的预测。例如,某些新闻可能会在国家或地区级别上吸引听众,例如大型自然灾害的新闻。远距离的搜索者对可能被认为更本地化的新闻感兴趣的可能性要小得多,例如州彩票结果或车祸。

结论

在通用搜索或混合搜索的搜索引擎的许多专利和论文中,新闻条目可能会插入到网络搜索结果中,’有人告诉我们,决定包括这些结果的依据是 相关因素.

在这里,我们 ’再次表明,搜索引擎可能会查看其他信息,以就是否显示新闻结果做出更明智的决定,例如仅向那些“local.”

It’Google和Bing也可能会使用类似的预测模型,并用于获取是否包含新闻结果的信息。例如,在Google中搜索本地业务的人可能会在搜索结果中看到该业务的地图,而远处的人可能不会看到该地图。

另一个例子。当我搜寻“New York” or “New Orleans” in Google, I’m显示了新闻结果。当我搜寻“Warrenton, Virginia,”我的搜索结果’不含任何新闻。是因为Google预测我’更可能对人口密度较高的地区的新闻感兴趣吗?还是因为数量不多“newsworthy”沃伦顿是否发生过事件?两者都是可能。

分享是关怀!

关于10条想法“搜索引擎如何在决定在网络搜索中显示新闻时使用地理和人口信息”

  1. “它会查看搜索者提交的查询以及历史数据(例如以前的查询),以确定要显示的结果类型。该历史数据是从一定时间(例如几周)的查询日志中获取的。”

    感觉像你’重新跟踪,但如果’代表更好的搜索引擎结果,那么我猜’好的。有时,您确实确实需要更好地了解用户才能提供更好的服务。

  2. 谢谢账单,它’s可能只是一个预测,因此对于所有人而言可能并不完全正确,因为来自其他地方的某些人可能对新闻结果感兴趣。搜索引擎仅根据其位置考虑人的本性。但是,他们为增加搜索引擎所做的工作将为我们提供帮助。

  3. 现在很有趣……我一直很喜欢观看搜索如何继续发展,我认为本地和超级本地是一个明显的趋势。

  4. 嗨安德鲁,

    我同意你的看法。拥有一些信息总比什么都没有要好’来自多个搜索者的个人或汇总,或者您’将提供某种程度的个性化设置,或尝试提供诸如新闻结果之类的东西,而这些东西实际上可能对看到它们的人很感兴趣。

    Google隐私权中心 页面,我们’再次告知Google处理用户数据的方式旨在遵循五项隐私原则:

    1.使用信息为我们的用户提供有价值的产品和服务。
    2.开发反映出严格的隐私标准和惯例的产品。
    3.使个人信息的收集透明。
    4.给用户有意义的选择以保护他们的隐私。
    5.对我们掌握的信息负责任。

    我认为这些都是相当合理的目标,希望Google尽可能地遵循这些目标。

  5. 嗨阿拉曼,

    您’重新欢迎。搜索人员的位置以及与要搜索的信息相关联的位置绝对是此过程的一部分,但它们并不是’t the only part.

    该过程的另一个方面可能涉及一个话题可能具有多大的新闻价值,我认为这可以克服位置信息可能提供的一些过滤功能。例如,它’您不太可能希望在我的社区中看到有关一个镇议会投票的新闻,将一个农场的一部分从农村改为商业,以便他们可以在自己的财产中包括一家农场。但是,如果巴拉克·奥巴马(Barack Obama)到访我市并在一大群人面前的法院台阶上发表有关医疗保健的演讲,那将更具新闻价值,如果您搜索我的市镇,可能会向您显示新闻结果’s name.

  6. 嗨,迈克,

    我也非常喜欢观看这种演变。该专利申请中的过程肯定会对局部和超局部类型的结果产生一些影响。一世’进行了多次搜索,以查看何时在网络结果中看到新闻结果以及何时’t

  7. 谢谢你的精彩文章!即使我’在互联网上搜索互联网营销以外的东西’很高兴能够获得本地结果–如果我想去华盛顿吃晚餐,我为什么要关心北卡罗来纳州的餐馆?它’很高兴看到SEO博客认识到搜索引擎中的变化并进行了撰写!

评论被关闭。