社区标记和地标图像排名

分享是关怀!

除了通过使用爬网程序在Internet上对内容进行索引来收集有关Web的大量信息之外,搜索引擎还可以通过观察我们在搜索时选择的内容来了解​​有关Web上的页面,图像和视频以及其他对象的大量信息了解我们如何通过其工具栏浏览网页,以及注意在对图像和页面进行注释和标记时可能选择的单词。

作为文本,链接和图片的发布者,作为网页的用户,以及在留下评论,标签和注释时作为页面的交互式参与者,我们为搜索引擎提供了有关我们的兴趣以及我们可能对在Web上看到的内容的信息。

当这些搜索引擎从我们喜欢访问的页面以及我们可能会发布的图像和文本中了解我们和我们的兴趣时,他们可以与其他旅行者和网络上的发布者比较我们看到的内容和我们在网上所做的事情,并且可能会将我们视为具有共同利益并可以向他们学习的社区。

搜索引擎注意页面发布者指向其他页面的链接,这些链接中的单词有助于定义可能涉及的页面。

搜索引擎的大量专利申请和白皮书还描述了搜索引擎如何查找有关人们搜索方式及其使用的查询字词,他们可能访问并花费时间的页面甚至搜索者的数据’过去的搜索,浏览和添加书签活动,以确定响应在搜索框中输入的查询向那些搜索者显示哪些页面。

It’看到一些特定示例说明搜索引擎可能如何使用用户信息来提供搜索排名很有趣。

在Flickr上对地标图像排名

我最近写了一篇Microsoft专利,其中讨论了从网页拍摄的图像可能在搜索特定关键字的图像排名中的某些方式。 图像如何在图像搜索中排名?

尽管该专利申请的作者描述了一些非常有趣的方法来确定图像的含义以及如何对其进行排名,但它们是在Web页面上的图片的背景下进行的。

想象一下,试着去了解Flickr之类的地方的图像,那里为这些图片捕获了大量元数据–标题,说明,发布和查看图像的人的标签,甚至是自动生成的标签,这些标签可能会提供信息,例如拍摄照片的位置。

雅虎研究人员的最新论文, 生成地标的各种代表图像搜索结果,探讨了一些有趣的方法来对地标图像进行排名和提供,这些方法涉及使用社区输入和图像的视觉分析。作者首先提出了以下问题:

我们是否可以利用社区在网络上提供的富媒体资源来自动生成具有代表性的世界观’s landmarks?

这项工作令人兴奋的是,像本文中描述的过程在标准的基于Web的图像搜索引擎中可能非常有用,作者在论文的结论中指出。

涉及地标图像的两个阶段

为了使这样的系统在如此大的图像主体上正常工作,它需要能够以自动化方式工作。

由于这项工作着眼于特定位置的地标,因此仅使用具有与之相关联的位置的图像。 Flickr上有超过40,000,000个公开地理标记图像。有些使用位置感知的照相电话和GPS集成摄像头自动标记了位置,而另一些使用上传位置的人员标记了位置。

第一阶段涉及查看与图像关联的标签和位置元数据,以将代表地标或地理特征的图片聚类在一起。

第二阶段涉及对与发现的地标关联的图像进行视觉分析,以便可以为每个地标提取具有代表性的图像集。

通过在开始时通过标签对图像进行聚类,比较图像以了解它们在第二阶段中可能有多相似的过程所需的工作就少得多,因为然后只比较来自相同地标或地理区域的图像。

视觉上相似的照片聚类

在将来自社区成员的标签所标识的地标的照片聚在一起的过程中,遵循一些规则,社区成员将这些照片拍摄并上传到Flickr。作者告诉我们,以下假设是这些规则的核心:

(1)一个群集中将包含许多不同用户拍摄的照片,这表明人们对照片中显示的主题有广泛的兴趣,

(2)图像中会有一定的视觉凝聚力–换句话说,人们在有趣的地方发现了与场景相同的事物,拍摄了相同的物体或拍摄了相同类型的照片,并且;

(3)该组照片在时间上相对均匀地分布–表明对地标本身感兴趣,而不是对地标发生的特定事件’s location.

具有里程碑意义的图像结论

标记中的社区输入以及经过地理标记的位置是此过程的重要第一部分,有助于识别地标。

有关社区的信息以及他们拍摄的照片在群集图像方面也起了重要作用–随着时间的流逝,从相似的角度拍照的人数。

该论文的确涵盖了图像排名的其他一些技术方面,但是我认为本文的主要收获之一是,有关个人和社区的信息如何成为识别地标和寻找代表重要且多样化观点的图像的关键因素。那些地标。

It’考虑用户数据可能在网络上对其他事物进行排名的某些方式,例如视频,企业搜索中的企业以及网络搜索中的网页,可能会很有趣。社区的作用会越来越大吗?

分享是关怀!

5个想法“社区标记和地标图像排名”

  1. Perhaps this should be named Tagging 周 since it has been a priority for me this 周. It seems to me that tagging is clearly a way human judgement can improve search engine results. Hopefully Sir Tim Berners-Lee who got a major grant for ‘source tagging’ this 周 can help in this process.

  2. 谢谢巴里,

    蒂姆·伯纳斯·李爵士信任的好消息’的网络科学研究计划和媒体标准信托基金。

    最近还有许多其他有关标记的文章,以及如何以及如何在Web上使用它们,我将在不久的将来进行写作,因此您可能希望扩展它“week”到更长的时间。好像这样’s是当今搜索中最热门的主题之一。

    希望我能尽快将它们淘汰,它们对您和您的生活都有帮助’重新调查。 ðŸ™,

  3. Pingback:面孔和地标:迈向智慧图像搜索的两个步骤· SEMClubHouse
  4. 新颖性现在应该已经不复存在了,但是我仍然认为标记的东西是一个了不起的发明,即使只是用于标记Facebook等网络站点上的照片中的人物。

    It’有趣的是,可以看到可以使用标记的所有方式。

  5. 嗨,拉维,

    标记似乎是与照片和Web交互的一种非常流行的方式。我不’t think we’很快就不会再让人们在Flickr之类的地方或在Delicious之类的网站上加标签了。其中包括来自提交和查看人员的标签,以及机器生成的标签,例如描述使用什么相机拍摄照片或在哪里拍摄图像的标签。

评论被关闭。