雅虎标签建议使用善意打击垃圾邮件

分享是关怀!

善良和标签建议

标记使人们可以使用关键字为内容分配标签,以便他们可以共享所发现的内容,回想一下’我们曾经看过,然后发现其他人标记的内容。

标记也容易产生垃圾邮件,并且对标记的建议不正确。善意测度可用于提供标签建议,避免这些建议中的不良标签和垃圾邮件,并着眼于:

  • 一个人的权限标记,
  • 一个人用一个关键字标记对象的可能性可能用另一个关键字标记同一对象,而另一个关键字经常与其他关键字在该对象使用的标记中同时出现,
  • 基于其他对象使用的标签,用一个关键字标记的任何对象被另一个关键字标记的可能性。
  • 标签对对象的良品度评分,该评分使用将标签分配给该对象的所有用户的权限评分之和。

来自Yahoo的专利申请 协作标签建议的系统和方法上周发布的,提供了有关如何创建和使用这种系统的一些想法。

标记在Yahoo的三项产品中扮演着重要角色– Flickr,Del.icio.us和My Web 2.0(现为Yahoo书签)。他们开始提供协作性标记建议会感到惊讶吗?当您开始在Del.icio.us中键入标签时,可能会出现一个下拉列表,其中显示建议。为什么提供这些建议,它们如何使用户受益?

这里’s来自标签建议专利申请的摘要:

抽象

已经定义了一组通用标准以提高标签系统的功效,并且已将其应用于向用户呈现协作标签建议。协作标签建议基于对集体用户授权机构制止垃圾邮件的标签的良好程度度量。在标签选择过程中,可通过奖励惩罚算法对善良度进行迭代调整。协作标签建议还可以合并其他标签源,例如基于内容的自动生成的标签。

标记

标记允许用户为任何对象输入自由格式标签,而他们没有’不必尝试将这些对象分类为某种通用本体。标记也可以使用标签的组合。

那里 are some difficulties in using tags, though:

  1. 与物理对象不同,数字内容在语义上很少是纯净的,因此不能适合特定类别。和,
  2. 很难预测用户探索发现给定对象所经过的路径。
  3. 标签的数量趋于以过高的速度成倍增加。
  4. 传统层次结构的结构消失了。

分面分类

标记在某些方面与分面分类相似,后者使用“明确定义,互斥且详尽的方面来描述对象。”

该专利申请提供了音乐作品的示例,其可以由诸如艺术家,专辑,流派和作曲家之类的方面来识别。

由专家创建的多面系统将比在对象的自由格式标记中发现的系统更加完善。

该系统如何工作

协同过滤被用来向用户建议标签“利用用户群体的集体智慧。”

建议的标签具有以下属性:

  • 高覆盖多个方面(涵盖不同方面或方面),
  • 很高的知名度;以及
  • 省力。

如果标签被大量人用于特定对象,则新用户可能会将这些标签用于给定对象。

尽力而为有两个含义,如本文档所述:

  1. 建议的标签组合所标识的对象数量应该很少,
  2. 用于标识对象的标签数量也应尽量减少。

这样可以更轻松地再次找到标记的内容。

该专利申请深入研究了:

  • 如何进行注释,
  • 如何创建用户个人资料以了解谁在标记内容,
  • 如何使用社交网络来了解不同标记者之间的关系,
  • 标签的同时出现如何用于覆盖对象的更多方面,
  • 如何根据社交网络成员对先前应用的标签的协作评估来建议标签,
  • 如何使用自动完成功能来建议标签,

计算善意测度

善意衡量标准背后的想法是试图帮助提出以下建议:“good” tags.

以下是用于计算“善良”量度的变量(如上所述):

  1. 权威分数“a(u),”
  2. 与同一用户关联的概率函数“P.sub.s(t.sub.i | t.sub.j; o),”
  3. 与所有用户关联的概率函数“P.sub.a(t.sub.i | t.sub.j),” and;
  4. A 好ness measure “VC(t,o),其中u表示用户,o表示对象,t,t.i和t.j是标签。”

第一部分,权限分数与进行标记的人有关。一个人对大多数人的标签越一致,他们的权威得分就越高。

善意测度的其他部分在 雅虎走向语义网:协作标签建议, which I pointed to at Search Engine Land in a post which describes a 好 number of related papers and patent filings – Trustrank的社会方面.

再来一点…

网站Boxes and Arrows有时会回顾一下信息体系结构的历史。在阅读本专利申请时,让我想起了其中几篇“ Boxs and Arrows”文章:

分享是关怀!

关于4个想法“雅虎标签建议使用善意打击垃圾邮件”

  1. 我已经从seo的角度研究了社交书签或标记,尽管它可以用于将流量吸引到网站上,但我还没有看到这些流量会转化为销售量。我与几个尝试过标签合作社(各种垃圾邮件殖民地)的人进行了交谈,他们得出了相同的结论…. Whats the point!

  2. 少从捕获链接的角度考虑它,而多从捕获人员的角度考虑’s attention.

    例如,如果您是一个历史城镇的床位加早餐旅馆的所有者,则可以在Flickr中填充该镇及其附近发生的景观和活动的照片。您可以与其他商人和服务提供商一起画一张对游客来说很有吸引力的地方肖像,并以有意义的方式标记这些图像,以帮助其他人找到它们。

    Flickr不仅允许您标记图像,还可以对图像进行地理标记,以便’如果有人开始查看地图,可能会找到您的图像。 Flickr图像也合并到Yahoo中’的图片搜索’很有可能这些图片使用的注释和标签(如果“good”标签)将用于帮助确定这些图像的查询内容。

    如果您是一家专门制造特定类型机器的公司,并且为这些机器拍照,制造过程以及这些机器的操作,那么可以在Yahoo搜索中再次找到这些图像– if you take the time to put them in Flickr, and use 好 tags.

    Google,Yahoo,Microsoft和Ask都以一种或另一种方式表示,他们越来越关注用户在网络上的行为。我在许多论文和专利申请中都明确提到了批注和标记’ve seen.

    It’值得探索,并尝试以一种’ spammy –有很多机会将标签用于图像,书签和网站,因为它’这是一个新兴的领域– and it doesn’从一开始就参与其中是很痛苦的。

  3. Pingback:本周搜索引擎优化-8/3/07-TheVanBlog
  4. 提供标签选择是一回事,但是给出分数是另一回事。我喜欢标记内容的方式,’不想被评价… just my view.

评论被关闭。