微软在社交网络中排名作家

分享是关怀!

Author Ranking in social media is more than just a popularity contest, and can include things like how frequently an author surfaces content that subsequently becomes popular, topical 权威 on different subjects, and popularity and influence 信号s.

区分噪声信号的作者权限?

社交媒体包含很多 信号,还有很多可能被认为是 噪声。在诸如tweet和状态更新以及博客文章之类的实时交流的社交流中,信息在许多不同的主题上都是无价的。

搜索引擎如何挑选出哪些作者是不同主题的实际权威,以及哪些是共享,重发和添加到权威内容中?如何判断哪些作者背负了此类内容,哪些作者实际上不是任何给定主题的权威?

有些作者甚至不是真实的人,而是作为垃圾邮件和/或聚合者帐户存在的,对社交网络的其他成员几乎没有增加任何价值。

Microsoft的一项专利申请告诉我们,社交流中的价值取决于找到 最权威的用户 在给定主题上。

识别社会权威

So what exactly is social 权威, and how is it developed, identified, and measured? How does someone establish themselves as an expert in a given field?

社交参与信号可用于基于社交图指标(例如, 追随者人数用户的次数’的内容已共享,但这些信号可能容易发垃圾邮件,或被Lady Gaga或Justin Bieber等名人所主导。

Microsoft的专利文件描述了一种在社交媒体系统中确定作者排名的方法,该方法采用各种统计方法来应用使用率指标以及社交和主题图特征,例如:

  • A 链接共享的时间分析 where 权威 is based on a user’倾向于尽早链接到流行的网页
  • A topical 权威 根据作者’特定主题区域中的链接和内容更新
  • A 受欢迎程度和影响力测度 基于作者的属性,例如:
    • 关注人数
    • 重新发送的帖子(例如微博)的数量
    • 提及作者的提及次数
    • 作者拥有的在线朋友数量

    正在申请的专利是:

    社交媒体系统排名作家
    由Peter Richard Bailey,Chad Carson,Scott Joseph Counts,Nikhil Bharat Dandekar,Ho John Lee,Shubha Umesh Nabar,Aditya Pal,Michael Ching,Paul Alexander Dow,Shuang Guo和Seo Hyun-Ju发明。
    分配给Microsoft
    美国专利申请20120117059
    2012年5月10日发布
    申请日期:2010年11月9日

    抽象

    本文所述的作者排名技术是一种使用各种统计方法利用社交媒体系统中的作者来对这些维度进行排名的技术。
    More particularly, the technique ranks authors in social media systems through a combination of statistical techniques that leverage usage metrics, and social and topical graph characteristics. In various exemplary embodiments, the technique can rank author 权威 通过 the following:

    • 1) 链接共享的时间分析 in which 权威 is computed based on a user’倾向于提供到早期流行的网页的链接;
    • 2) topical 权威 based on the author’在特定主题领域的链接和内容更新;和
    • 3)基于作者的节点属性的受欢迎程度和影响力。

    每个人都是权威,没有人吗?

    在社交媒体环境中,我们既是内容的生产者,也是其消费者。我们可以向特定的个人,与我们有联系的人甚至是每个人发送自己的思想和想法,对话的开始和答复,提及和问题。我们可以重新共享他人原样发送或以某种方式发送的内容。

    由于有许多人参与社交媒体,因此在许多主题上通常存在很大的差异。有兴趣在一组社交搜索结果中重新共享其中一些内容的搜索引擎如何决定显示什么和省略什么?如何找到真正有趣的权威权威?

    识别 真正的权威 由于存在高度可见的过于笼统的权威机构(可能有许多追随者,例如流行的主流消息来源),因此可能会很棘手。这些可能是权威的,但可能不是原始主题或专家主题的来源。

    该专利申请告诉我们,最终用户可能正在寻找一种混合方案,其中包括这些较大的组织以及鲜为人知的作者,这些作者可能是第一个撰写特定主题或具有某些特殊见识或分析的作者。

    那些鲜为人知的作者可能具有很高的权威性,但可能并不广为人知,并且追随者人数可能不高,甚至可能没有针对某个特定主题撰写过多的内容。

    我们还告诉我们,针对用户社交图谱的类似于PageRank算法的算法可能对名人更敏感,并且不足以找到真正的权威。

    PageRank只是在涉及对突发性主题的新近敏感查询的查询中也没有用,这些突发性主题出现得太快而无法建立链接或引文,而这需要花费一些时间来获取。

    分享早期链接的倾向

    Instead, one 信号 of 权威 can be based on a propensity to provide early links to Web sites or Web content that becomes popular with other users.

    Authors who display such a propensity can be identified and ordered in a rank list, which could be used to rank or re-rank search results to take into account author 权威 or for filtering search results to exclude spammers.

    局部权威

    这是搜索引擎如何确定主题权限的方法。

    它可以通过搜索包含与给定主题关联的关键字的微博或博客帖子上的一组社交媒体更新开始,例如与输入到搜索引擎中的查询关联的关键字,并且可以将该主题扩展为包括相关主题。

    可以从响应于查询返回的数据和任何相关的作者/用户数据执行原始特征提取。可以检查有关作者和查询产生的已发布数据的许多功能,包括:

    • 主题帖子的原始计数
    • 一位作者被其他作者引用的频率
    • 作者多久引用一次自己
    • 回复作者的次数
    • 系统中撰写的帖子总数
    • 他们被其他用户提及的频率
    • 作者共享的链接数
    • 他们使用显式表示的关键字(例如,哈希标签)的频率
    • 相似度索引,计算作者的相似度’最近的内容是以前的内容
    • 作者的时间戳’关于该主题的第一篇文章
    • 他们关于该主题的最新帖子的时间戳
    • 也在此主题上发帖的朋友/追随者的数量
    • 作者数’在主题作者之前发布主题的社交媒体朋友/关注者
    • 作者数’的社交媒体朋友/关注者,在有问题的作者发布有关主题的信息后发表了该主题。
    • 也可以使用其他信号。

    The number of users to be considered an 权威 on a specific topic would be pruned if they fall below a certain threshold on these topical 信号s.

    然后将剩余的用户分为两组–权威和非权威,再次基于这些信号。

    届时,将根据他们对要素的评分对权威群体中的作者进行排名。

    用户指标信号

    尽管该专利申请中的描述集中在Twitter和tweet上,但它清楚地表明,这样的系统可以应用于其他形式的社交媒体,包括状态更新和博客文章。

    我们展示了如何在Twitter上识别,分类和浏览用户指标,但是我们必须记住,相似的指标可能用于Facebook甚至其他站点上的博客文章和评论。

    至于推文,它们可以分为三类:

    –原始推文–独立存在
    –对话推文–直接指向另一个用户(例如,如在文本之前使用@username令牌或通过关联的元数据所示)。
    –重复的推文被某人复制或转发到社交网络中,通常以“RT @username”.

    也可以计算关于另一个用户的提及的度量,但独立于对话性推文或转发推文中的那些提及。

    还可能会审查主题标签关键字(以#符号开头)的使用。

    自我相似度得分用于衡量用户从其先前帖子(主题和主题外)中获取的单词数量。停用词列表可用于首先消除非常常见的词。

    Those tweets might be ordered 通过 timestamp and examined to see how similar they are, with a couple of interesting assumptions. One is that someone using many of the same words from their previous posts might be engaged in spam behavior. In the opposite direction, some using the same words much less frequently might be 发布 on a much wider set of topics, or may have a very large vocabulary.

    其他信号可能涉及:

    –一种主题信号,用于估计作者在特定主题中的投入量。

    –独创性信号,用于查看作者是否倾向于发起有关特定主题的对话,以及他或她多久参与该主题的对话并出于礼貌回覆他人。这些反应有助于找到倾向于社交的真实人。

    –一个人的帖子被其他人反感的频率,因为某些“过于热心”的用户倾向于频繁转发。

    –是否提及他人是基于优点–与他人的实际对话和互动。

    专利申请提供了许多其他信号,以及使用这些信号的几种不同方式,以基于它们得出的关于不同主题的分数。

    外卖

    I’我写过关于雅虎如何 可以对用户生成的内容进行排名 以及Google也可能 排名社交互动 也依赖于用户生成内容的网站上。

    如果我们将每种搜索引擎的三种方法略有不同,我认为我们可以有效地了解搜索引擎在尝试对社交环境中创建的内容进行排名时可能遇到的一些问题。内容是由用户创建的,并且搜索引擎有兴趣对该内容建立索引。

    搜索引擎如何显示特定主题上最有用和最有趣的内容?他们如何从共享内容中过滤掉原始内容?

    How do they identify fake profiles and 布袋木偶s? How do they identify the best sources on different topics?

    无论是在论坛还是Q的背景下,这三者都着眼于对社会系统的原始贡献的质量&网站或微博平台。所有人都着眼于那些系统成员之间的交互,以及这些交互的意义。

    这三个专利申请是’t the final say from each of the search engines on how they may rank content from social sources, and include that content within social search results. But I think taken together they provide some useful guidelines on how someone might be perceived as an 权威 on different topics.

    分享是关怀!

    关于24的想法“微软在社交网络中排名作家”

    1. Pingback:微软在社交网络中排名作家Inbound.org
    2. 很棒的帖子。我认为我们不应忘记个性化及其对社会权威的影响。我可能是社区中某个特定主题的影响者,但可能不是我的生态系统之外的所有人。因此,我认为社会权威因社会而异,除非在具有相当影响力的非常大的生态系统中参与其中,否则不应将其与某个主题的全球权威相混淆。因此,例如,如果您与我联系而不是与Avinash联系,则您可能会在个性化搜索结果的顶部看到我的帖子,因为我可能是您生态系统中分析的最高权威。但是,如果您也与Avinash保持联系,那么Avinash会优先于我,并声称是最高的社会权威地位,而搜索引擎会建议他的帖子。

    3. pingback:新兵将提高社交媒体权威排名吗? | WebPro新闻
    4. Pingback:苏格兰SEO» 博客 Archive » Are 您 An Authority?
    5. 确定“authority”由评论者或张贴者决定链接质量是一个好主意。我只是看过我的利基网站的链接配置文件,该网站创建了虚假的配置文件和虚假名称,以在EDU和其他关注博客上发布垃圾评论,以便对其关键字进行排名。您’d认为,到现在为止,谷歌已经找到了解决这种胡说八道的解决方案,但是这种策略肯定行得通,因为他们正在推广的网站在其关注的关键字上排名第一。

      It is time to devalue links posted 通过 posters of junk and give credence to 权威 posters instead.

    6. 感谢您所提供的所有信息。保持这方面的工作量很大,但我感谢您的方式’ve broken this down. On one hand it has given me a lot of information, but on the other hand it just reconfirms how much I really need to improve at being recognized as an 权威.

    7. It’这是一件非常复杂的事情。还有一些’对于那些希望为自己的利益潜在地操纵结果的人们而言,如此吸引人。凭借庞大的数量和速度,在线信息被抽出,您如何迅速确定’相关性和合法性,又不偏towards名人简介或网站?

      很棒的博客…我今天偶然发现了它并订阅了。保持良好的工作。

    8. 嗨,Himanshu。

      我认为我们最终可能会看到社交信号已用于登录社交搜索和注销搜索中的排名。我们 ’我们可能会先在Google和Bing中看到社交/个性化结果,然后才能在注销的网络搜索结果集中看到此类信号的影响。

      对于那些登录的结果,社交联系的影响很可能会以您描述的方式显示。一世’我只是不确定我们应该给他们打电话“personalized”结果。 Google或Microsoft是否将他们的社交结果视为个性化的一部分?一世’我不确定他们会这么做。

      将基于社交的结果限制在与我们建立联系的人身上是’必须与根据我们先前的浏览和搜索历史向我们显示结果相同。我认为登录搜索结果时,两者都会受到影响。

    9. 嗨,约书亚,

      我怀疑我们’re going to see the separate development of social 信号s and link based 信号s for a while, with Google and Bing possibly trying to find other ways to diminish the value of links from junk comments. 我不’认为与特定社交帐户相关联的评论将替换不存在的链接’但是,他们可能永远不会。但是它们可能是附加的价值层,可能会影响排名。

    10. 大卫,您好

      谢谢。几年前,’t much emphasis on things like reputation scores and 权威 信号s for authors in SEO, and I’我还不确定人们对这些类型的事情有多大的重视。但它’s pretty clear that’是Google和Bing都采取的指导之一。

    11. 嗨,谢恩,

      谢谢。

      避免对名人和知名网站产生偏见的一种方法是,一定要着眼于过去的简单社交参与措施(如关注者数量),并实际查看其他信号,例如某人是否有提供与特定链接的倾向。在很多其他人都喜欢Microsoft专利申请所建议的内容之前,请先浏览一下该页面’就像某些Google专利文件所建议的那样,对社交网络及其与他人互动的贡献。

    12. 无疑,尽早共享链接的倾向(朝着将随后开始接收链接的内容)是区分有影响力的作者的一种有趣方式,特别是在内容本身确实很新鲜的情况下。

    13. 嗨Eliseo,

      为共享早期链接的作者提高声誉是一个非常有趣的想法。一世’我不太确定我会说这个人很有影响力,因为他或她的分享可能不一定会影响其他人的选择。但是,识别和共享变得流行的内容的能力标志着一个人对特定主题非常谨慎,并且正在展示有关该主题的知识。

    14. 我喜欢阅读这篇文章。一世’ve seen some spammy services pop up that try and replicate the 信号s of 权威 but if you dig, and not so deep, you can tell. I’m sure it doesn’搜索引擎也需要花很多时间才能弄清楚这一点。

    15. 嗨,斯图尔特,

      谢谢。有趣的是,看到Google和Bing都提出了一些想法,试图理解权威作者可能会在他们加入社交网络时发布的主题之内。

      有一些服务可以尝试为参加社交网络的人们炫耀社交分数,’做搜索引擎可能做的同样的事情,因为他们只是不做’可以访问有关搜索引擎进行的那些活动的附带数据。

    16. 正如约书亚指出的那样,许多公司和代理机构仍在使用这种假冒的假人战术进行促销。在某些时候,我相信’s effectiveness will diminish or become unsustainable due to the sheer amount of 维护所需的工作some form of credibility for “sock puppet” lol , accounts.

      因此,我’ve决定只用我的真实姓名为自己做品牌。
      除了每天与代理商合作外,我还经营着4家电子商务商店,一家电子商务咨询服务和一个小众博客。我可以’想像不到要维持6或7种不同“personas”在几个社交媒体网站上。

      我冒着一些帖子偏离主题甚至是商业性质的风险,但是我认为,随着时间的推移,我对重要社交网络属性的一个活跃个人资料会改善AuthorRank,而跨多个角色的内容则比较稀疏。

      我不’看不到其他方法可以做到这一点。

    17. 杰夫,你好

      谢谢。搜索引擎为假冒的角色和袜子木偶提供价值的时代越来越有限。随着诸如Google之类的努力,代理机构或个人使角色看起来足够真实,以使搜索引擎可以信任它的工作量正在减少’的作者项目不断增长。那’这可能是Google和Bing希望添加以下内容的原因之一“authorship”和搜索排名的声誉。

      我不’t think there’s too much harm in “posting”离题的推文或状态更新等。看起来搜索引擎可能会针对不同主题的个人提高声誉得分,因此您可能被认为是电子商务方面的专家,并且在摄影或园艺或其他一些话题上您可能会写一些博客或Google知识。加上帖子。实际上,与真实和已知角色略有差异可能会更好。

    18. 比尔·斯劳斯基感谢您的出色帖子和对特定指标的见解。杰夫·布朗森(Jeff Bronson),我同意你的观点,“维护所需的工作…“袜子木偶”的信誉”太好了。我自己尝试进行此操作,因此我的信息可以高度针对特定受众,但也同意,如果您将社交互动整合到个人品牌中,那么AuthorRank会更好–特别适合那些非常活跃的人。

    19. 有趣的话题比尔。这让我想起了Klout分数,该分数试图对个人的在线影响力进行排名。它’让人想起一个人的日子’的功率排名@ digg表示某些含义。就像其他人所说的那样,搜索引擎需要深入了解所有袜子bottom / SEO生成的垃圾内容在网络上的解决方案。您不能仅依靠链接,因为这些链接可以由机器生成。

    20. 嗨,凯利,

      您’重新欢迎。要建立可能实际上会产生影响的声誉或作者等级,尤其是对于很多人正在谈论的主题(或可能具有一定商业价值)的声誉或作者级别,我希望它将花费很多工作,社会活动和有意义的互动。

    21. 嗨,jjray7,

      谢谢。

      作者的社交评分肯定会依赖超出您的关注者或圈子中可能有的其他人,推文或状态更新数量之外的事物。有信号表明搜索引擎正在考虑以袜子木偶可能很难匹配的方式来衡量事物。

    22. 谢谢比尔。您如何量化或衡量影响特定主题所必需的社交活动?是否有任何案例研究可以作为示例?我发现该主题实际上是搜索引擎的一个复杂指标,但是它可以为那些搜索提供一些有价值的结果。

    23. 嗨比尔–在寻找答案的同时找到了您的博客“搜索引擎如何处理教资会 ”。很棒的东西。在我看来,UGC已成为网络的心脏,搜索引擎将需要开发此处描述的方法,以进行深入研究并将其分解为搜索结果。 SEO行业可能即将迎来自己的阿拉伯之春,我认为大多数企业和组织都开始意识到劣质链接和虚假评论将受到惩罚,这对于使用实时数据源的网站如何选择发布内容也具有重要意义。

    评论被关闭。