网页排名的重要性分数的扩展?

分享是关怀!

法官审理提交法院的证据时,会权衡许多因素。其中之一是所提供的证据是否与当前案件有关。

另一个是证据可能有多重要。

现在,证据本身并不能’不一定要具有重要意义,但例如,与40岁的被告在其三年级老师的刑事诉讼中的性格有关的证词可能有些相关,但可能并不那么重要。

搜索引擎中的重要性分数

当搜索引擎对一组搜索结果的页面进行排名时,它通常还会查看两种不同且截然不同的计算类型,将它们组合在一起以将页面提供给搜索者。这些分数同样着重于 相关的 结果可能是输入的查询以及如何 重要那 page or picture or video might be.

微软最近的一项专利申请探讨了“importance” is determined, and comes up with a variation that differs somewhat from what we might usually think of in an 重要性 score.

One 重要性 score that most people might be familiar with is PageRank and is sometimes referred to as a “static”排名,因为它没有’t在查询之间进行更改。

扩大重要性排名因素

如果执行搜索时,我们可以选择在最重要的搜索中进行搜索,它将更快,更容易吗?“sports” pages, or “news” pages or “recipe”搜索结果的页面?我们会得到更多相关的结果吗?

Microsoft专利申请是开始研究此主题的一个地方:

提供和使用搜索索引,可以基于文档的目标内容进行搜索 (申请号20070203891)
由John A.Solaro和Keith D.Senzel发明
分配给Microsoft
2007年8月30日发布
提交日期:2006年2月28日

该专利的作者提出了一些好的观点。例如:

正在开发许多新的搜索引擎以及现有搜索引擎的新功能,这些功能集中于一种特定的“vertical”主题域,以提供购物搜索,博客搜索,研究搜索等。

However, the 静态的 rank of the documents in the index only takes into account generic PageRank attributes, not attributes related to a specific 垂直 that targets specific subject matter.

那里fore, the 静态的 rank is not useful for filtering the index for particular attributes of the 垂直 in question, which critically limits the effectiveness and utility of these 垂直 search engines for users.

While using something like PageRank might be an easy method to determine the 重要性 of a page, it may not be the best when comparing things like shopping sites and educational sites.

不同的排名因素

Microsoft专利申请没有’我们将详细讨论如何将一个主题中的文档与另一个主题中的文档进行排名,尽管“claims”该文档的部分确实提到了计算“readability score”用于文件。我们可能会看另一个搜索引擎的示例,以了解如何做到这一点。

那不是’太久以前,Google的专利文件显示 Google如何对博客进行排名 基于“quality” score, which would be an 重要性 score rather than a relevance score.

So, if a search engine was to go through different websites, and determine 主题 or categories for them, and then come up with different kinds of “quality” or “importance” scores for those different types of 主题 , would we see more 相关的 results in our searches? It’s possible.

混合使用不同排名算法发现的结果

我可以’t help but think of universal and blended search results being served 通过 the search engines these days, when reading this patent application, where different types of results, based upon different types of 重要性 factors are being blended into search results.

当搜索引擎将视频,图像或新闻混合到结果集中时,如何确定最重要的视频或图像?及时的新闻结果是’t ranked in 重要性 based upon the number of links to it – it wouldn’如果是的话,要及时。

重要因素结论

How might a search engine decide whether one type of shopping site was more 重要 than another? Or 体育 sites? Or 新闻 sites? Definitely something to think about.

分享是关怀!

关于11条想法“网页排名的重要性分数的扩展?”

  1. Well that was interesting. So once again, establishing the context or relevance of a document, this time to a given theme (news, 体育, shopping – etc) is the gig?

    ‘其中目标内容指示描述了文档与特定搜索主题的相关性‘

    我想定义‘topics’从基础架构的角度来看,这很重要,因为它可能会在匆忙中陷入困境‘rules creating rules’系统类型。最终会不会为‘sub-topics’? –例如运动棒球?如果这进行得太远,则将是要管理的排名/重新排名系统上的一个艰难层。价值(较小的排名机制?)是否会超过其开销? (结束手段)

    ..当他们谈论‘static pagerank’它们是否暗示根据渠道(主题)针对同一文档进行的各种网页排名?

    反正我’以后再读一遍… tnx.. 戴夫.

  2. 哦耶… I noticed the ‘Law’这个星期正在上岗…来自过去方法的幽灵:0)

    ya

  3. 我注意到â,¬œœLaw•进入本周的帖子中–过去方法的幽灵:0)

    It’很难放弃这种法律培训,而且奇怪的是似乎很合适,尽管我现在在写了博客文章后了解更多,为什么。

    我在法院工作了几年,并在此过程中学习了电子商务和网络推广,相关性和实质性概念对于法律体系至关重要,信息获取,发现事实,确定法律适用的范围也是如此。一个案例,依此类推。

    So when it comes to a concept like breaking down a body of information, like the web, into specialized 主题 , and having 重要性 within those 主题 use the appropriate metrics, I have some experience with understanding how that might fit well into retrieving information within the context (or topic) of the legal field. My searches for legal information don’t非常重视像PageRank这样的算法。

    I would guess that breaking 主题 down into subtopics and then even smaller subsubtopics might make sense if it could be done in some automated manner, especially for areas that receive a lot of searches. Looking at what people are querying might help with that.

    “Static”表示应用某种独立于查询的排名,其中包括PageRank或HITS,或可以在任何人甚至执行搜索之前完成的其他方法。

    Applying a 静态的 rank that enabled documents to be broken down into 主题 could make sense, and could possibly be applied to tagging (automated tagging –涉及多个主题的文件)。

    How much each document fit into a topic could be weighted, and the patent describes assigning positive, neutral, and negative weights to documents for different 主题 .

    Bill,我会同意这一点,但是奇怪的是,我看到它在Live中得到了更多的应用。我倾向于更具影响力的主题…

    谢谢– that’这是一个有趣的观察。一世’我将不得不更加关注live.com上的搜索结果。

    And that reminds me, can you put a 60 second delay on his posts so 我可以 beat him out.

    唐’不知道今天是否会有帮助。他已经三个小时了。 ðŸ™,

  4. “我忍不住想起了如今搜索引擎正在提供的通用和混合搜索结果”

    Bill,我会同意这一点,但是奇怪的是,我看到它在Live中得到了更多的应用。我倾向于具有更大影响力的主题,实际上,在来到这里之前,我向戴夫拍摄了一些有关观察的信息。这使我想起,您是否可以将他的职位延迟60秒,以便我击败他。

  5. 嗨,比尔,

    你知道,我喜欢这些东西。不过,对我来说,模糊的是,引擎以难以对蜘蛛有意义的方式拟人化的方式来应用法律数据…在这里忍受我。只需一秒钟ðŸ™,

    A ‘reasonable man’ would be able to assess the relative 重要性 of the variables to determine which weighed the most heavily in favor of a page being 相关的. The algorithms are still struggling with that. No worries there, it’s a growth process.

    当他们最终弄清楚如何最好地展示其结果以利于他们的思维定势时,‘reasonable man’s’搜索查询意图,我们可能会看到一些实际进展。

    为此,‘static’有一些意义,但只是更大整体的一部分。‘Themes’同样取决于搜索查询的意图,如‘Tiger’ ‘Woods’过去的例子。

    算法越接近‘reasonable assertion’用户将获得更好的收益,但是随着对核心人工知识的了解,不可避免的大量垃圾邮件/操纵行为将成为真正的威胁。

    质量得分不错,但又受到算法参数的限制。我认为他们都做得很好。我非常渴望看到更多有关Ask的信息。

    从长远来看’这不是了解人的想法并将其以积极的方式应用到算法上的情况,它只是回到一个古老的问题上,即系统变得越复杂和完整,就越需要保护。它’在工程师开始之前几乎要进行逆向工程。

    我也对将视频和图像融合到Google算法的结果中感兴趣。听起来不错,在许多情况下可能非常适用,但在某些情况下’在没有年龄限制的情况下,仅列出一个问题。他们不是’它总是看起来总是显而易见的。

    相关性和存在‘material’在算法中都是固有的,但是由于程序的性质,即使它们是短暂的,也使它们也固有地容易受到攻击,并且每次短暂的攻击都将其作为新攻击‘loop-holes’ are found.

    解决方案?我没有’t一。引擎在以自己的方式奋斗中表现出色,以尽其所能并推广他们认为最好的东西。我个人不’认为我们仍然没有理由或希望将适用于人类的法律后果强加于蜘蛛上(不是您在暗示)-’s not like we’重新计划将GoogleBot放置在监狱中,以防止其在吹风机下掉落,但您却不知所措。 ðŸ™,

    (yes that is a Florida 法 – or was….)

    更多信息,请!我非常喜欢您对专利的观点,因为我很少有机会亲自审查这些专利,我非常感谢您的见解和您对专利的看法。您比我以前所希望的要聪明得多,因此,谢谢Slawski先生。

  6. 谢谢,f-lops-y。好点子,我认为您低估了自己。

    您对算法和攻击的观点是非常好的。您’ve可能已经看到了,但是如果您没有’t,您可能会喜欢:

    PageRank的攻击成本(pdf)

    权衡证据确实需要搜索引擎可能难以达到的一些标准,我认为您’re right that it’大概不是一个人的想法。

    唐’不用担心更多专利分析…

  7. 你好,

    讨论确实使我对网络仍需发展到何种程度表示赞赏。

    I think, as 垂直 neighborhoods become densely overcrowded, rankings will be assigned 通过 either mob rule or will be personalized somehow. I’m afraid that ‘popular’可能会成为可信赖的代名词。

    你认为微软’对行为数据的涉猎可以扩展为根据人来计算个性化排名’的人格类型?我的意思是,将有条不紊的人格类型引导到一种网站上,和ami可亲’s to another?

  8. 流行是一条有趣的路径,并且在某种程度上正在使用。

    For example, more 流行 queries are cached at the search engines rather than being performed over and over.

    来自搜索会话的用户数据正在诸如拼写纠正之类的地方使用。

    “Trustworthy”是稍微不同的事情。也许在使用社交网络以及您在社交网络中其他人之间指示的关系时,可信任性的要素可能会发挥作用。

    我希望人格类型不会’输入搜索引擎向人们展示的内容。但是,我可以看到观看习惯如何成为提供搜索结果的方式。

  9. pingback的:SiteMost’的每周博客回顾,布里斯班SEO博客2/10/07
  10. Pingback:本周搜索引擎优化-9/28/07 |范博客

评论被关闭。