官方网投引擎中内容丢失和查询困难

分享是关怀!

内容丢失会导致官方网投结果错误

那里 are times when you perform a search in a search engine, and the results just aren’t very relevant.

当你不穿’无法从Internet或Intranet官方网投引擎获得您期望的结果,是因为官方网投引擎不是’很好,还是因为没有’Web或Intranet文档存储库中有多少可索引信息包含与该官方网投相关的内容?

一项新的专利申请讨论了运行官方网投引擎的人们如何识别困难的查询,而在某些主题上官方网投引擎可能没有太多的内容。专利申请中的过程为官方网投引擎提供了向官方网投者提供查询建议的机会,他们可以在其中找到他们正在官方网投的问题的答案,或者允许引擎的索引工作来填补这些空白。

专利申请的最佳介绍可能是IBM撰写的几页,其中讨论了提出此过程的研究人员的工作:

缺少内容的专利申请:

检测可官方网投存储库中缺少的内容
由Andrei Z. Broder,David Carmel,Adam Darlow,Shai Fine,Elad Yom-Tov发明
分配给IBM
美国专利申请20070016545
2007年1月18日发布
申请日期:2005年7月14日

抽象

提供了一种用于在可官方网投存储库中检测丢失内容的方法和系统。一种系统,包括:缺少内容查询标识符(401),用于标识对没有返回或几乎没有相关内容的官方网投引擎(102)的查询;缺失内容检测器(110),其按主题聚类缺失内容查询;输出提供程序,用于提供缺少的内容主题的详细信息。

虽然此专利申请的重点是企业官方网投和IBM’通过努力提供强大的官方网投功能,它提供了一些见解,以了解如何以及为什么可以微调官方网投引擎以向官方网投者提供更多相关的结果。测试官方网投质量意味着采取开发方式来测试官方网投引擎中可官方网投信息的内容和覆盖范围。

检测缺失内容的过程涉及:

  • 识别对官方网投引擎的查询,该查询没有或几乎没有返回相关内容,
  • 按主题对缺少的内容查询进行聚类;以及
  • 提供缺少的内容主题的详细信息。

可以通过查看来自提供用户反馈的官方网投者的明确响应来确定响应查询而丢失的内容。它’在企业环境中,人们很可能会提供有关无法找到东西的反馈,但是基于Web的官方网投引擎也可以使用有关官方网投结果的用户反馈。

通过查看人们对官方网投的反应,可以找到不相关官方网投的更多隐式指示。人们会点击官方网投结果吗?他们会向下滚动这些页面并在上面花费时间吗?如果响应某些查询,人们很少点击显示或不显示的结果’如果在这些页面上花费很多时间,则这些结果可能存在问题。

第三种方法是依靠机器学习的方法,该方法侧重于对查询的满意度不高的指示。

缺少内容结论

该专利申请的作者指出了这种用于企业官方网投的方法的一些好处:

1.可以向官方网投者提供查询建议,以帮助他们找到所需的内容。

2. Intranet管理员可以识别可能不会以官方网投引擎友好的方式显示的信息。

3.文档创建者也许能够在Intranet上找到他们应该具有更多信息并可以添加的主题。

最后的好处是网页的创建者也应该注意的事情。如果某个领域或市场中的信息倾向于隐藏在用户登录名后面或出现在’如果官方网投引擎非常友好,则针对该信息的查询的官方网投结果可能并不十分具有竞争力。

在某些情况下,Web官方网投引擎可能返回的结果不是’非常相关。错误可能不是官方网投引擎造成的,而是信息缺少的内容’以官方网投引擎友好的形式在网络上发布。

分享是关怀!

关于9个想法“官方网投引擎中内容丢失和查询困难”

  1. 我认为这还将使他们深入了解可以生产哪些内容来满足该需求。但是他们可能只是忙于打扰。

  2. 在企业领域,Stever,我认为它可以提供这种见识,并且人们可以采取行动。

    在网络上,这可能是官方网投工程师的一个征兆,他们需要进行某种有针对性的爬网以查看他们是否可以’无法获得更多索引的文档,这些文档涵盖了内容缺失的那些区域。

    Search 2.0可能只是采用一些在企业官方网投的约束和范围内开发的索引编制思想,并将其添加到Web官方网投的索引编制过程中。

    例如,已经有很多专为使用Google的组织开发的OneBox官方网投’s企业官方网投。我可能更倾向于使用Google’■如果可以在OneBox结果中显示的自定义官方网投引擎中包括网站列表,则可以进行个性化官方网投。

  3. pingback的:BúsquedasdifÃcilesen los buscadores
  4. 晚上好帐单,
    这既可以在您的博客上再次测试我的IP,也可以说这是一个非常有趣的话题。关于网页开发人员如何利用可用内容中的这些漏洞的结论是我一直在阅读的方向。优缺点和非常有趣的专利申请!
    米里亚姆

  5. 您好Miriam,

    看到您的帖子顺利通过,真是太好了。

    我们可能会在网络上找到尽可能多的信息,但官方网投引擎已为哪些索引或可索引的内容存在差距。在那些信息往往在书本中或在数据库登录后而不是在官方网投引擎友好页面上的地方,它会’我们不太可能在与这些差距有关的官方网投查询中看到相关结果。从从事官方网投引擎工作的人员的角度来看,这有点有趣。

  6. Pingback:第14殖民地侦察员»博客存档»在Google索引中发现漏洞
  7. 我今天在官方网投引擎上输入了一个请求,它给了我一个结果,明天再检查一次’再也没有了。你怎么能把它找回来。

  8. 嗨,吉伦斯,

    有很多原因导致今天出现在官方网投结果中的页面明天可能不存在,或者排名可能比以前低。

    这里有几个:

    1)列出的页面可能已经过某些更改:

    a)它的所有者可能使用robots.txt或meta noindex标记阻止了它的官方网投结果(有时甚至偶然发生)
    b)该页面可能已从网站上删除
    c)页面的所有者可能已更改网站上页面彼此链接的方式,并且其排名可能不如以前
    d)页面上的内容可能已更改,并且可能与您使用的查询词不再相关
    e)从站点内部或站点外部到页面的链接中的锚文本可能已更改,并且这些链接中的文本使以前与官方网投查询相关的内容有所帮助。
    f)页面可能丢失了指向该页面的某些链接(从网站内部和/或从网站外部),并且该页面的排名得分可能不高。
    g)该页面可能已经基于许多因素而在某种程度上提高了官方网投排名,例如新鲜度,该查询词的顶部结果中其他页面到该页面的链接数或其他,不再针对该查询进行提升。
    h)该网站可能正在违反官方网投引擎准则进行某些操作,并且该页面可能已经在官方网投结果中受到了惩罚。

    2.其他页面可能已经以某种方式更改:

    a)其他页面和站点可能已经针对查询进行了优化,并且在页面上方的官方网投结果中排名上升。
    b)可能已将新页面添加到Web中与官方网投查询相关的页面
    c)出于某种原因(例如新鲜度),该页面上方的官方网投结果中的新页面可能有所增加。

    3.官方网投引擎可能已更改其网页排名方式或已应用过滤器

    a)官方网投引擎显示来自不同数据中心的结果(可能使用的排名算法略有不同),当您通常会看到来自不同数据中心的结果时,官方网投引擎有时会向您显示结果–因此您可能会根据数据中心看到不同的结果’re viewing.
    b)官方网投引擎定期更新和更改其使用的算法–有时会以细微的微妙方式出现,有时可能会改变很多排名。
    c)官方网投引擎有时会进行更改以过滤掉网络垃圾邮件,这有时可能会影响到’t web spam.
    d)官方网投引擎有时可能会过滤掉看起来与同一站点或其他站点上的其他页面非常相似的页面,有时在某些情况下,它们会过滤掉原始页面并保留重复页面。
    e)官方网投引擎可能存在硬件/软件问题,导致一个页面或多个页面意外地从其数据库中删除。

    Google的网页上列出了网站站长失去排名或可能已从Google删除后可以采取的一系列步骤’s index. It’值得一看的是,您可能已经发生过类似的事情:

    我的网站不是’在官方网投中表现不佳

评论被关闭。