Xerox帮助Google填补一些搜索空白:从Web到Post 熊猫

分享是关怀!

如果Google于90年代初推出,那么它可能具有可以用于搜索万维网之前的当今某些电子数据库的技术,例如 Lexis 要么 对话。它将开发出以有用的方式可视化来自这些系统的结果以及自定义用户界面的方法。它可能已经开发了一个进度条,向您显示搜索正在进行中,并且系统没有’t失败,返回时间超过了毫秒。

如果Google是在WWW在浏览器地址栏中的名称前出现位置之前开始的,那么它可能已经开发出与它非常相似的技术’目前正在工作中,但是在阅读Xerox等公司的许多基于Web的专利时可以感觉到略有不同。

根据美国专利局上周于2012年2月16日记录的转让,谷歌从施乐公司获得了94项授权(90)和待决(4)专利。该转让的执行日期为2011年11月10日。 USPTO分配数据库没有’包括有关交易细节的任何信息,例如财务条款。

我上一篇将Google和Xerox链接在一起的帖子的标题为 施乐对谷歌,雅虎和YouTube提起专利侵权诉讼。在美国特拉华州地方法院的该案件的PACER记录(1:10-cv-00136-UNA)中查看,该案件已于2011年12月15日结案。 Google于11/11/11,即执行这些专利的第二天,就审理了此案。似乎专利的转让可能与规定有某种关系,尽管施乐声称的专利遭到了Google的侵犯,而YouTube却没有’t包含在作业中。

尽管专利申请中包括了许多搜索和信息检索之外的专利,例如涉及手持设备,通过网络打印,分布式网络系统,光学字符识别和工作流程的一些专利,但许多专利的确与基于搜索的服务有关。 Google提供的。

A number of the patents involved focus upon reviews and collaborative filtering of those reviews, caching of webpages in part and in whole, managing online documents, and what seems to be a large family of patents 通过 the same 要么 similar names that focus upon comparing and determining the 质量 of documents. Reading through a number of those, I was reminded that today is the one year anniversary of Google’他们的公告 熊猫 算法。

The patents that focus upon document 质量 could potentially influence some aspects of the 质量 scoring of web pages that might be classified based upon an algorithmic 机器学习 approach such as 熊猫. Here’是其中一项专利的摘要:

电子文档的文本,图像和/或图形应以二维格式进行组织和布局,以呈现给查看者。最好的这种布局取决于当前的内容,创作者’意图,输出设备和查看器’的利益。为了以可量化的方式分析布局的质量性质,电子文档使用各种可量化的因素进行度量;例如,平衡,统一,空白空间管理,对齐,一致性,易读性等;影响文件的定性。然后将这些可量化因素用于量化文档的美观性,易用性,醒目能力,兴趣,可通信性,舒适性和便利性。

我没有’t有机会仔细阅读了所有这些内容,然后将它们分开,并且可能会在时间允许的情况下做到这一点,但他认为,如果专利申请备受关注,这样做会更容易。以下是USPTO转让中已授予和正在申请的专利:

已获专利

专利申请中

外卖

在过去的两年中,Google已从其他公司获得了大量待批和已授予的专利。其中许多涵盖了非常广泛的技术,从无人驾驶汽车的传感器技术到光纤网络过程和设备,再到计算机和数据库体系结构等等。

This acquisition seems a little more focused upon some of the core search technologies that Google is best known for, from some fairly old patents still focused upon search, to some newer patents that might help Google with its move towards improving its processes for reviews and recommendations and determining 质量 scores for documents on the Web. For anyone interested in how Google is evolving towards 机器学习 processes to rank web pages, there can be some value in spending some time going through these patents.

分享是关怀!

关于8条想法“Xerox帮助Google填补一些搜索空白:从Web到Post 熊猫”

  1. 毫无疑问,毫无疑问,谷歌正在向机器学习过程发展,以对网页进行排名& it’真棒。

    特别感谢有关的专利
    “通过确定超媒体链接的关联强度来预测Web用户流量的系统和方法”

    毕竟我们都可以’很遗憾Google是互联网的血液。

  2. 嗨Rajesh,

    机器学习系统通常仅与其用于开始的数据集一样好。我喜欢此交易涉及的许多专利,例如文件质量专利,它们为确定质量的基准设定了一些基准,’如此依赖于不同的种子集“quality”页面。如果没有这些内容,我认为您冒着降低不’t fall close enough to the mold of the sites you included in your seed set, yet which might still provide 质量 content, and a 质量 user experience.

  3. 列出的许多专利都与文档管理系统有关,包括页面,图像,向量空间等,这些似乎是Xerox的领域。因此,这些专利是由对打印机或数码复印机等数字产品产生巨大影响的公司发明的。与Adobe相邻的Xerox是影响力最大的软件开发人员之一。
    我要说的是,Google需要利用像Xerox这样的贸易伙伴来改善他们的服务。

  4. 嗨,马丁,

    这些专利中的许多确实是一种以与Google试图分析它们以进行搜索时的方式截然不同的方式查看文档的方式。我认为截然不同的方法增加了Google的成熟度’有机会发展。它’尚不确定Google会如何使用它们,而是使用Google之类的方法’在Panda的更新中,搜索引擎似乎专注于了解页面布局如何影响人们查看和使用页面的方式。

  5. 嗨,比尔,

    我希望Google表现良好。我从任何地方都听到他们试图帮助人们设计一个新的,更好的数字世界。从任何地方都可以听到许多声音说Google试图与SEO垃圾邮件发送者作斗争。但是不确定他们所做的更改是否不会给他们带来更多麻烦。他们尝试创建针对性更强,更具个性化的搜索。

  6. 嗨,马丁,

    每种算法的改变和每种新的排名方法通常都有一种可能的方式,使其被有意这样做的人操纵和滥用。尝试与之抗争的方法是,从时间,费用和精力上加大成本,以至于操纵起来比不发送垃圾邮件变得更加昂贵。

评论被关闭。