如果Google于90年代初推出,那么它可能具有可以用于搜索万维网之前的当今某些电子数据库的技术,例如 Lexis 要么 对话。它将开发出以有用的方式可视化来自这些系统的结果以及自定义用户界面的方法。它可能已经开发了一个进度条,向您显示搜索正在进行中,并且系统没有’t失败,返回时间超过了毫秒。
如果Google是在WWW在浏览器地址栏中的名称前出现位置之前开始的,那么它可能已经开发出与它非常相似的技术’目前正在工作中,但是在阅读Xerox等公司的许多基于Web的专利时可以感觉到略有不同。
根据美国专利局上周于2012年2月16日记录的转让,谷歌从施乐公司获得了94项授权(90)和待决(4)专利。该转让的执行日期为2011年11月10日。 USPTO分配数据库没有’包括有关交易细节的任何信息,例如财务条款。
我上一篇将Google和Xerox链接在一起的帖子的标题为 施乐对谷歌,雅虎和YouTube提起专利侵权诉讼。在美国特拉华州地方法院的该案件的PACER记录(1:10-cv-00136-UNA)中查看,该案件已于2011年12月15日结案。 Google于11/11/11,即执行这些专利的第二天,就审理了此案。似乎专利的转让可能与规定有某种关系,尽管施乐声称的专利遭到了Google的侵犯,而YouTube却没有’t包含在作业中。
尽管专利申请中包括了许多搜索和信息检索之外的专利,例如涉及手持设备,通过网络打印,分布式网络系统,光学字符识别和工作流程的一些专利,但许多专利的确与基于搜索的服务有关。 Google提供的。
A number of the patents involved focus upon reviews and collaborative filtering of those reviews, caching of webpages in part and in whole, managing online documents, and what seems to be a large family of patents 通过 the same 要么 similar names that focus upon comparing and determining the 质量 of documents. Reading through a number of those, I was reminded that today is the one year anniversary of Google’他们的公告 熊猫 算法。
The patents that focus upon document 质量 could potentially influence some aspects of the 质量 scoring of web pages that might be classified based upon an algorithmic 机器学习 approach such as 熊猫. Here’是其中一项专利的摘要:
电子文档的文本,图像和/或图形应以二维格式进行组织和布局,以呈现给查看者。最好的这种布局取决于当前的内容,创作者’意图,输出设备和查看器’的利益。为了以可量化的方式分析布局的质量性质,电子文档使用各种可量化的因素进行度量;例如,平衡,统一,空白空间管理,对齐,一致性,易读性等;影响文件的定性。然后将这些可量化因素用于量化文档的美观性,易用性,醒目能力,兴趣,可通信性,舒适性和便利性。
我没有’t有机会仔细阅读了所有这些内容,然后将它们分开,并且可能会在时间允许的情况下做到这一点,但他认为,如果专利申请备受关注,这样做会更容易。以下是USPTO转让中已授予和正在申请的专利:
已获专利
- 将查询转换为单调递增形式以连续查询仅追加数据库 (美国专利5495600)
- 数据库搜索及其搜索历史的并行图形化可视化方法和装置 (美国专利5515488)
- 数据库搜索结果可视化的方法和装置 (美国专利5546529)
- 功能库和存储的自定义控制界面 (美国专利5604860)
- 为定制多功能用户界面记录文档作业密钥 (美国专利5630079)
- 远程访问操作的时间估计和进度反馈的方法和装置 (美国专利5657450)
- 保存和检索控制模板的层次结构 (美国专利5717439)
- 带有文本标签的图形文档索引自动系统 (美国专利5845288)
- 每个文件都具有独立安全性属性的共享数据环境 (美国专利5930801)
- 使用图像哈希表索引手写文档图像中单词的方法 (美国专利5953541)
- 异构数据库集成平台 (美国专利5970490)
- 集中式打印服务器,用于连接一个或多个网络客户端与多个打印设备 (美国专利5974234)
- 集中式打印服务,用于连接一个或多个网络客户端与多个打印设备 (美国专利6020973)
- 用于在文档处理系统中克隆文档处理相关设置的系统 (美国专利6026436)
- 用于加载和重新加载具有可缓存和不可缓存部分的HTML页面的设备和方法 (美国专利6061715)
- 用于加载和重新加载具有可缓存和不可缓存部分的HTML页面的设备和方法 (美国专利6094662)
- 使用N-Gram和单词信息自动识别语言 (美国专利6167369)
- 用户级别的低级计算机系统操作访问 (美国专利6266670)
- 基于属性的灵活性机制,支持具有不同通信协议的前端和后端组件 (美国专利6269380)
- 在基于属性的文档管理系统的读/写路径中插入了一个用户级控制的机制 (美国专利6308179)
- 使用噪声协同过滤对项目进行排名和呈现的系统和方法 (美国专利6321179)
- 使用噪声协同过滤对项目进行排名和呈现的系统和方法 (美国专利6321232)
- 利用来自文档收集内容分析的用户和组概要文件对搜索结果进行协作排名的系统和方法 (美国专利6327590)
- 可视化相关图系列之间的转换的方法 (美国专利6369819)
- 文档属性的直接操作界面 (美国专利6370538)
- 自举协同过滤系统的系统和方法 (美国专利6389372)
- 基于安全令牌的文档服务器 (美国专利6397261)
- 增强现实显示方法及系统 (美国专利6408257)
- 缓存系统和方法 (美国专利6415368)
- 输出设备的远程功能交付 (美国专利6424950)
- 移动文件分页服务 (美国专利6430601)
- 在万维网上提供时间区分的方法 (美国专利6470269)
- 移动电子邮件文件交易服务 (美国专利6487189)
- 使用共享书签搜索和推荐集合中的文档的系统和方法 (美国专利6493702)
- 记录和查看文档使用历史的文档管理系统 (美国专利6493731)
- 猪鬃:可视化的排序Web文档与其使用数据之间的发现关系 (美国专利6499034)
- 基于使用的遍历和显示通用图结构的方法 (美国专利6509898)
- 可视化表示多个数据对象集群的内容的系统和方法 (美国专利6564202)
- 基于多模式用户群的推荐提供系统和方法 (美国专利6567797)
- 在集合中对数据对象进行聚类的系统和方法 (美国专利6598054)
- 眼动仪数据分析系统和方法 (美国专利6601021)
- 基于安全令牌的文档服务器 (美国专利6601102)
- 文档图纸中的二维图案索引系统 (美国专利6621941)
- 缓存系统和方法 (美国专利6631451)
- 缓存可重用对象的系统和方法 (美国专利6662270)
- 通过确定超媒体链接的关联强度来预测Web用户流量的系统和方法 (美国专利6671711)
- 分散网络系统 (美国专利6671737)
- 分布式基于文档的日历系统 (美国专利6675356)
- 提供灵活的工作表示的系统和方法 (美国专利6725428)
- 使用多模式特征的信息浏览系统和方法 (美国专利6728752)
- OCR文本格式化的方法和装置 (美国专利6741745)
- 网络环境中监视和鼓励社区活动的方法 (美国专利6742032)
- 知识管理系统及方法 (美国专利6873430)
- 使用近端线索预测网站使用情况的系统和方法 (美国专利6907459)
- 在向量空间中定量表示数据对象的系统和方法 (美国专利6922699)
- 识别集合中对象之间相似性的系统和方法 (美国专利6941321)
- 电子板系统 (美国专利6964022)
- 基于密码服务器的拍卖的系统,方法和产品 (美国专利6990468)
- 基于约束的文档生成系统和方法 (美国专利7010746)
- 推断超媒体链接文档集中用户信息需求的系统和方法 (美国专利7017110)
- 测量和量化文档质量的系统和方法 (美国专利7024022)
- 测量和量化文档质量的系统和方法 (美国专利7035438)
- 测量和量化文档质量的系统和方法 (美国专利7035439)
- 提供设备的站点特定位置的系统和方法 (美国专利7054651)
- 测量和量化文档质量的系统和方法 (美国专利7072495)
- 测量和量化文档质量的系统和方法 (美国专利7092551)
- 测量和量化文档质量的系统和方法 (美国专利7092552)
- 测量和量化文档质量的系统和方法 (美国专利7095877)
- 基于约束的文档生成方法 (美国专利7107525)
- 在浏览时将特定内容透明地注入到浏览的网页中 (美国专利7107526)
- 测量和量化文档质量的系统和方法 (美国专利7116802)
- 测量和量化文档质量的系统和方法 (美国专利7130450)
- 测量和量化文档质量的系统和方法 (美国专利7130451)
- 测量和量化文档质量的系统和方法 (美国专利7136511)
- Multi-Versioned Documents And Method For Creation And Use 那里of (美国专利7171618)
- 在小型手持显示器和手机上查看表格数据 (美国专利7200615)
- 推荐系统中基于用户活动的专业知识映射方法和系统 (美国专利7240055)
- 测量和量化文档质量的方法 (美国专利7260245)
- 测量和量化文档质量的方法 (美国专利7262222)
- 测量和量化文档质量的方法 (美国专利7269276)
- 测量和量化文档质量的方法 (美国专利7277560)
- 测量和量化文档质量的方法 (美国专利7280675)
- 测量和量化文档质量的方法 (美国专利7283648)
- 灵活的基于规则的推荐系统,可与电子白板系统一起使用 (美国专利7287024)
- 测量和量化文档质量的方法 (美国专利7305107)
- 测量和量化文档质量的方法 (美国专利7308116)
- 推荐系统和方法 (美国专利7386547)
- 确定文件整体有效性的方法 (美国专利7391885)
- 推荐系统和方法 (美国专利7440943)
- 计算机化操作工具,用于管理文档输出管理系统的打印参数,排队操作和存档操作 (美国专利7698650)
专利申请中
- 输出设备的远程功能交付 (美国专利申请20020161649)
- Multi-Versioned Documents and Method for Creation and Use 那里of (美国专利申请20070061384)
- 输出设备的远程功能交付 (美国专利申请20070136137)
- 计算机化操作工具,用于管理文档输出管理系统的打印参数,排队操作和存档操作 (美国专利申请20100175009)
外卖
在过去的两年中,Google已从其他公司获得了大量待批和已授予的专利。其中许多涵盖了非常广泛的技术,从无人驾驶汽车的传感器技术到光纤网络过程和设备,再到计算机和数据库体系结构等等。
This acquisition seems a little more focused upon some of the core search technologies that Google is best known for, from some fairly old patents still focused upon search, to some newer patents that might help Google with its move towards improving its processes for reviews and recommendations and determining 质量 scores for documents on the Web. For anyone interested in how Google is evolving towards 机器学习 processes to rank web pages, there can be some value in spending some time going through these patents.
毫无疑问,毫无疑问,谷歌正在向机器学习过程发展,以对网页进行排名& it’真棒。
特别感谢有关的专利
“通过确定超媒体链接的关联强度来预测Web用户流量的系统和方法”
毕竟我们都可以’很遗憾Google是互联网的血液。
嗨Rajesh,
机器学习系统通常仅与其用于开始的数据集一样好。我喜欢此交易涉及的许多专利,例如文件质量专利,它们为确定质量的基准设定了一些基准,’如此依赖于不同的种子集“quality”页面。如果没有这些内容,我认为您冒着降低不’t fall close enough to the mold of the sites you included in your seed set, yet which might still provide 质量 content, and a 质量 user experience.
列出的许多专利都与文档管理系统有关,包括页面,图像,向量空间等,这些似乎是Xerox的领域。因此,这些专利是由对打印机或数码复印机等数字产品产生巨大影响的公司发明的。与Adobe相邻的Xerox是影响力最大的软件开发人员之一。
我要说的是,Google需要利用像Xerox这样的贸易伙伴来改善他们的服务。
嗨,马丁,
这些专利中的许多确实是一种以与Google试图分析它们以进行搜索时的方式截然不同的方式查看文档的方式。我认为截然不同的方法增加了Google的成熟度’有机会发展。它’尚不确定Google会如何使用它们,而是使用Google之类的方法’在Panda的更新中,搜索引擎似乎专注于了解页面布局如何影响人们查看和使用页面的方式。
嗨,比尔,
我希望Google表现良好。我从任何地方都听到他们试图帮助人们设计一个新的,更好的数字世界。从任何地方都可以听到许多声音说Google试图与SEO垃圾邮件发送者作斗争。但是不确定他们所做的更改是否不会给他们带来更多麻烦。他们尝试创建针对性更强,更具个性化的搜索。
嗨,马丁,
每种算法的改变和每种新的排名方法通常都有一种可能的方式,使其被有意这样做的人操纵和滥用。尝试与之抗争的方法是,从时间,费用和精力上加大成本,以至于操纵起来比不发送垃圾邮件变得更加昂贵。