How 谷歌 Sets Worked

分享是关怀!

谷歌 was Granted a Patent on 谷歌 Sets

谷歌 Sets是Google经常忽略的工具,它使您能够“通过一些示例自动创建项目集。”它已由Google正式停用,并且不再可用。

谷歌 Sets was one of the first applications in the 谷歌 Labs pages.

谷歌实验室是“Google’的技术游乐场,”他们包含了许多可能明天可能不会的程序’s useful applications from the search engine. As 谷歌 tells us,

谷歌实验室展示了我们最喜欢的一些想法’还没有准备好黄金时段。您的反馈可以帮助我们改进它们。请试用这些原型,并将您的评论直接发送给开发它们的Google员工。

谷歌于本周获得了Google Sets背后程序的专利,专利文件提供了有关该程序如何根据以下内容查找其他单词的一些详细信息“一组事物中的项目” that you enter.

screenshot of 谷歌 Sets with 4 Delaware cities entered as a starter 组

我没有’t used 谷歌 Sets much in the past, but now that I have a sense of how it works, I might use it more often.

由于该程序允许您输入可能属于集合的多个项目,因此我决定键入特拉华州4个城市的名称:

纽瓦克,多佛,威明顿和乔治敦

您 can then choose to get a small 组 or a large 组 in response to the items that you chose. Here are the results that I received after picking a large 组:

威尔明顿,乔治敦,纽瓦克,杜弗,新城堡,里霍博斯比奇,熊,米尔福德,霍克辛,刘易斯,西福德,smyrna,米尔斯伯勒,Middletown,克莱蒙,弥尔顿,塞尔比维尔,汤森德,月桂树,哈灵顿,费尔顿,格林伍德,克莱顿,玉兰,卡姆登,怀俄明州,多佛afb,敖德萨,埃尔斯米尔,特拉华城,贝瑟尼海滩,杜威海滩,海景,芬威克岛,布里奇维尔,纽波特,蒙特尚,埃伦代尔,布鲁克赛德,达格斯伯勒,米尔维尔,温特图尔,圣乔治,费城,德尔马,约克,格拉斯哥,弗兰克福德,林肯,佩恩港

这些结果中的大多数(但不是全部)是特拉华州的城市。

Not all 组s received provide such good results, but if you have an idea of how 谷歌 Sets works, you may end up with better results when using the tool.

The simple explanation of how the program works is that 谷歌 attempts to identify lists on the web as it crawls pages. It may look for these lists 通过 considering:

  • HTML标记(例如,<UL>, <OL>, <DL>, <H1>-<H6> tags).
  • 放在桌子上的物品,
  • 用逗号或分号分隔的项目,
  • 项目之间用制表符分隔。
  • 其他方法。

用户在Google Sets界面中键入的项目将与这些列表进行匹配,并计算概率以确定哪些项目可能与使用Google Sets的人提交的项目非常匹配。

If you keep in 心神 that 谷歌 Sets is suggesting additional terms for your 组 通过 considering words that might appear together in lists on Web pages, you may find the results you receive more useful.

该专利是:

自动创建列表的系统和方法
西蒙·汤和杰夫·迪恩发明
Assigned to 谷歌
美国专利7,350,187
2008年3月25日授予
申请日期:2003年4月30日

抽象

系统会根据现有列表中的项目自动创建一个列表。系统接收与列表相对应的一个或多个示例项目,并基于一个或多个示例项目将权重分配给现有列表中的项目。然后,系统根据物料和分配给物料的权重形成清单。

While the 谷歌 Sets application isn’t named in the patent filing itself, one of the images that accompany the patent is a screenshot of the front page of 谷歌 Sets.

screenshot of patent drawing showing front page of 谷歌 Sets

分享是关怀!

关于30的想法“How 谷歌 Sets Worked”

  1. 有趣的是他们’ve真正获得了专利!一世’使用这种方便的工具已经有很多年了,以至于记忆犹新’通常很好。您认为在Google搜索查询中使用波浪号运算符的结果是否突出显示了使用与Google Sets类似的技术创建的单词关系?

  2. I test similarity with 谷歌 Adwords keyword tool.
    特别是在用英语测试时,“other keywords” in Adwords.
    Not all keywords given 通过 谷歌 Sets match but a large part yes.
    另一百分比的关键字采用不同的形式(单数,复数)。

  3. 感谢您对专利的注意。

    现在,我经常使用Google关键字工具,不仅可以了解对特定关键字的相对需求,还可以找到我可能会错过的其他可能的关键字。它’很明显,我也可以为此目的使用Google Sets工具,但是我’我想知道您认为这两种工具之间会有多少重叠。 (我想我可以将其进行测试,将两者插入相同的5 KW,然后检查建议…)

  4. It is playful and instructive tools like this that will keep 谷歌 on the cutting edge of search technology for a long time to come.

    谷歌’有趣且创新的搜索引擎使用方法和先进功能使我想起了Apple的创造力。

    Just like Apple, I would never count the 谷歌 people out for long.

  5. 嗨,SEO Ranter,

    I’我曾经使用过Google Sets,但实际使用量并不高。有时,当您尝试扩大范围时可能会有所帮助。一世’我不确定波浪号搜索(相似性或同义词搜索)是否确实使用了相同的技术。

    嗨弗朗切斯科,

    adwords建议工具可能会很有用。一世’m not sure if it’是搜索相似性的最佳方法,但它可能是有用的工具。

    嗨Winooski,

    您’重新欢迎。当我阅读专利时,我没有’t sure that it covered an existing tool from 谷歌. It took a couple of reads before I even remembered 谷歌 Sets.

    I’我不确定那里’两者之间有很多重叠– I’我将不得不对另一项最近的专利申请进行书面记录,这可能会给我们提供更多细节….

    嗨人查找器,

    我喜欢Sets,也喜欢这种工具以及Google实验实验室中的其他工具向公众发布以尝试使用的精神。一世’将您的创意技巧和其他’不要害怕做不同的事情。

  6. 谷歌 Sets is a great tool to find semantically related keywords to use in your text for purposes of phrase-based IR. Do you concur?

  7. pingback:»Pandia周末总结2008年3月30日
  8. 乔丹,您好!

    I’d完全同意使用Google Sets。它确实提供了有关可能根据您提供的一组项目在列表中频繁出现的单词的信息。在尝试理解这些词在语义上的相关性时,我至少看到两个问题。

    首先是应用程序仅限于在页面上找到的列表,而不是这些页面的全部内容。因此,当您仅查看文档的某些部分(其中的列表)时,使用Set来了解文档中的短语之间是如何相互关联的。

    第二个是你不’您不知道您最初选择的商品在语义上的相关性是,您首先输入Google Sets,然后才尝试为您添加商品。

    在这一点上,我可以想到的Google Sets的最佳用途是作为一种集思广益的工具,当您可能希望查找人们可能已经将它们一起包含在网络列表中的单词时。不幸的是,它没有’不能提供任何关于为什么将这些单词一起列出的见解。

  9. I think you have highlighted the sticking point about the 谷歌 组s results at the moment:

    Suggestions are based on current 在页面上 factors.

    关于同义词(例如AW关键字工具产生的同义词)的事情是,它们在“mind” of searchers. Although website authors have the same 心神s, “on page”列表产生一些相当随意的结果。

    我测试了一些我很了解的相关的两个单词关键字。它没有’不要花太多的迭代才能发现我的结果乱七八糟“about us” “our projects” and even “sitemap”.

    也许导航实际上是一个列表这一事实意味着,列表本身不应该是真实列表的度量。“set”.

    刚找到您的网站,并希望能读到比最近到处都乱扔的渣更有趣的SEO对话。最良好的祝愿。

  10. 嗨,罗伯,

    感谢您的光临,并提出您的意见。

    我可能希望将专利提及的事物类型视为列表,其中包括页面标题元素中包含的单词。不幸的是,许多设计人员滥用页面标题,并将其用作导航内容以及页面主要内容区域内文本的标题。也有人认为“标准思想领袖”谁一直在提出将公司徽标图像包装在>h1<元素,因为网站名称或公司名称没有HTML元素。不幸的是,这意味着页面上的主要标题是’关于标题的内容,但每一页都是相同的–这种做法会使搜索引擎的索引编制工作更加困难,并可能导致Google定位服务根据页面标题找到的列表不那么有用。

    我不’认为使用Google Sets是尝试查找可能在语义上相关的单词的好主意。它’最好的用法似乎是一种查找列表中找到的单词的方法,这些单词包括由Google Sets用户输入的项目。

    I’我不确定它是否有用。它’s been 谷歌’长期以来最长的Beta版项目,并且可能会保留为Google的Beta版程序’的实验室很久以后,其他程序又被添加到了他们站点的“实验室”部分。

  11. pingback:Using 谷歌 Sets for SEO 关键字研究 |SEO男孩历险记
  12. 我使用Google Sets来发现一些显而易见的相关术语,除非您碰巧使用了几种不同的关键字工具进行研究,否则您可能不会马上想到这些术语。通常你必须做很多事情“drilling down”在遇到明显的联系之前,您当然不能忽略它。太糟糕了,它只能返回20到30个结果,但是我还是喜欢它。

  13. 嗨,马库斯,

    谷歌集不仅可以找到关键字,还可以是非常有用的工具。在撰写和寻找相关想法时,我喜欢将其作为集思广益的工具。如果您输入了可能在网络上的多个列表中同时出现的几个相关概念,则可以帮助您将这些概念扩展到更广泛的概念。如果你’re doing some 心神mapping,可能会很有帮助。

  14. 首先,我’我第一次在这里听说过Google Sets’不能说我完全被它震撼了,但是它可以被网站管理员用于研究目的。一世’我玩了一点,看来Google集
    — returns the results that are very close to 谷歌 Keyword Tool results or
    —返回结果,该结果完成了不是同义词而是项目的组,可以将其分组为一个定义,或者
    —返回听起来相似的单词
    我尝试添加描述性词,希望该工具可以将这些词所描述的对象返回给我,但这并没有’t happen.
    总而言之,毫无疑问,这是一个有用的工具,我’ll keep this in 心神 for the future because nothing yet offers this sort of grouped results.

  15. 嗨乔治,

    谷歌 Sets have been around for a long time, but they aren’真的那么出名。

    考虑到它们是从Google在网络上找到的列表中获取的,我尝试使用它们的方法之一是想象可能会出现在列表中的事物,并将其作为我的开始术语,然后看看还有什么可能出现。有时结果很有帮助。它’值得探索,即使他们不在’t.

  16. 嗨安德鲁,

    那’绝对是值得一看的论文。但是,我’我不确定我们是否应该将其视为描述Google Sets的工作方式,因为它的重点是在网络上查找和提取键/值对数据,例如作者/标题。该专利专门针对Google Sets,因此对于想要了解Google Sets的人来说可能是一个更好的来源。感谢您指出–这是一个非常有趣的文档。

  17. pingback:Less ordinary stuff: Main
  18. 嗨,约翰,

    从我身上’已经看到,Google Sets背后的流程并没有’t involve Latent Semantic Indexing (LSI), and 我不’认为通过Google Sets找到的单词之间的关系与LSI无关。

  19. pingback:bpchesney.org
  20. 我测试了一些我很了解的相关的两个单词关键字。不需要太多的迭代就可以发现我的结果到处都是“关于我们”,“我们的项目”甚至“ 网站地图”。

    导航本质上是一个列表,这一事实也许意味着列表本身不应该是真实“集合”的量度。

  21. 你好罗宾,

    有趣的是,您会在Google设置中看到如此多的导航项,但是’与申请该专利和最初开发Google Sets时相比,人们使用样式更多的列表来显示其导航的可能性可能更高。我记得在2000年代初期使用表格创建导航栏。

    Ideally 谷歌 should probably be filtering out of 谷歌 Set results lists that are used as navigational items.

  22. 与现在已灭绝的神奇轮不同,谷歌套装看起来更像是谷歌’迈向LSI的第一步。如果您放一个品牌,您会得到替代品(索尼,松下等)和一些随机词。像adwords关键字工具功能之类的功能很多,它可以扫描网页上的关键词,并为您提供一个列表,google 组可以查看将哪些产品或术语组合在一起。这就引出了一个问题,为什么仍然保留诸如google 组之类的实验,为什么一些有价值的google工具(例如“神奇的转盘”)结束了?

  23. 嗨,本

    谷歌集肯定导致了Google’的Webtables项目,以及他们为从Web页面上提取结构化数据所做的其他努力。查阅以下文章了解更多信息:

    WebTables:探索Web上表格的功能 (pdf)
    发现关系网 (pdf)

    谷歌肯定会做一些语义分析,但我不会’我们认为LSI于90年代首次被描述和实现,它的可伸缩性足以满足Web上的文档索引的需求,因为索引变化太快并且包含的​​数据太多,因此在大多数情况下对LSI毫无帮助。

评论被关闭。