关于 Google 的新算法 – Rankbrain

作者: 用户投稿 阅读:78 点赞:182

Google 正使用一个叫做 Rankbrain 的机器学习科技来协助传递搜索结果。以下是到目前为止我们所了解关于 Rankbrain 的事情。

就在昨天,Google 使用叫做”Rankbrain”的机器学习人工智能系统来协助分类搜索结果的消息曝光了。想知道他是怎么运作及适应 Google 的全部系统吗?以下是我们对于 Rankbrain 的了解。

什么是 Rankbrain?

Rankbrain 是 Google 机器学习人工智能系统的名字,被用来帮助处理搜索结果,就像彭博所报导的以及 Google 向我们证实的一样。

什么是机器学习?

机器学期就是机器能够自我学习,而不用人类来教他或是遵循复杂的程序。

什么是人工智能?

人工智能就是指电脑也可以变的像人类一样聪明,至少从意义上来说可以从被教导以及创建于他已知的事情上获取知识并创建新的连系。

当然,真的 AI 只存在科幻小说里。实际上,AI 通常是指被设计用来学习及创建联系的电脑系统。

AI 跟电脑学习有什么不一样呢?从 Rankbrain 这个字来看,对我们来说好像是同义字。你可能听过他们可以交换用,或是可能听过机器学习可以用来形容人工智能可以用在劳务上。

所以 Rankbrain 是 Google 用来排序搜索结果的新方法?

不是的。Rankbrain 只是 Google 全部搜索算法的一部分,是用来排序数十亿已知页面的电脑程序,以及用来找到最符合查找的结果。

这个 Google 的搜索算法叫什么名字?

他叫做”蜂鸟”,就是我们过去所报导过的。在过去几年里,整体算法都没有正式的名字。不过在 2013 年中,彻底翻修了算法并给了他名字 – 蜂鸟。

所以 Rankbrain 是 Google 蜂鸟算法的一部分吗?

这是我们的理解。蜂鸟是全部搜索引算法,就像一台车有一全部引擎一样。而引擎又由许多部分所组成,例如:滤油器、燃料帮浦、冷却系统等。同样地,蜂鸟包含了许多部分,而 Rankbrain 则是最新的一部分。

我们了解到 Rankbrain 是全部蜂鸟算法的一部分,因为彭博的文章已经说明了 Rankbrain 并不负责处理全部的搜索,因为只有全部算法才有办法处理。

蜂鸟也包含了其他在 SEO 界耳熟能详的算法名字,像是:熊猫、企鹅、Payday 要来对抗 spam,Pigeon 要来改善本地搜索,Top Heavy 要来降等过多广告的页面,搜索引擎友善则要来提升对手机端友善的页面,Pirate 则是要来对抗侵害版权的问题。

我认为 Google 的算法应该被称为「PageRank」

PageRank 是全部蜂鸟算法的一部份,他对于根据来自其他页面的链接给予权重有一套特殊的方法。

PageRank 是很特别的,因为在 1998 年搜索引擎刚开始时,PageRank 是 Google 第一次给予其中一部分算法命名。

Google 用来排名的这些「信号」是什么?

信号是 Google 用来帮助决定网页排名。举例来说,他会读取网页里的文本,所以文本就是一个信号。如果有些字是粗体,那可能就是另一种信号。这些计算法通常是 PageRank 的一部分,被用来给予页面 PageRank 分数,那就会被用来当作信号。如果有一个页面被标记是手机端友善的,那就是另一个被注册的信号。

所有信号都会经由蜂鸟算法的各部分来处理分析,以判断最终要显示在各种不同搜索的页面为何。

那有多少信号呢?

Google 谈到主要的排名信号有非常过 200 个,而可能有非常过 10000 个变量或次信号。他通常会说有「数百个」因素,就像昨天彭博的文章一样。

如果你想要更多直观的排名信号指南,可以看看我们的「」这篇文章

我们认为他真的是个很好的指南,可以用来帮助网页在像 Google 这样的搜索引擎取得排名。

而 Rankbrain 是第三重要的信号吗?

没错。很出人意料的,这新系统已经成为 Google 所说的排序网页第三重要的因素。彭博文章里说到:

Corrado 说:Rankbrain 是算法中「数百个」排名信号中的其中一个,决定了在 Google 搜索结果页的呈现以及排名。他说:在过去几个月早已经展开,Rankbrain 已经成为第三种要排名因素并对搜索有所贡献。

那第一跟第二重要的信号是什么呢?

Google 不会告诉我们第一跟第二重要的信号是什么。我们已经问过。而且问了两次…

Google 不告诉我们前两个信号,这真的很讨厌而且又会让人迷网。Google 想利用 PR 来突破机器学习的发展。

但若真的要评估突破性以及之后 Rankbrain 的冲击,了解 Google 现在所使用的其他重要因素会有所帮助。这就是为什么 Google 应该要解释的原因。

顺带一提,我个人的猜测是链接仍会是最重要的信号,Google 会把那些链接给加总起来。这也是一个非常老的系统,如同我过去所写的文章:。

至于这第二重要的信号,我猜测会是「文本」,文本要包含页面上的文本及 Google 在 Rankbrain 分析中如何理解人们在搜索框中输入的文本。

Rankbrain 确切来说能做什么呢?

从 Google 的来信中,我推测 Rankbrain 主要是被用来解析人们所提交可能不含有精确的文本的搜索。

没有精确的查找 Google 就没办法找到页面吗?

不,Google 没有精确字也可以找到页面已经很久哦。举个例子来说,很多很多年前,如果你输入了像是「一只鞋子」这样的字,Google 可能就没办法找到关于「一双鞋子」的页面,因为技术上来说那是两个不同的字。但「stemming」可以让 Google 聪明一点,为了要了解一双鞋子是一只鞋子的变形,就像「跑步」是「跑」的变形。

Google 也有同义字的智能,所已如果你搜索「sneakers」,Google 也许会了解到你要找的是「慢跑鞋」。为了要了解科技公司「苹果」vs 水果「苹果」,甚至得到了概念上的智能。

什么是知识图谱?

知识图谱是从 2012 开始发展,是 Google 用来让字词之间的链接变的更聪明的方法。更重要的是,他学会了搜索「事物而非字符串」,Google 曾这么描述。

字符串意思是字母字符串的搜索,像是拼字符合「欧巴马」的页面。相反地是物是指,Google 能了解当有人搜索「欧巴马」,他们可能是指美国总统欧巴马,与其他人、地点与事物有所链接的现实中的人。

知识图谱是关于世界上的事物已及这些事物间的关联性的数据库。这也就是为什么当你搜索「欧巴马的太太什么时候出生」而不是用他的名字来搜索时,你会得到像米歇尔‧欧巴马这个答案:

Rankbrain 如何帮助优化搜索?

Google 用来重新定义搜索的方法一般要回到在某处工作的人们那,已经创建的 stemming 清单货是同义字清单或创建事物之间联系的数据库也是。当然,还是有一些是自动化的。不过大部分都是要依靠人力。

这个问题是 。2007 年,百分之 20 到 25 的查找都是以前曾经看过的。2013 年,这数字,这又被拿来当作彭博的文章,Google 也再次确认。但这些尚未被人们搜索过的为 30 亿的百分之 15 ,仍是一个巨大的数字 – 1 天有 4 亿 5 千万。

那些还可以更复杂,多组字词的查找,也可以做「长尾字」查找。Rankbrain 被设计来帮助那些查找请求以及更有效率的转译,在这方法的背后是要为搜索者找到最佳的页面。

就如同 Google 所说的,他可以了解表面上看起来毫无关系的复合查找,他们彼此间的相似性。而这个学习可以更了解复合查找,已及是否跟其他主题相关。最重要的是,Google 告诉我们他可以把查找字组及搜索者会喜欢的搜索结果联在一起。

Google 没有提供查找词组的例子也没提供 Rankbrain 如何猜测最佳页面的细节。后者可能是因为如果他可以把不明确的查找转译成明确的查找,那他就可以带来更好的结果。

来个例子如何?

虽然 Google 没有给查找词组的范例,而彭博文章有个搜索的单一范例,Rankbrain 可能有所帮助。如下:

食物链中最高级的消费者是谁

对于像我这样的门外汉来说,「消费者」听起来就像是某个买东西的人。然而,他也是某种消耗食物的物种在科学上的专有名词。食物链中有多种等级的消费者。最顶层的消费者呢?他叫做「食肉动物」。

把这词与输入到 Google,Google 提供了很好的答案,虽然这个查找词与本身还是很奇怪:

现在来细想查找像「食物链顶端」的结果相似性,如下方:

想像一下,Rankbrain 把那原本很长又复杂的搜索链接到了比较短的这个,这可能是比较一般的做法。他能够了解他们是非常相似的。结果是,从比较常见的查找中得到的答案来改善比较少见的查找,Google 可以让他知道的所有事情发挥功效。

我要强调,我不知道 Google 联结了这两个查找。我只知道 Google 给了第一个范例。这是 Rankbrain 可能如何被用来链接不常见跟常见查找来改善搜索结果的简单描述。

Bing 用 RankNet 也可以做到这些吗?

回到 2005 年,微软开始使用他们自己的机器学习系统,叫做 RankNet,是今天 Bing 搜索引擎的一部分。实际上,RankNet 的首席研究员及创造者最近才被表扬。不过在这些年,微软很少谈论到 RankNet。

你可以打赌这将可能会有所改变。有趣的是,当我在 Bing 输入跟上面 Google Rankbrain 一样的例子时,Bing 给我很好的搜索结果,其中一条还跟 Google 的一样。

一个搜索不表示 Bing 的 RankNet 跟 Google 的 Rankbrain 一样好,反之亦然。不幸的是,很难题出一份清单来做比较。

有更多例子吗?

Google 的确有给我们新的范例:「杯子里有几枝汤匙?」Google 表示 Rankbrain 对澳洲或美国会提供不同的搜索结果,因为每个国家的衡量标准不同,尽管名称很相似。

我试着在 google.com 跟 Google 澳洲上搜索来做测试。我发现没有太大的不同。即使没有 Rankbrain,结果也常常不同,只因为提供页面的「过时的」方法是为那些使用澳洲 Google 的搜索者提供已知的澳洲网站。

Rankbrain 真的有帮助吗?

尽管上面的两个例子无法当作让人信服 Rankbrain 强大的证据,但我真的相信他可能正产生巨大的影响,就如同 Google 所说的那样。Google 对于排名算法是相当保守的。他总是在做些小测试。但当他有足够的信心时,就会展开很大的改变。

到了一般相信是第三重要信号的地步,集成 Rankbrain 是一个巨大的改变。我认为是因为他真的有帮助 Google 才会这么做。

Rankbrain 什么时候开始呢?

Google 告诉我们 Rankbrain 在 2015 年初会逐步的展开,而现在已经在全球展开数月了。

什么搜索字词会被影响?

Google 告诉彭博有一「大部分」的查找交由 Rankbrain 处理。我们问了 Google 想要一个精确的数字,但我们还是得到一大部分这个答案。

Rankbrian 会一直学习吗?

Google 告诉我们,Rankbrain 的所有学习都是脱机的。他被给予批次的历史搜索纪录并从中学习做出。

那些都会被测试,如果被验证是对的,最新版的 Rankbrian 就会开始使用。而脱机学习及测试的循环会不断的重复。

Rankbrain 能做查找优化之外的事吗?

通常查找如何优化,透过 stemming 、同义字或是现在的 Rankbrain 都被认为不是排名因素或是信号。

信号通常跟内容有关,像是一个页面上的字、链接指向到一个页面、页面是否在安全的服务器上等等。他也可能是跟用户有关,像是用户的地点或是他们搜索及浏览的历史纪录。

所以,当 Google 谈论到有关 Rankbrain 做为第三重要的信号时,他真的被当作一个排名信号吗?是的。Google 重新向我们确认有个组件,Rankbrain 会以某种方式直接影响到网页排名。

究竟如何呢?是否有一些「Rankbrain 分数」类型可以用来评估品质呢?或许有,但他似乎更像是这样,Rankbrain 以某种方式帮助 Google 根据网页内容来分类的更好。Rankbrain 或许比 Google 目前的系统更能够总结归纳网页。

或者根本不是这样。Google 除了关于排名组件之外,其他什么也没说。

我要如何更了解 Rankbrain?

Google 告诉我们,想了解关于「矢量」这个字的人 – 字和词组在数学上是有所链接的 – 应该要来看看我们,这篇文章谈到这系统(文章中还没被命名为 Ranlbrain)如何借由扫描新闻学到都市的概念:

有一篇很长的搜索论文是依据所写的。你甚至可以用 Google 的 工具来创建你自己的机器学习计划。除此之外,Google 有一整区关于他的 AI 跟机器学习的论文,微软。

原文出处:

本站内容均为「码迷SEO」网友免费分享整理,仅用于学习交流,如有疑问,请联系我们48小时处理!!!!

标签: ai 算法 AI

  • 评论列表 (0