现在几乎每个人都听说过谷歌的RankBrain系统,一种新的人工智能学习算法机器,这应该是目前最新、最棒、最高大上的技术了。你们中的很多人可能没有意识到,正是因为这项技术,SEO(搜索引擎优化)行业才会有如此快的发展速度。在这篇文章中,怒熊网(重庆网站建设)将带你通过一些具体的例子说明为何一些旧的SEO规则在今天将不再适用,以及一些可以保证您的企业可以进行成功的SEO活动的相关措施。
什么是人工智能?
人工智能通常有三种不同的分类:
人工狭窄智能(ANI):这种人工智能只能致力于完成某个特定的事情(如打国际象棋世界冠军杯)。
人工总体智能(AGI):这是当AI可以执行所有的事情。一旦一个AI可以像人类一样执行任务,我们认为它为AGI。
人工超智(ASI):AI在更高层面上完成所有的事情(如超出一个人的能力)。
当我们谈论谷歌RankBrain的背景以及当前谷歌正在运行的机器学习算法时,我们谈论的是人工狭窄的情报(ANI)。
实际上ANI已经运行了一段时间。有没有想过这些垃圾邮件过滤器如何在你的电子邮件中工作的吗?是的,这多亏了ANI。这些是我最喜欢的ANI程序:谷歌翻译, IBM ' s的华生,还有亚马逊上很酷的产品推荐功能,无人驾驶汽车当然了,还有我们亲爱的谷歌RankBrain。
在ANI,有许多不同的方法。当佩德罗多明戈在他的书《算法大师》中明确阐述过,试图实现的完美的人工智能的数据科学家可以分为五类:
符号学家
联系论学家
进化学家
贝叶斯统计学家
类推学家
谷歌RankBrain属于联系论学家的阵营。联系论学家相信我们拥有的所有知识被编码并与我们大脑的神经联系。RankBrain的特定策略是该领域的专家所称的反向传播技术,也就是'深度学习'。
联结主义声称这种策略能够从原始数据中学习到任何东西,因此也能最终自动的发现所有的知识。谷歌显然也相信这一点。2014年1月26日,谷歌宣布它已经同意收购DeepMind技术,这项技术从本质上讲,这是一个反向传播。
所以当我们谈论RankBrain时,我们现在可以告诉人们它是由ANI的一个特定技术(反向传播或'深度学习')组成。现在我们大概的对此有了一些了解,但是这一领域是怎么进步的?更重要的是,如何改变搜索引擎优化的业务?
技术的指数级增长(和AI)
来自WaitButWhy.com网的蒂姆厄班解释说技术的发展比在他的文章《AI革命:通往智慧之路》涉及到的任何人都快。
下面是当你回顾历史时:技术的进步。
但是,根据厄班指出,在现实中,你不能看到你的未来是什么样的。因此,这里是当你站在那里,是如何真正的感觉的:
这张图显示的是,当人类试图预测未来时,他们总是会低估。这是因为他们看问题都以上图左偏的形式,而不是在该曲线图右侧的形式。
随着时间的推移 ,人类的进步发展的越来越快。雷库兹威称之为加快返回的法则,他最初的理论背后的科学推理是更先进的社会能够拥有比次发达的社会更快速的发展的能力——因为他们更先进。当然了,同样的结论可以应用于人工智能领域,拥有先进的技术,我们可以看见现在看到高速的增长比率。
我们现在可以清楚地通过计算机资源察觉到。这给你一个可视性的感觉:食物是如何在加速回返法则下快速变化的。
正如你清晰地察觉到,我们可以直观的感受到,先进的处理技术的发展和计算机因加速回返法则下的受益。下面是另一个令人震惊的启示:在某些时候,经济的计算机的处理能力将超过的不单单是一个人的力量,而是所有的人力量的累加。
我们能够在2025年实现人工总体智能(AGI),技术总会以越来越快的速度发展。
超级智能的崛起
正如我上面所解释的一样,谷歌的RankBrain只是一种形式的ANI,这意味着,它仅仅可以在一个特定区域内表现的比人更好,这就是:一个相对比较弱的形式的人工智能。
但是,我们有时也会被这种弱形式智能的快速发展而弄得措手不及。
在这里,你可以清楚地看到,谷歌的RankBrain,在一个特定的任务下的超级智能,仍然处在大背景之下,智力还是相对低下。
但是,当我们应用加速回返技术到人工智能领域会发生什么呢?蒂姆厄班通过思维实验向我们做出了解释:
'这样A.I.在智力方向上的正增长,我们会看到它比一般动物变得更具智慧。然后,当它能够超过人性的最低能力——尼克博斯特伦称之为 '白痴阶段'。'哇哦,这可爱的像是一个愚蠢的人'。唯一的一点是,在智力的大框架下,所有的人类的智慧,从白痴之地到爱因斯坦所拥有的,仅仅是一个非常小的范围 。正如AGI所宣布的,现在它已经发展超过了白痴阶段的智商水平,总有一天它会变得比爱因斯坦更聪明,甚至发展到无法想象的地步。
所以,这对SEO意味着什么?人工智能就是在我们身边?
SEO已经被彻底的改变。
在我们开始预测未来时,让我们先了解RankBrain是如何已经改变了SEO搜索引擎优化。我同卡耐基梅隆大学的校友们和我的朋友现任首席技术官员CTO以及为财富500强的SEO团队提供搜索引擎的公司Market Brew的创始人之一的斯科特斯托弗,共同讨论。作为一个资深搜索引擎工程师,他对过去的10年的发展与其他专家有独到的见解。以下是他的一些关于SEO行业的建议,尤其在谷歌开始重点关注人工智能之后。
今天的回归分析存在严重的缺陷。
这是我们行业中目前最大的谬论。在每一次谷歌排名的变化都会引起预言家的热议。通常情况下,一些来自我们这个行业的著名的公司的数据科学家和CTO声称他们对于谷歌采取的新行为'有充分的理由'保持信心。典型的分析包括通过每月引发事件的排名数据,然后看看排名在不同类型的网站是如何变化的。
通过目前的方法回归分析,这些数据科学家指出一种已受到(正或负)影响的网站的特定类型,并坚信谷歌的最新算法转变归因于一个特定类型的共享算法(内容或反向等)。
然而,这已经不再是谷歌的工作方式了。谷歌的RankBrain,一种机器学习或深的学习方式是非常不同。
在谷歌之内,存在着若干核心算法。这是RankBrain的任务:什么样的核心算法最适用于某种特定类型的搜索结果。例如,对于某些搜索结果,RankBrain可能会发现的最重要的信号META。
添加到META匹配算法会带来更好的搜索体验。但在另一个搜索结果中,这种相同的信号可能会带来不愉快的搜索体验。因此,在其它维度下,另一种算法,可能的PageRank,可能会更有用。
这意味着,对于每个搜索结果,谷歌有一个完全不同的算法组合。现在,你可以了解到为什么在每一个网站做回归分析时,在没有特定的搜索结果背景下,是多么的不足。
由于这些原因,如今的回归分析,必须以每一个具体搜索结果作为分析背景。斯托弗最近写了一篇关于衡量谷歌算法的变化的一个搜索建模方法。首先,你可以确定采取什么样的搜索引擎模型,以过去的特定关键字搜索为基础。然后,在得出新的排名之后,重新校准它,指出两种搜索引擎模型设置之间的变化值。在特定的排名变化之下,使用这种方法。你可以了解到哪些特定的算法正在推广或是在被减少使用。
当人类试图预测未来,他们总是会低估。
有了这方面的知识,我们就可以专注于提高一些网站上的特定部分SEO以获得相关类别的搜索结果。但是,同样的方法不会(也不能)展现出其他搜索结果。这是因为RankBrain是在搜索结果(或关键字)的层面上操作。这是字面上为每个搜索结果匹配特定的算法。
保持类别特性,以避免误判
谷歌也意识到,他们可以教他们新型深度学习系统RankBrain,什么是'好'的网站,什么是'坏'的网站。与他们如何为每个搜索结果衡量不同的算法相似,他们也认识到,每个维度自身对'好'与'坏'的网站都有不同的例子做辅证。这无疑是因为不同的维度有不同的CRMs,不同的模板和不同的数据结构。
当RankBrain运行时,它基本上是学习什么样的'设置'是对于每个环境是合适的。正如你现在可能已经猜到的,这些设置都是完全依赖于其所运行的维度。因此,例如,在医疗行业,谷歌知道像WebMD.com一个著名的站点,他们会将之放在搜索顺序陈列表的前端。任何看起来像WebMD的站点的结构将会被认定为'好'的网站。同样的,看起来像在健康领域与已知垃圾网站的结构相似的的任何网站将会被视为'坏'的网站。
RankBrain可以将'好'与'坏'的网站分类,并利用其深层的学习能力来具体判断。但是如果一个网站汇总到许多不同的领域的信息,搜索引擎该如何决策?
首先,我们要讨论这个深度学习到底如何运作的。在网站被划分为一个'好'与'坏'之前,RankBrain必须先确定每个站点的分类是什么。像Nike.com以及WebMD.com网站是很容易。虽然每个站点有许多不同的子类别,一般的类别是非常简单的。这些类型的网站很容易归类。
但是,关于那些同时有许多不同类别的网站如何归类?一个很好的例子是How-To sites操作方法的网站。该网站通常有许多信息大类。在这些情况下,深度学习过程将不再适用。在这类网站上谷歌如何检测数据?答案是:它看似是随意。它可能会选择一种类别或其他。对于知名网站,像维基百科,谷歌可以选择退出该分类过程,以确保深度学习过程不会削弱现有的搜索体验(又名'大到不能倒')。
SEO领域开始逐渐变得特别技术化
但对于鲜为人知的实体,会发生什么?答案是'谁知道?' 据推测,在机器与其他网站对比时,机器的处理还会自动的分类,比方说,一个操作方法网站How-To看起来像WebMD的网站。这太好了,不是吗?
如果分类过程中认为这个网站是关于鞋子的,那么它会与耐克的网站结构进行比较,而不是WebMD的。它可能看起来与一个垃圾鞋的网站有相似的结构,这与一个有信誉的网站不同,在这种情况下,过于概括的网站很容易被标记为垃圾邮件。如果操作方法网站有不同的领域,那么它会轻松地使每个类型看起来像行业最佳。保持自身行业的类别。
这些反向闻起来很腥
让我们来看看这如何影响反向链接。基于上述分类程序,它比以往任何时候都更重要的是你在'联系邻居',RankBrain就会知道在维度中的反向信息不同。
让我们再举一个与以上相同的例子。假设一家公司有一个关于鞋的网站。我们知道,RankBrain的深度学习过程会尝试比较这个站点与其他行业的最佳和最差网站。因此,很自然,这个网站的反向配置文件会与这些最佳和最差网站的反向链接配置文件相对比。
我们也可以说,一个典型的有信誉的鞋子网站从以下周围反向链接:
体育
健康
时尚
现在,该公司的SEO团队决定开始从所有这些周围网站中寻找的反向链接,再加上一个新的社区 - 从CEO以前对汽车行业的链接。他们也是很'聪明':他们构建出交叉市场营销'为所有新租约免费提供鞋'的页面出现在汽车网页。'然后连接到一批鞋。这是完全相关的,不是吗?
谷歌推出Gboard,一套让你在没有浏览器的情况下查找的IOS键盘。RankBrain会注意到这个反向配置文件看起来比典型的信誉型鞋店网站有很大不同。更糟糕的是,它发现了一堆垃圾鞋的网站也有从汽车网站的反向链接配置文件。
就像这样,甚至不知道什么是'正确的'反向配置文件,RankBrain就已经察觉出了什么是'好',什么是'坏'的搜索引擎结果。新鞋的网站被标记,其网络情况急转直下。
SEO和人工智能的未来
正如我们从前面的讨论中了解到的关于加速回返法则的相关情况, RankBrain和其他形式的人工智能会在某个时候超越人类大脑。在这一点上,没有人知道该技术将引领我们到何方。
有些东西是已经确定的的,虽然:
每个竞争的关键字环境将需要依靠自己的力量进行审查;
大多数网站都需要保持自身的类别,以避免误判;
每个站点都应该学习本行业最佳网站的结构和组成。
在某些方面,深度学习模式,让SEO的处理变得简便。明知RankBrain以及其他类似的技术几乎可以与人类看齐,法则是明确的:使漏洞越来越少。
在其他方面,事情可能会有点困难。 SEO领域将继续变得非常技能化。分析和大数据是当下的潮流,任何不熟悉这些方法的SEO仍有很多追赶工作要做。那些拥有这些技能的人可以期待一个更大的商机。