码迷SEO内参(15) 百度快排原理及百度第三代点击排名统计系统简析

作者:码迷 阅读:624 点赞:124

今天讲百度第三代点击排名统计系统,顺带把百度快排深度原理也刨析一下,自从19年10月份以来,百度对快排打击丝毫没有手软的迹象,码迷发现凡是采集+快排模式的网站至今无一幸免,70多天了也没有起色的现象。可以说百度这次对快排不是让你的快排失效,而是升级到惩罚性质了。

为了验证码迷的猜想,码迷特地搞了一套快排的源码,深入研究了一番。

无论是百度还是谷歌,算法一直在变,所以思路套路总有失效的时候。没有任何算法是一成不变的,也没有任何算法是绝对停滞的。但是百度在变与不变之间,它的理念、路线、战略,都依循用户体验这个原则上不断加以调适和修正

百度与谷歌的不同

在了解点击统计排序系统之前,码迷还是那句老话,通过线上案例现象总结SEO规律,通过SEO规律探讨百度搜索算法本质,通过百度算法本质探讨正确有效的SEO策略。

我们以“SEO优化”、“SEO 优化” 两个搜索词(仅有一个空格之差)为例,看一下百度结果的差异。如下图,虽然仅有一个空格之差,但是一半以上的搜索结果是不同的。

百度搜索结果差异

按照道理来讲,这两个词应该结果是一致的才对,码迷对此也询问了百度的同学,百度猿也觉得自己算法垃圾的一批,码迷认为这是百度的BUG也不为过。

咱们再看看谷歌吧,如下图,可以看到谷歌给出的“SEO优化”、“SEO 优化” 两个搜索词的搜索结果,仅仅是广告而已,其他几乎完全一致哦。

“SEO优化”、“SEO 优化” 两个搜索词,刷“SEO优化”点击的非常多,但是刷“SEO 优化” 相对很少,这就导致了百度两个页面巨大的差异。

相对应谷歌,因为谷歌并不会把点击数据直接应用于排名计算,所以导致谷歌排序结果更加稳健一些,很难收到点击排名的影响。在相同语义之下,百度与谷歌结果的差异,也说明了背后算法原理差异。这个算法差异,就是点击,就是百度的点击统计系统。

一、百度点击排名系统的构成

百度点击系统,码迷认为更标准的说法为百度点击统计排序系统,主要有4部分组成,点击收集+点击统计+点击排序+点击反作弊,是一套非常完善的流水化作业系统。

首先,点击收集模块

百度点击收集,主要搜集搜索结果的点击次数,所述鼠标点击次数等于鼠标点击统一资源定位符URL次数加上鼠标点击文本次数。也就是说,点击标题、点击描述摘要,都算点击

其次,点击统计模块

百度点击统计什么,就是百度从数据库获取一段时间内的鼠标点击日志,鼠标点击日志中包括用户标识、 点击的URL以及点击URL的时间,依据搜索结果的URL以及鼠标点击日志, 统计搜索结果的鼠标点击URL次数;

其中,一段时间可以依据需求进行配置, 如一天、一周或一个月等。这里3个点非常重要。

重点1:用户标识

某高层论坛上,李彦宏也说了:“中国人更开放呀,愿意用隐私换效率呢”。

什么是用户标识,简单说就是用户类型、IP类型、终端类型。百度对用户、IP、终端划分是非常细致的,不管你是临时用户还是注册用户,有时候单凭一个IP就知道你是谁了。百度真的是这么干的。

现在市面上的快排系统,可以说99%的都是通过随机cookie生成的用户,在百度看来都是临时短期用户。一个网站的用户全都是临时短期用户来的,百度信你个鬼啊。

重点2:周期性统计

另外一个重要的点是周期性统计,不知道大家注意到没有,之前1天刷100个点击,跟5天刷100个点击效果是一样的。

重点3:每次点击均有日志

你今天刷快排没有被百度识别,不代表明天百度就看不出来,因为你网站每一个点击都会硬邦邦的保存在百度日志系统中,而且日志只会归档,很少清空。

什么时候百度觉得你网站行为可疑,拿出历史旧账日志分析一番就可以了。

其次,点击反作弊模

这块这一章节码迷在《码迷:谈谈百度对快速排名的打击手段》里面都已经详细说过了,核心专利是《CN201910352770.5 用于处理点击行为数据的方法和装置》,大家可以到码迷SEO的QQ群里面下载,码迷在这里不多描述。

码迷要说的是,快排反作弊系统是最近2019年年中刚上的系统,百度算法工程师确确实实下了一番功夫才研究出来的反快排点击系统。

但是,百度这个反作弊系统没有从根本上杜绝点击作弊,他本质是个后续二审算法而已。主要有以下2个流程

流程1:点击数据聚类

网站刷快排点击之后,并不会被百度立马识别,而是在一定时间后(码迷认为一周左右),随着访问你网站的设备标识、用户访问路径与你网站URL通过机器学习,形成聚类之后。

流程2:作弊识别判定

你网站的用户行为形成的聚类,与百度已经训练好的多个“无作弊样本聚类”、“作弊样本聚类”做对比,如果命中了某个作弊聚类,你就玩完了。

最后:点击排序模块

点击排序,就是算各个搜索结果的权重值,百度也给出了公式哦。不过一些人说看不懂就不想看了。其实我还是建议大家认真看这个公式,我们只看因子就行了,内部算法细节不是最重要的哦。

你可以发现,点击得分与你鼠标的点击次数成正比,与全网整个关键词的点击次数成反比。也就是你比竞争对手点的次数多,你的关键词点击率更高,那你的得分点击就更高。

那么现在如何做快速排名,有些同学刷快排得不偿失,主要有三个层面的原因。

【本文为SVIP专享文章,仅显示部分内容,请老师到SVIP群获取全文】

2019年12月28之前SVIP 5重福利

福利1:免费领试用券

福利2:阅读内参全文权限

福利3:码迷整理66个百度精选专利

福利4:码迷SEO内参订阅折扣

福利5:提供案例送3个月

11月初,也就是码迷上线3个月左右,几乎每两天就有1个案例,至今截止已有50名SVIP会员获得了分享案例的额外福利,上首页周期在1~3个月左右。

SVIP/SSVIP下单链接:https://www.mamioo.com/prices

本文网址: https://www.mamioo.com/seojishu/section-16

本站内容均为「码迷SEO」原创整理,未经授权严禁采集转载,违者必究。