码迷SEO内参(15) 百度快排原理及百度第三代点击排名统计系统简析

作者:码迷
作者:码迷SEO
发布时间:2019-10-30 16:14:53阅读:217点赞:41

今天讲百度第三代点击排名统计系统,顺带把百度快排深度原理也刨析一下,自从19年10月份以来,百度对快排打击丝毫没有手软的迹象,码迷发现凡是采集+快排模式的网站至今无一幸免,70多天了也没有起色的现象。可以说百度这次对快排不是让你的快排失效,而是升级到惩罚性质了。

为了验证码迷的猜想,码迷特地搞了一套快排的源码,深入研究了一番。

无论是百度还是谷歌,算法一直在变,所以思路套路总有失效的时候。没有任何算法是一成不变的,也没有任何算法是绝对停滞的。但是百度在变与不变之间,它的理念、路线、战略,都依循用户体验这个原则上不断加以调适和修正

百度与谷歌的不同

在了解点击统计排序系统之前,码迷还是那句老话,通过线上案例现象总结SEO规律,通过SEO规律探讨百度搜索算法本质,通过百度算法本质探讨正确有效的SEO策略。

我们以“SEO优化”、“SEO 优化” 两个搜索词(仅有一个空格之差)为例,看一下百度结果的差异。如下图,虽然仅有一个空格之差,但是一半以上的搜索结果是不同的。

百度搜索结果差异

按照道理来讲,这两个词应该结果是一致的才对,码迷对此也询问了百度的同学,百度猿也觉得自己算法垃圾的一批,码迷认为这是百度的BUG也不为过。

咱们再看看谷歌吧,如下图,可以看到谷歌给出的“SEO优化”、“SEO 优化” 两个搜索词的搜索结果,仅仅是广告而已,其他几乎完全一致哦。

“SEO优化”、“SEO 优化” 两个搜索词,刷“SEO优化”点击的非常多,但是刷“SEO 优化” 相对很少,这就导致了百度两个页面巨大的差异。

相对应谷歌,因为谷歌并不会把点击数据直接应用于排名计算,所以导致谷歌排序结果更加稳健一些,很难收到点击排名的影响。在相同语义之下,百度与谷歌结果的差异,也说明了背后算法原理差异。这个算法差异,就是点击,就是百度的点击统计系统。

一、百度点击排名系统的构成

百度点击系统,码迷认为更标准的说法为百度点击统计排序系统,主要有4部分组成,点击收集+点击统计+点击排序+点击反作弊,是一套非常完善的流水化作业系统。

首先,点击收集模块

百度点击收集,主要搜集搜索结果的点击次数,所述鼠标点击次数等于鼠标点击统一资源定位符URL次数加上鼠标点击文本次数。也就是说,点击标题、点击描述摘要,都算点击

其次,点击统计模块

百度点击统计什么,就是百度从数据库获取一段时间内的鼠标点击日志,鼠标点击日志中包括用户标识、 点击的URL以及点击URL的时间,依据搜索结果的URL以及鼠标点击日志, 统计搜索结果的鼠标点击URL次数;

其中,一段时间可以依据需求进行配置, 如一天、一周或一个月等。这里3个点非常重要。

重点1:用户标识

某高层论坛上,李彦宏也说了:“中国人更开放呀,愿意用隐私换效率呢”。

什么是用户标识,简单说就是用户类型、IP类型、终端类型。百度对用户、IP、终端划分是非常细致的,不管你是临时用户还是注册用户,有时候单凭一个IP就知道你是谁了。百度真的是这么干的。

现在市面上的快排系统,可以说99%的都是通过随机cookie生成的用户,在百度看来都是临时短期用户。一个网站的用户全都是临时短期用户来的,百度信你个鬼啊。

重点2:周期性统计

另外一个重要的点是周期性统计,不知道大家注意到没有,之前1天刷100个点击,跟5天刷100个点击效果是一样的。

重点3:每次点击均有日志

你今天刷快排没有被百度识别,不代表明天百度就看不出来,因为你网站每一个点击都会硬邦邦的保存在百度日志系统中,而且日志只会归档,很少清空。

什么时候百度觉得你网站行为可疑,拿出历史旧账日志分析一番就可以了。

其次,点击反作弊模

这块这一章节码迷在《码迷:谈谈百度对快速排名的打击手段》里面都已经详细说过了,核心专利是《CN201910352770.5 用于处理点击行为数据的方法和装置》,大家可以到码迷SEO的QQ群里面下载,码迷在这里不多描述。

码迷要说的是,快排反作弊系统是最近2019年年中刚上的系统,百度算法工程师确确实实下了一番功夫才研究出来的反快排点击系统。

但是,百度这个反作弊系统没有从根本上杜绝点击作弊,他本质是个后续二审算法而已。主要有以下2个流程

流程1:点击数据聚类

网站刷快排点击之后,并不会被百度立马识别,而是在一定时间后(码迷认为一周左右),随着访问你网站的设备标识、用户访问路径与你网站URL通过机器学习,形成聚类之后。

流程2:作弊识别判定

你网站的用户行为形成的聚类,与百度已经训练好的多个“无作弊样本聚类”、“作弊样本聚类”做对比,如果命中了某个作弊聚类,你就玩完了。

最后:点击排序模块

点击排序,就是算各个搜索结果的权重值,百度也给出了公式哦。不过一些人说看不懂就不想看了。其实我还是建议大家认真看这个公式,我们只看因子就行了,内部算法细节不是最重要的哦。

你可以发现,点击得分与你鼠标的点击次数成正比,与全网整个关键词的点击次数成反比。也就是你比竞争对手点的次数多,你的关键词点击率更高,那你的得分点击就更高。

那么现在如何做快速排名,有些同学刷快排得不偿失,主要有三个层面的原因。

【本文为SVIP专享文章,仅显示部分内容,请老师到SVIP群获取全文】

2019年12月28之前SVIP 5重福利

福利1:免费领试用券

福利2:阅读内参全文权限

福利3:码迷整理66个百度精选专利

福利4:码迷SEO内参订阅折扣

福利5:提供案例送3个月

11月初,也就是码迷上线3个月左右,几乎每两天就有1个案例,至今截止已有50名SVIP会员获得了分享案例的额外福利,上首页周期在1~3个月左右。

SVIP/SSVIP下单链接:https://www.mamioo.com/prices

本文网址:https://www.mamioo.com/seojishu/section-16

本站内容均为「码迷SEO」原创整理,未经授权严禁采集转载,违者必究。
评论
相关文章
  • 码迷SEO内参(16)2020年百万流量站项目优化破局之路

    码迷SEO内参(16)2020年百万流量站项目优化破局之路

    从2019年下半年开始,不知道大家有没有觉得,百度对新流量站的要求越来越严格了。本来要上百万级别的流量项目,很多新站即使坚持发布了3个月的原创文章也没有排名。而使用老域名做站也是九死一生,100个站里面,有四分之一能能有较好的趋势已经相当不容易。这种情况如何破局,请看本期码迷为大家讲解2020年流量站破局之路。继续阅读>>

    93浏览21赞2020-02-09 18:35:00
  • 码迷SEO内参(13) 快速排名系统野史,快排战度娘折腾3年之后又3年

    码迷SEO内参(13) 快速排名系统野史,快排战度娘折腾3年之后又3年

    今天码迷SEO内参开始讲快排,百度内部并没有快速排名系统,快排只是对应了搜索引擎内部的一套工序,这套工具叫 用户点击行为统计系统。针对的百度算法岗位叫CTR(点击通过率)算法。最早的CTR算法系统百度2010年左右有所涉及、2012~2013年开始完善布局。之前百度谷歌因为在中文系统算法上互相较劲借鉴,但是在谷歌退出中国之后(2012年),CTR技术上开始分道扬镳了。 今天的题目叫快速排名系统野史,快排战度娘折腾3年之后又3年,大家看着笑笑就好,别当真。继续阅读>>

    326浏览64赞2019-11-13 10:46:00
  • 码迷SEO内参(14) 快排整站优化提权与百度资源平衡性策略

    码迷SEO内参(14) 快排整站优化提权与百度资源平衡性策略

    今天码迷开始与大家分享快排整站优化提权的原理,其实快排并没有大家所想的那么神秘,因为即使是快排大佬们也没有足够的办法让排名一直维持在首页。更何况纯白帽的网站也一直跌跌撞撞被百度程序猿们折腾个不停。快排整站提权目前有效的,而且码迷预测在相当长的一段时间内一直有效,因为这与百度资源平衡性策略息息相关。继续阅读>>

    262浏览54赞2019-11-26 16:04:00
  • 码迷SEO内参(12) 如何做采集站:百度飓风3弱点&案例解析

    码迷SEO内参(12) 如何做采集站:百度飓风3弱点&案例解析

    经过上一节 码迷对《百度飓风3原创检测算法讲解》之后,很多小伙伴咨询码迷怎么做采集站,用什么样的方法才能过百度原创。今天主要讲解百度飓风3的一些弱点。百度算法不是百分百完美的,市面上已经有很多的采集的案例过了百度飓风3的检测了。继续阅读>>

    299浏览61赞2019-11-08 09:55:00
  • 码迷SEO内参(11) 百度飓风3原创检测算法讲解以及伪原创检测工具

    码迷SEO内参(11) 百度飓风3原创检测算法讲解以及伪原创检测工具

    上一节码迷跟大家探讨了单纯的同义词伪原创、AI伪原创都会被百度识别。这节咱就探讨百度飓风3原创检测算法的内部讲解,并且跟大家一块分析伪原创检测工具的好坏。码迷把摩天楼内容助手使用指南放到网上之后,百度收录了。网址是然后我通过在百度里面搜网页内容里面的句子,发现有的句子能飘红,有的句子不能飘红。这是为什么,如果你跟着码迷了解这些,你将会明白百度度飓风3原创算法的原理,以及伪原创检测工具哪个好了。继续阅读>>

    796浏览149赞2019-10-21 10:33:05
  • 码迷SEO内参(十) 独家相关性提权法原理以及SEO文章质量提升方法[小白必读]

    码迷SEO内参(十) 独家相关性提权法原理以及SEO文章质量提升方法[小白必读]

    大家好,我是码迷,我是摩天楼内容助手的作者,今天跟大家分享如何写SEO文章打造优质内容质量,如何打造一个秒排布局的方法,这个方法就是“相关性提权法”。这也是摩天楼内容助手的核心所在。 我们知道,网站内容是SEO基础,百度判断网页内容的好坏,衡量的标准是看搜索结果有没有满足用户的需求,这里百度官方文档里面也说了2个层次来判断网页内容质量。继续阅读>>

    2544浏览518赞2019-09-29 16:17:00