码迷SEO内参(15) 百度点击统计系统深入解析(快排原理)

作者: 用户投稿 阅读:184 点赞:0

上一节码迷讲了市井上快速排名系统的发展路程,知己知彼,百战不殆,今天开始讲度娘内部的点击统计系统。为啥要讲百度点击统计系统,因为无论是360、搜狗、神马,很多流程跟着百度学的。

你知道百度内部怎么玩,其他搜索引擎可以说小菜一碟。

其次,做实验绝对不可以像部分人靠硬怼,大家有兴趣可以看一下Zero大神的《查询词、检索词与加#搜索》这篇文章,大神之所以是大神,因为磨刀不误砍柴工。再说一下百度的惊雷算法,读完本篇你就明白为啥叫惊雷了。

最近玄幻的快排技巧

技巧1:我发觉就是,快排助手点击360 超快排点击搜狗 互点宝点击百度,效果不错

技巧2:除了底子好的,上快排稳定,还有真正SEO大佬外。新站排名很少有稳定的

技巧3:现在所有的快排,效果在5成以上的很少,但是多家一起刷就能超过5成了

《孙子·谋攻篇》中还说:“ 不知彼而知己,一胜一负;不知彼,不知己,每战必殆。” 。90%的快排都被百度打的抬不起头来,但也有一些有用,但是稳定上排名超过15天的很少很少。

很明显,快排系统已经“不知彼,不知己”了,赶不上百度内部算法调整了哦。不过码迷建议大家不要病急乱投医,码迷先说一个现象吧。

“RanSpiegler智商税”模型

论文可以到谷歌学术搜“The market for quacks”,讲的是如果医学行业中,病只要结果随机,大家都靠案例来决策,“神医”就会存在。货比三家无法彻底解决这个问题,引入真神医更是毫无用处。

简单说,吹真的能挣钱。如果推广到SEO行业,更符合现在的情况。

即使大部分快排没有持续性的效果,但是一旦有快排商家提供了案例(无论真假),交智商税的人就会蜂拥而至,即使有人拦着韭菜们也无济于事。

码迷在群里多次讲过,现在看快排不是上了首页就高兴,一定要观察7天以上稳定了,才算成功。但是还是有人捂不住钱包,大把大把的霍霍。

码迷对百度的评价

在讲点击统计之前,说说百度的情况,通过这些大家也略知一二。

首先,度娘人才流失严重

度娘曾经是码迷非常仰慕的互联网公司,码迷是09年毕业,那时候百度、谷歌、微软、摩托罗拉绝对是所有计算机专业同学的首选,只去了搜狗,但是因为不是计算机专业,所以连简历过审的机会都没有。但是2017之后,陆陆续续有爬虫部、Rank部同学从百度离职,今年10月份有个做测试的妹子也从百度跳到宇宙条了。

有些是因为没有归属感,更多是因为僵化的老白兔太多了,干活的年轻钉子却没有学到本事,在又臭又长的烂代码中活成了人肉干电池。所以,包袱太大,百度不会轻易放弃旧产品逻辑。

其次,度娘人才流失真严重

从执行力上,相比阿里巴巴明显差了十万八千里,比也差了N个360。百度站长后台频繁报错大家也看到了,反正对待站长的态度是爱用不用。但是更为严重的是百度推广平台也报错,连竞价广告的衣食父母都三心二意了,大家想想吧。所以,即使要上线新的产品逻辑,也是坎坷不顺的。为啥叫惊雷算法?负责下雨的童鞋真的跳槽到宇宙条了。

最后,只能僵着不大动弹了

百度搜索上目前还是国内的权威,每一种搜索技术的推出势必被国内其他搜索学习,况且很多头条好搜神马的同学都是从百度跳槽过去了。但是坦白说未来,技术大牛走的差不多了,以后学习原味的百度技术,去字节跳动宇宙条就行了,百度大牛遍地走哦。

SEO基础知识

需要先了解4个非常重要的排名因素,这都是通过百度内部算法总结而来,绝对不是空穴来风:

排名= 搜索词意图匹配度 + 点击通过率CTR + 相关性TFIDF得分 + 内链外链PageRank得分

码迷在《摩天楼内容助手官方教程》中有过简单的说明,基础小白建议去看视频,本身限于篇幅暂不解释。

这里的点击通过率CTR,百度不同时期有不同的计算公式,从2010年开始,总共经历了3代,码迷通过研究百度算法专利,以及通过某些呵呵哒途径的核实,对百度三代点击统计系统做一个简单的内幕总结。

百度第1代点击统计系统

1代点击统计系统最早见于2010年专利《CN102073699A-用于基于用户行为来改善搜索结果的方法、装置和设备》,因为当时SNS社交网络的流行,百度将网站热度分成了点击率、推荐率、收藏数三个维度。

百度配套的百度分享按钮也在2011年推出,如果是SEO老前辈,那时候会发现挂了百度分享按钮的网站,如果分享次数比较多,百度排名就会靠前。虽然说现在分享、收藏在排名中权重已经降低很多,但是百度仍然没有放弃(删功能也需要理由哦),程序就是这样堆起来的。

百度第1代点击统计系统的实现非常简单,也没有周期性清算程序,并且严重依赖于SNS传播热度,所以很容易被人为控制,市面上甚至可以1分钟上排名,不要太美。

百度第2代点击统计系统

根据码迷咨询之前在百度的童鞋,第二代点击统计系统成型于2012年到2013年之间,一直沿用至2019年年中,期间一直缝缝补补,至今大体框架并未更改多少。

而相应的快排系统也在2012年左右推出,一线SEO大佬真是盯得百度老紧了,推广学院的卡卡老师声称开发了国内首款快排程序(原文:https://www.tuiedu.org/100.html)。

百度第2代点击统计系统首次对用户点击系统进行了系统化分层,主要包括搜索单元、统计单元、排序单元、推送单元 ;

搜索单元,用于依据用户输入的查询词得到搜索结果 ;

统计单元,用于统计所述搜索结果的鼠标点击次数,所述鼠标点击次数等于鼠标点击,统一资源定位符 URL 次数加上鼠标点击摘要文本次数 ;

排序单元,用于依据所述鼠标点击次数对搜索结果排序 ;

推送单元,用于将排序后的搜索结果提供给用户。

因素1:点击行为不仅仅是点网址

百度专利里面明确说了,所述鼠标点击次数等于鼠标点击,统一资源定位符 URL 次数加上鼠标点击摘要文本次数。也就是不仅是点网址,点摘要文本,甚至选中摘要文本也算哦。

因素2:点击率并不是重点

现在很多人追求点展比,其实对于百度来讲,在一段时间内,某个搜索词下的搜索结果只有点击次数多少之分,统计点展比反而耗费更多的时间。

简单的来讲,你比对手刷的点击次数多就行了。

因素3:统计具有周期性

为什么说快速排名不能停,原因就在这里,一旦没有了点击日志,随着时间的推移,次数逐渐清零。所以药不能停。

不过码迷强调一下,百度说“一段时间可以依据需求进行配置,如一天、一周或一个月等”,什么意思

第一:不同行业点击次数统计周期不同

第二:某些行业一天一统计,某些行业一个月一统计,其他七天一统计

因素4:查询词隔离与相关

比如说有个页面是北京租房,它在“北京租房”这个词的点击率很高,于是这个词的排名上升,这是合理的。但是,它“北京租房”的点击率不应该影响到其在“租房”或“北京”这两个词的排名。因此,快排这个排名因素是只作用于“查询词”级别的。但是百度并没有这么做。

通过“www.x.com 北京租房”,点击之后,还是会给网站增加微弱的权重,这就带来的比较微妙的局面,搜索“北京租房”,我本来在76页开外,竟然通过站内搜索可以刷到百名之内,再刷到首页了。

因素5:用户信任度判定

现在主流的快速排名系统都是批量的随机这是cookie,但是百度2016年开始对用户信任度有涉及。

比如有个用户一段时间内搜索体育用品相关的词汇,那么当他立马搜索机械相关行业词语,产生点击后的点击信任度就会偏低。

这就需要快排系统在产生点击之前,尽量先搜索相关词,而后,再对目标关键词以及目标网址进行点击。

因素6:合理的阅读时长

因为不同的文章具有不同的长度和质量,用户阅读所述文章的时长也各不相同。尤其是,用户的阅读满意度并不只体现在点击率上,更体现在阅读的时长上。用户越喜欢,阅读的时长也就越长。

百度第2代点击统计系统的缺点

可以说,百度第2代点击统计系统相对于第1代点击系统有了很大很大的进步,但是查询词隔离的特性,导致部分搜索质量没法有效的提升。

另外逻辑也是简单粗暴,仅仅从周期性点击率统计决定网页CTR得分,太容易被人为利用了,当海量的快排系统打上来的时候,百度只能在IP、cookie信任度、用户点击路径上疯狂的做检测补丁。

百度惊雷算法自2017年底推出以来,一直缝缝补补,治标不治本,导致了快排的疯狂。

最近快排系统的崩溃

经历了折腾三年又三年,百度终于痛定思痛将2代点击统计系统重新翻盘思考,直至今年下半年3代点击统计系统踉跄出世,随着大多数快排系统的溃败,百度终于掰回了一局。

下一节我们对百度第3代点击统计系统再做深入的分析。

本站内容均为「码迷SEO」网友免费分享整理,仅用于学习交流,如有疑问,请联系我们48小时处理!!!!

标签: 百度 SEO seo 系统 原理

  • 评论列表 (0