认识 Google Analytics的『采样数据』- 初学者篇

作者: 用户投稿 阅读:83 点赞:85

"采样数据"是为了能更快速地完成数据分析的工作,常用于数据过于庞大时,为了降低分析成本以及效率,我们可能会取其中一部份的样本来进行分析,基本上只要取的样本足够代表全部数据群体,分析出来的结果就能够有一定的参考价值。在中国你常常能看到新闻说,此问卷样本为万人、或是某市长的民调显示,这些都是采样数据。

举例来说,如果你想知道中国人口的2300万人的行为数据,但2300万人的数据过于庞大、处理起来会花费更高的成本与时间,因此你取了20%的460万人口来做分析、理解他们的行为,并用这20%的人口样本做为参考来理解全部2300万人,在概念上,20%的采样必须包含所有可能影响到数据的族群特征,比方说这20%的采样里面必须包含所有的年龄层、性别、生活型态,这就是所谓的采样数据。

题外话:前几个月因Harris在撰写Google Analytics的书籍(预计2017年底前出版),所以文章有一段时间没有更新,从九月初开始我将回来博客继续撰写每周一篇的文章~,大家敬请期待。

Google Analytics 的采样数据可能对你的分析工作造成伤害

Google Analytics里面一样会有采样数据的状况,虽然采样数据能够让全部分析过程加速进行、并具备高效率的特征,但采样数据的问题在于,你所得到的数据并不会是绝对精准,有极大的可能你所看到的采样数据,与没有被采样到的数据具备着完全不同的特征与结果。

如下图,从Google Analytics报表的右上方我们可以看到该报表是否有被采样(几乎所有的报表右上方都会有这个字段),上面会显示“这份报表是以xx%的工作阶段来计算,只要这里显示的不是以100%的工作阶段来计算,就代表你当下正在看的报表,是有采样数据的问题。

在网站分析上采样数据并不是一件有正面影响的事情,因为这代表你看到的数据并不精准,尤其当你要计算网站收益、广告成效这些重要指针时,采样数据更可能错误的影响你的决策。

Google Analytics 的采样数据如何运作

Google Analytics在收集数据时,会先将数据整理、运算好,并预先保存到数据库里面,当你在使用缺省报表时(像是目标对象、客户开发里的缺省标准报表),Google Analytics因为已经把这些数据提前运算并整理好,所以你可以在很短的时间内看到数据报表(Google Analytics的数据这么庞大,但还能一点报表就立刻跑出数据,就是这个原因)。

但如果你今天使用了次要维度、或高端区隔来筛选出客制化 的数据,因为Google Analytics并没有预先把你要的数据运算好,为了加速报表呈现给你的速度,它就会采样部分的数据来运算你的需求给你,这当然也是为了更快地呈现出报表。

甚么样的状况Google Analytics可能会使用采样数据?

当数据太庞大、或你提出客制化的数据需求时(比方说高端区隔或是次要维度),Google Analytics会先查看这些数据条件是否需要采样,如果Google Analytics判定需要,它会为了加快给你数据报表的时间,采用采样数据,这些特定状况如下:

  • 在指定日期范围中,资源层级的工作阶段量非常过 500,000个。
  • 你在缺省的报表内使用了客制化的高端区隔、或次要维度。
  • 在自订报表内的筛选器使用了客制化的筛选条件。
  • 在多渠道进程报表中,你所选取的指定日期范围中,非常过一百万个转换。
  • 在行为流程报表中,你所选取的指定日期范围中,非常过十万个工作阶段。

如何解决Google Analytics的采样数据问题?

采样数据并不能完整地被解决,这是Google Analytics的缺陷之一,但你可以用以下的方式来稍微改善采样数据的问题:

1.调整采样数据的设置

在报表的右上方,如果你看到数据并不是来自于100%,你可以选择“精准度更高"来降低采样的状况,假设你原先设置为“回应速度更快",并且采样为1%的工作阶段,在你更改为精准度更高之后,Google Analytics会根据你的需求,花上更多时间运算,并把采样的比例调高到4%。基本上采样的比例越高,数据会越精准,若没有赶时间的话,我建议你都选取“精准度更高"来给Google Analytics多一点时间运算、并观察采样比例较高的数据数据。

2. 缩短观察的时间比例

有时候采样数据会发生在你所选取的时间范围太长,假设你一次选取了一整年的数据数据来观察,因数据过于庞大,Google Analytics为了加快运算,会用采样数据,我建议你不妨把观察的时间范围缩短,来减少数据量、并取得更精准的数据。

3. 尽量使用缺省报表

如果你的需求都能被缺省报表满足的话,你可以尽量只使用缺省报表来减少数据采样的发生状况。

无论如何,在使用Google Analytics时,你一定要注意采样的问题,尤其如果部门在计算KPI、ROI、各个流量渠道成效时,采样更有可能伤害到你的指针计算,如果你的网站流量很大,更会提高数据采样的机率,因此你一定要注意。

本站内容均为「码迷SEO」网友免费分享整理,仅用于学习交流,如有疑问,请联系我们48小时处理!!!!

标签: 数据

  • 评论列表 (0