更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群
一、前言
-
背景:
AB实验具有一定前瞻性,统计性,科学性的特性。用好了就实现了在大数据时代的充分利用数据分析问题,解决问题,为决策提供强有力的依据,但是有时候用户在使用AB实验时候,会出现一些痛点和疑惑。
-
痛点:
每次实验需要多少流量
实验时间开多长没有概念
-
解决问题:
为了验证某一个功能特性,一个实验需要开多少流量。
一个实验需要开多长时间
二、统计基础概念
1、研究对象
总体X:研究问题某个数量指标。
2、入手点
个体:总体中的一个元素 xi
样本:一部分个体 Xi
3、统计量(工具)
常见统计量:
(1)样本均值
反映出总体X数学期望。
(2)样本方差
方差 是各数据偏离平均值 差值的平方和 的平均数。反映的是总体X方差。
样本修正
得出
(3)样本均方差
均方差就是标准差,标准差就是均方差。
对上面公式开平方。
(4)样本 K 阶矩
(5)样本 K 阶中心矩
4、抽样分布
这里不做详细的叙述,后续推导中需要使用到以上概念,具体可以参考网上介绍。
-
标准正态分布N(0, 1)
-
Ka方分布
-
t-分布
-
F-分布
5、抽样定理
简单介绍几个抽样定理
6、参数估计
通俗的说:样本参数去估计总体的参数。
举个
标签:注册,方差,样本,秘密,实验,转换率,样本量 From: https://www.cnblogs.com/bytedata/p/16665514.html