首页 > 其他分享 >AB实验基本流程

AB实验基本流程

时间:2023-02-16 17:14:14浏览次数:56  
标签:AB 方差 流程 均值 最小 检验 实验 样本量


    知识点
        基本流程
        实验分层问题
        最小样本量计算
            均值类
            比值类
        SRM检验
        指标检验
            比值类
            均值类
        关于统计检验显著性问题
        参考资料

基本流程

  1.     确定基本流程和假设,确认做这个功能是为了提升/降低什么指标。
  2.     开发相关功能
  3.     设计分层实验,进行流量分配。通过PowerAnalysis计算最小样本量。
  4.     实验达到最小样本量后,进行SRM检验,检验分流是否符合预期,若不符合预期,则回去检查分流系统正确性。
  5.     若通过SRM检验,进行效果分析,得出实验结论。

实验分层问题
  1.     流量正交要求层与层之间必须相互独立。
  2.     同一层可以有多个实验,但流量不能有交集。
  3.     一般采用MD5哈希算法来进行ID的分流。


  4.  流量分配采用先上小流量,再上大流量的方法进行。


最小样本量计算
均值类
    实验采用双边检验,原假设如下:

H0​:μA​−μB​=0
H1​:μA​−μB​<>0

    样本计算公式如下:
 

nA​=knB​  nB​=(1+1/k​)(σ(z1−2α​​+z1−β​​)/(μA​−μB​)​​)²

 


    其中, μ B ​是当前的数据, μ A ​是预期改进后的数据值。k为 n A ​和 n B​的比值,这个值一般情况下,我们都默认为1,即AB两组样本量相等,方便做严谨的实验对比, σ 需要根据历史数据估计。
    因此,计算均值类指标的最小样本量需要如下变量
        α ,显著性水平
        β ,第二类错误
        δ,预期提升值( μ A − μ B)
        σ , μ B,历史均值和标准差

同样的,根据已有的参数,我们也可以估计统计的功效 β \beta β是多少,若功效不足,也无法得到实验结论:

 
比值类

    实验采用双边检验,原假设如下:

H0​:pA​−pB​=0
H1​:pA​−pB​≠0​

 


    样本计算公式如下:
   

 

 


    其中, p B B​是当前的数据, p A​是预期改进后的数据值。k为 n A​和 n B​的比值,这个值一般情况下,我们都默认为1,即AB两组样本量相等,方便做严谨的实验对比,跟均值有所不同的是,比值类无需计算方差。
    因此,计算均值类指标的最小样本量需要如下变量
        α ,显著性水平
        β ,第二类错误
        δ,预期提升值( p A − p B ​)
        p B ​,历史均值

同样的,根据已有的参数,我们也可以估计统计的功效 β \beta β是多少,若功效不足,也无法得到实验结论:



    在计算得到最小样本量公式后,根据流量的分配及每日流入的用户数,估算需要天数。理论上需要涵盖完整行为周期(视情况而定,有一定的时间成本)。

SRM检验

    Sample Ratio Mismatch Test,简称样本分流不一致检验。主要检验实验人数分流是否符合预期。
    卡方检验:
        卡方检验,主要有两种用途。1. 推断总体分布与期望分布是否一致。 (test of goodness-of-fit) 2. 推断两个分类变量是否相关或独立。(test of independence/homogenetity) 实验中,主要用来做第一种检验。
        其原假设为:观察频数与期望频数没有差别。
        计算公式:
       

 

 

 


        其中 f o ​为实际观测值, f e 为期望值。df 为number of groups - 1。

指标检验
比值类

 

 


均值类

    1.首先要进行方差齐性检验:
    H 0 ​:对照组和实验组方差一致
    H 1 ​:对照组和实验组方差不一致

 

 


    根据F值计算P值,理论上只有在方差一致的情况下才能进行配对t检验。方差不一致时,可以对t检验做一些调整来计算。
    2.两个总体方差未知但相等:


  df 为 n 1 + n 2 − 2。
 3.两个总体方差未知且不等:
此时抽样已不服从自由度为 ( n 1 + n 2 − 2 ) 的t分布,而是近似服从自由度为f的t分布,f的计算公式:


    df为f

关于统计检验显著性问题

  1.     在实际业务中,统计指标显著性是一个重要参考,但并非决定因素,还取决于业务上的判断。
  2.     关于样本量太大导致实验组和对照组间细微的变化也会显著的解决方案:
  •           计算当前样本量/最小样本量= n, 然后将实验指标的检验变的更加严格, 即使用 α n e w = α / n \alpha_{new} = \alpha/n αnew​=α/n
  •           在样本中随机采样出最小所需样本量,进行统计分析。
  •           以上均是可能的解决方案,并没有严格的理论支持。


原文链接:https://blog.csdn.net/YoutiaoNo2/article/details/127070429

 

标签:AB,方差,流程,均值,最小,检验,实验,样本量
From: https://www.cnblogs.com/wenBlog/p/17127418.html

相关文章

  • 流程引擎Camunda 7 快速开始
    根据官方文档快速搭架一个基于BPMN的流程引擎camundahttps://docs.camunda.org/get-started/quick-start/下载地址https://camunda.com/download/#download-other-menu......
  • 零代码(低代码)工作流引擎(cube-flowable)
    cube-flowable工作流引擎简介cube-flowable工作流引擎旨在打造一套零代码、领先、且快速实用的引擎工具,助力开发者在面对工作流开发任务时,除去学习工作流框架知识和API......
  • CV-部署芯片接续-CV全流程部署-TF版本
    CV-部署芯片接续-CV全流程部署-TF版本1单个CNN算子importcv2importnumpyasnpimporttensorflowastfimportosfromtensorflow.python.frameworkimportgrap......
  • MATLAB 一些常用的处理数据函数
    记录一些简单的功能方便及时调出来看,并附上一些参考链接,这样就不用总是重复查了......多学一个就多补充一个。统计数组中指定元素数量参考链接:https://www.ilovematl......
  • PowerAutomate 流程中如何使用环境变量
    因为我们需要把一些密钥保护起来,所以如果用环境变量就很方便。这个需要新建一个solution,然后在里面定义环境变量。在流程中,可以这么使用你还可以设置这个组件,保护输入......
  • rabbitmq
    rabbitmq基础简介由LShift提供的一个消息队列协议(AMQP)的开源实现,由以高性能、健壮以及可伸缩性出名的Erlangrabbitmq包含的关键字消息队列使用过程组成部......
  • 关于nfs服务启动messages日志中报错-Unable to watch /proc/fs/nfsd/clients: No such
    操作系统环境:RedHatEnterpriseLinuxrelease8.xnfs-utils版本:nfs-utils-2.3.3-57.el8.x86_64最近笔者在服务器中安装了nfs-utils,然后也配置了/etc/exports文件也通......
  • Jenkins的PublishOverSSH插件的Lable用法
    插件准备ParameterizedTriggerPublishOverSSH项目配置参数插件ParameterizedTrigger的配置PublishOverSSH配置常规配置如下图,总共配置了两个服务器,Labl......
  • ABAP read_text 使用 快速开始
      PERFORM frm_read_text USING 'B01' lv_name 'EBANH' CHANGING ls_ZMMS001d-txz01.FORM frm_read_text USING fid fname fobject CHANGING c_text. ......
  • ES 文档存储流程
    对于一个数据存储系统来说,如何保证数据可靠性、提高读写吞吐量是重中之重。一、文档分布式存储的流程我们知道ES的索引有一个或者多个分片,而分片又分为主分片和副本分......