首页 > 其他分享 >abtest相关知识

abtest相关知识

时间:2024-07-28 17:01:02浏览次数:13  
标签:改动 知识 abtest 检验 显著 指标 概率 样本量 相关

步骤:

1.确认改动点(只能是单一因素)

2.设计核心指标(点击率/转化率,一般分为直接值和比率值)

3.计算实验所需最少样本流量(防止影响过大)

基于大数定律(次数多了,频率就等于概率)和中心极限定律(抽样的均值和方差服从整体),前提是样本量足够大, 这个足够大是多少,公式如下:

(组间指的是预期组和对照实验组),α为犯第一类错误的概率,B为犯第二类错误的概率,其中方差计算方式为:

如果是绝对值指标:

如果是比率指标:

4.结合日活量计算实验持续周期

5.流量分层(作用是防止辛普森悖论,即分客群的表现都是a组好,但合计是b组好,这个原因是分配不均匀)(层与层之间要正交,即功能之间不能有影响,比如有些做推荐策略层,有些搞UI)

6.灰度实验(小流量,验证没有极端影响)

7.检验(显著性检验)

即分析有多大概率是由于随机因素导致这样的差异。假设改动没有效果,即B的效果不会比A好,然后通过样本测试结果推翻这个假设,。由于样本量较大(大于30),故使用Z检验,样本量小则用T检验。Z值得计算公式如下:

当其为绝对值类指标

当其为比率类指标时

加入计算出来Z=1.22,小于95%置信水平对应理论Z值1.96,则上述样本不足以得出B比A好的结论,此时应该继续实验,当样本量增大时,Z会变大,成功!

面试考点:

1、第一类错误vs第二类错误:

前者是指一个改动本来不能带来收益,但我们认为它能带来收益,后者指好产品由于统计误差导致我们误认为不能带来收益,前者更不能接受

2.统计显著=实际显著?

可能是我们选用的样本量太大导致,实际案例中会不显著

3.AB测试统计上不显著,如何判断实验收益

byday去拆指标变化情况,如果一直高于原曲线,则能上线

4、实验组高于对照组就一定能上线吗?

不一定,比如想优化页面美观度,这可能是以内容展现等待时间为代价的,因此要对所有方面综合评估才可

5.AB测试是必须的吗?因为成本很高

如果是小改动,可以设置开关来让用户选

6.隐含着的题:如果面试官问你如何衡量成效,都可以用

标签:改动,知识,abtest,检验,显著,指标,概率,样本量,相关
From: https://blog.csdn.net/m0_60792028/article/details/140681841

相关文章

  • linux服务器使用docker部署ES相关记录
    ES/可视化工具Kibana/ik分词器最好使用相同版本部署,实在找不到资源可基于ES版本,其余可向下兼容找最高版本docker创建网络因为我们还需要部署kibana容器,因此需要让es和kibana容器互联。这里先创建一个网络:dockernetworkcreatees-netES配置文件夹数据卷挂载:需先复制config......
  • PCB设计小知识(四)
    作者:林良胜SI信号完整性的定义:信号完整性(SignalIntegrity)简称SI。如今的高速电路中,信号的频率、速率、功耗都在不断的增加,对信号完整性的要求也越来越高,信号完整性的也逐渐让工程师们不得不重视起来。信号完整性是指信号在传输、接收、处理过程中,保持着传输信息内容不受......
  • ECCV 2024|是真看到了,还是以为自己看到了?多模态大模型对文本预训练知识的过度依赖该解
    随着大型语言模型(LLMs)的进步,多模态大型语言模型(MLLMs)迅速发展。它们使用预训练的视觉编码器处理图像,并将图像与文本信息一同作为Token嵌入输入至LLMs,从而扩展了模型处理图像输入的对话能力。这种能力的提升为自动驾驶和医疗助手等多种潜在应用领域带来了可能性。点击访问......
  • 基于知识图谱的垃圾自动分类系统设计与实现(开题报告)
    本科毕业论文(设计)开题报告论文题目:基于知识图谱的垃圾自动分类系统设计与实现1.选题背景和意义(1)选题背景:知识图谱是一种将实体、概念和它们之间关系表示为图形结构的知识表示方法。在知识图谱中,实体通常表示为节点,而实体之间的关系则表示为连接这些节点的边。这些节......
  • 基于知识图谱的垃圾自动分类系统设计与实现(中期检查表)
    2023届本科毕业论文(设计)中期检查表学生姓名学号指导教师学院专业班级开题报告完成工作进度1.完成进度概述截至中期检查日期,本人在基于知识图谱的垃圾自动分类系统设计与实现方面已取得以下工作进展:文献综述与理论准备完成了对国内外相关文献的梳理与综述,深......
  • 学习【线程池】原理知识这一篇就够了
    线程池线程池原理知识1.线程池基础线程池是什么线程池解决了什么问题2.线程池核心设计与实现总体设计生命周期管理任务执行机制Worker线程管理3.线程池在业务中的实践业务背景实际问题及方案思考4.动态化线程池设计方案动态修改配置线程池信息监控线程池告警通知......
  • Python入门知识点 8--函数基础与函数参数
    一、初识函数(function)编程函数!=数学函数,里面的是逻辑功能,而不是套公式编程函数的作用是实现特定操作的一段代码有钱了给100个朋友都点一份这样的吃的,大家都是点一样的东西   1.薯条;   2.上校鸡块;   3.全鸡;一个个去点单会很麻烦这个时候就会用到套餐......
  • 每日一知识点 - Java常用关键字
    目录......
  • Linux文件系统相关知识:存储设备、文件系统、分区、挂载、块设备、部分相关简单指令。
    1.存储设备是什么?怎么理解分区和格式化?存储设备:指物理硬件设备,‌用于存储数据。‌这包括硬盘驱动器(‌HDD)‌、‌固态驱动器(‌SSD)‌、‌USB闪存驱动器、‌RAID阵列等。‌这些设备提供了实际的存储空间,‌可以用来存储操作系统、‌应用程序、‌文件、‌数据等。‌存储设备的容量......
  • CTF-PWN 堆的相关数据结构
    文章连接: 《堆的相关数据结构》参考:1.ctf.wiki:堆相关数据结构-CTFWiki2.星盟pwn佬:0011.哔哩哔哩-【个人向】CTFpwn入门-P11[高清版]_哔哩哔哩_bilibilimalloc_chunk概念:通过malloc申请的内存称为chunk,也可以将chunk称作堆的一个单位(自己随意理解)。free......