和GPT学习假设检验

时间：2023-11-23 10:31:54浏览次数：35

假设检验是统计学中的一种方法，用于判断观察到的数据是否支持我们对某个假设的看法。以下是一个实际的生活中的例子：

假设你是一家药品公司的研究员，你正在研发一种新的药物，希望它能比现有的药物更有效地治疗某种疾病。你的零假设H0可能是：“新药的效果和旧药一样”，对立假设H1可能是：“新药的效果比旧药好”。

为了进行假设检验，你可能会设计一个实验，随机地将一部分病人分配到新药组，另一部分病人分配到旧药组，然后观察他们的治疗效果。你会计算出新药组和旧药组的治疗效果的平均值和标准差，然后使用适当的统计方法（例如t检验）来计算p值。

如果p值小于预设的显著性水平（例如0.05），那么你就可以拒绝零假设，接受对立假设，认为新药的效果比旧药好。如果p值大于预设的显著性水平，那么你就不能拒绝零假设，不能确定新药的效果是否比旧药好。

需要注意的是，假设检验只能基于观察到的数据来判断假设是否成立，不能证明假设一定是真的或假的。此外，假设检验的结果可能受到样本大小、效应大小、测量误差等因素的影响。

使用适当的统计方法（例如t检验）来计算p值，具体如何做？
t检验是一种常用的假设检验方法，用于比较两个样本的均值是否有显著差异。以下是进行t检验的基本步骤：

1. 首先，我们需要计算两个样本的均值和标准差。假设新药组的样本大小为n1，均值为mean1，标准差为sd1；旧药组的样本大小为n2，均值为mean2，标准差为sd2。

2. 然后，我们计算两个样本均值的差异的标准误差（Standard Error，SE）。SE的计算公式为：

SE = sqrt(sd1^2/n1) + (sd2^2/n2)]

3. 接着，我们计算t统计量。t统计量的计算公式为：

t = (mean1 - mean2) / SE

4. 最后，我们根据t统计量和自由度（通常为n1+n2-2）查t分布表，得到对应的p值。或者，我们也可以使用统计软件直接计算p值。

如果p值小于预设的显著性水平（例如0.05），那么我们就可以拒绝零假设，认为新药和旧药的效果有显著差异。

以下是一个Python代码示例，使用scipy库进行t检验：

fromimport stats
 
# 假设这是我们从实验中得到的新药组和旧药组的数据
new_drug = [10, 11, 9, 12, 10, 11]
old_drug = [8, 9, 7, 9, 8, 8]
 
# 使用scipy的ttest_ind函数进行t检验
t_statistic, p_value = stats.ttest_ind(new_drug, old_drug)
 
print("t statistic:", t_statistic)
print("p value:", p_value)

t检验是如何想到的？尤其是其公式
这段代码会输出t统计量和p值。如果p值小于0.05，那么我们就可以认为新药的效果比旧药好。

t检验是由威廉·塞利·戈斯塞特（William Sealy Gosset）在20世纪初提出的，他当时在吉尼斯啤酒公司工作，需要处理小样本的实验数据。由于公司的保密政策，他以"Student"为笔名发表了这个方法，因此也被称为"Student's t-test"。

t检验的基本思想是比较两个样本的均值，看它们的差异是否大到足以认为这两个样本来自不同的总体。这个差异被标准化为t统计量，即差异除以标准误差。标准误差是一个度量，表示由于样本随机性产生的均值的不确定性。

t统计量的公式为：

t = (mean1 - mean2) / SE

其中，mean1和mean2是两个样本的均值，SE是均值差异的标准误差。SE的计算公式为：

SE = sqrt(sd1^2/n1) + (sd2^2/n2)]

其中，sd1和sd2是两个样本的标准差，n1和n2是两个样本的大小。

这个公式的推导基于了一些统计学的基本原理，例如中心极限定理（当样本足够大时，样本均值的分布接近正态分布）和方差的加性（两个独立随机变量的方差等于它们的方差之和）。当样本大小较小或总体分布不是正态分布时，t统计量的分布不再是标准正态分布，而是t分布，需要用特殊的t分布表来查找p值。

标签：样本,假设,假设检验,学习,旧药,GPT,均值,新药,SE
From： https://blog.51cto.com/u_11908275/8525371

动手学深度学习----计算机视觉
向着吃点心的时刻出发！——久岛鸥锚框数据集：首先人手动在图片数据中进行标注，标注的有物体的类型，物体对应的框（框的位置）框的位置表示方式很多，如左上角x,左上角y,高，宽这样表示我们手动标注的框为真实框，锚框是我们程序生成的，经过我们的处理需要与真实框进行匹配，并算出......
《2023-2024-1 20232415 《网络》第二周学习总结》
本周的网络空间安全课程的学习主要围绕密码科学技术展开。通过学习与探究，我了解了密码科学技术的基本原理，应用方式以及发展前景。教材学习中的问题：问题1：不同密码表对文字的加密方式各不相同，较为复杂，难以理解。问题1解决方案：通过反复阅读，探寻不同密码表之间的规律，可以有......
学习随笔（设计模式：抽象工厂模式）
内容今天学习了抽象工厂模式。1.抽象工厂模式提供一个创建一系列相关或相互依赖对象的接口，而无需指定他们具体的类。2.听起来有一些复杂，主要实现的功能就是在尽可能保证开放-封闭的原则下兼容具体的抽象动作。3.最终可以采用配置文件+反射+抽象工厂来实现对抽象产品的设......
Power BI - 5分钟学习将表第一行设置为标题列名
每天5分钟，上一篇介绍了如何将Excel导入PowerBI作为数据源。但是有的同学已经发现，导入的Excel数据在PowerBI最右侧Data区域可以正常显示，但是全都没有列名。那么我们如何解决这个问题呢？第2天-如何将导入PowerBI表的第一行设置为标题列名：1,【Home】->【Transform......
Nginx loki监控日志的学习
Nginxloki监控日志的学习背景学习自:https://mp.weixin.qq.com/s/Qt1r7vzWvCcJpNDilWHuxQ增加了一些自己的理解第一部分nginx日志的完善在logformat的后面增加一个:log_formatjson_analyticsescape=json'{''"msec":"$msec",'......
Markdown学习
Markdown学习1.标题语法：#+空格一级标题(#+空格),二级标题（##+空格）以此类推2.字体语法：字体前后加**是字体加粗如：Hello,World!语法：字体前后加*是字体斜体如：Hello,World!语法：字体前后加***是字体加粗斜体如：Hello,World!语法：字体前后加~~是废弃如：Hello,World3.引用语......
python005基于BS架构的在线学习与推荐系统-计算机毕业设计源码+LW文档
摘要现代经济快节奏发展以及不断完善升级的信息化技术，让传统数据信息的管理升级为软件存储，归纳，集中处理数据信息的管理方式。本在线学习与推荐系统就是在这样的大环境下诞生，其可以帮助管理者在短时间内处理完毕庞大的数据信息，使用这种软件工具可以帮助管理人员提高事务处理效率......
NS-3源码学习（三）Pcap文件分析
NS-3源码学习（三）Pcap文件分析Pcap文件生成NS-3生成.pcap文件相关函数有EnablePcap()和EnalePcapAll(),支持第一个函数的类有ns3::YansWifiPhyHelperPointToPointEmuHelperCsmaHelper支持第二个函数的类有ns3::YansWifiPhyHelperPointToPointInternetStackHelper......
2023-2024-1 20232327《网络空间安全导论》第二周学习总结
2023-2024-120232327《网络空间安全导论》第二周学习总结教材学习内容总结1.密码学历史悠久，主要分为古典密码、机械密码和线代密码；2.密码学研究主要有密码分析，密码理论，密码工程与应用以及密码管理；3.密码体制的分类：单钥密码体制和双钥密码体制；4.密码分析方法有穷举攻击法、......
差分与前缀和学习笔记
本来是不想写这篇博客的，但为了课前十分钟还是来水一发前缀和简介继续引用OI-Wiki的话（OI-Wiki$yyds$!）：前缀和可以简单理解为「数列的前$n$项的和」，是一种重要的预处理方式，能大大降低查询的时间复杂度。也就是说，我们能使用$O(n)$的时间进行预处理，在$O(1)$的时间内求出......

和GPT学习假设检验

相关文章

赞助商

阅读排行