首页 > 其他分享 >统计学 David Freedman

统计学 David Freedman

时间:2022-11-12 17:24:02浏览次数:49  
标签:混杂 试验 平均数 相关系数 David 统计学 偏离 Freedman SD

第一章

1. 研究试验

也叫前瞻性研究。可以证明因果关系,试验设计会控制混杂变量。

1.1 随机双盲/随机随机试验

把混杂因素尽可能均分在各个实验组,每个组在基线时,变异一致。尽量让研究干预成为唯一的影响因素。

也就是在零假设下,只存在抽样误差,而基线时每个组中变异基本相同,进而计算得到这种样本的概率,从而推翻原假设。

1.2 变异的变化

称为分布。就是变异的规律

2. 观测试验

也叫回顾性研究。只能证明相关关系,不能证明因果关系,因为混杂因素不可控。例如定期体检可能是良好教育和收入的表征,定期锻炼是健康的表征,等等。

一些混杂因素在一开始就影响了谁是试验组,谁是对照组。

3.

比例、数量比较时,考虑总量。

由部分推断整体时,注意各个subgroup构成比

在观察试验、非随机对照试验中注意受试者是如何被分组的。进而考虑组之间的可比性。有什么混杂因素,如何消除混杂因素。

第二章 描述性统计

1. 直方图用面积而不是高度描述数据。不需要Y轴。高度表示拥挤程度(每单位数量多),面积表示数目。像北京和中国。

2. 平均数使分布保持平衡的点,中位数是使两边面积相等。

3. 均方根RMS比平均数稍大些。

4. 标准单位是偏离平均数多少个标准差。

5. Z分数就是偏离平均数多少个标准差。对应的面积就是百分数,某个点之上或之下就是百分位数。

6. 随机误差的作用方向随机,可能正向可能负。系统误差是作用方向不变。重复测量衡量随机误差。

第二章 相关和回归

1. 散点图:数据越分散,相关关系越弱。一个弱相关关系基本没啥意义。

2. 相关系数:

只是直线相关,信息量不如散点图丰富。

X和Y转换为标准单位:以SD为单位,度量数据偏离平均数的程度,

相关系数就是其积的平均值。其积,采用乘积的形式,一是反应偏离大小,而是反应偏离方向。

 相关系数就是其积的平均值,值越大,说明偏离方向越一致。r越大,数据分布越聚集。

相关系数是按相对SD的值度量,而不是绝对值度量。因此r相同,但可能一个SD大,一个SD小。(两个r相同group,合到一起,r还是不变)

 上述公式转换:

 

SD是反应离散程度,越大越分散;

Cov是两个变量的离散程度。一是反应偏离大小,而是反应偏离方向。

 例子:

五个城市的吸烟率和死亡率强正相关。

错误:五个城市只有五个数据点,SD变了。应该用每个人的数据。可直接计算个人吸烟时长和寿命。

标签:混杂,试验,平均数,相关系数,David,统计学,偏离,Freedman,SD
From: https://www.cnblogs.com/SAS-T/p/16756993.html

相关文章

  • 评价统计量优劣的几个标准——统计学(十二)
    在推断性统计中,我们需要从样本中加工提取其反映总体的信息,这就需用到统计量,发挥统计量的作用。这就提出了一个问题,什么样的统计量能达成我们的述求,能完美地提取出总体的规......
  • 一本统计书的的中文翻译:The Elements of Statistical Learning (ESL) 《统计学习的
    一本统计书的的中文翻译:TheElementsofStatisticalLearning(ESL):https://github.com/szcf-weiya/ESL-CN 英文原版本(第2版,电子版)地址   https://hastie.su.doma......
  • 复现经典:《统计学习方法》第 7 章 支持向量机
    本文是李航老师的《统计学习方法》[1]一书的代码复现。作者:黄海广[2]备注:代码都可以在github[3]中下载。我将陆续将代码发布在公众号“机器学习初学者”,敬请关注。代码目录......
  • 最大似然估计——统计学(十一)
    极大似然估计法(thePrincipleofMaximumLikelihood)由高斯和费希尔(R.A.Figher)先后提出,是被使用最广泛的一种参数估计方法,该方法建立的依据是直观的最大似然原理。通俗理......
  • 深度学习从入门到精通——统计学习方法概论
    统计学习方法概论文章目录​​统计学习方法概论​​​​前言​​​​章节目录​​​​导读​​​​实现统计学习方法的步骤​​​​统计学习方法三要素​​​​模型​​​​......
  • 统计学习方法——机器学习和统计学习
    1.统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行分析与预测的一门学科。统计学习包括监督学习、非监督学习、半监督学习和强化学习。2.统计学习方法三要......
  • 统计学习方法与实战——统计学习方法之感知机
    感知机​​感知机​​​​三要素分析​​​​模型​​​​策略​​​​损失函数选择​​​​算法​​​​原始形式​​​​对偶形式​​​​相关问题​​​​例子​​​​ir......
  • 统计学习与方法实战——统计学习方法概论
    统计学习方法概论题​​统计学习方法概论​​​​实现统计学习方法的步骤​​​​统计学习方法三要素​​​​模型​​​​策略​​​​损失函数与风险函数​​​​定义​​......
  • 统计学习方法学习笔记-09-EM算法及其推广
    首先叙述EM算法,然后讨论EM算法的收敛性,作为EM算法的应用,介绍高斯混合模型的学习,最后介绍EM算法的推广-GEM算法EM算法的引入目的:概率模型有时候既含有观测变量,也含有隐变......
  • 统计学习方法学习笔记-08-提升方法
    首先介绍提升算法的思路和代表性的提升算法AdaBoost,然后分析AdaBoost为什么可以提高学习精度,从前向分步加法模型的角度解释AdaBoost,最后介绍提升方法更具体的实力,提升树boo......