1. 绪论
1.1 统计学
研究数据的 收集
、 整理
、 分析
和 解释
的科学,是处理数据中 变异性
的科学和艺术。
统计分析可分为 统计描述
和统计推断
两部分
- 统计描述:用统计图表、统计指标或几个特征数描述资料的数据特征和分布规律
- 统计推断:用样本信息来推断总体特征
目的:求得可靠的结果
任务:在变异的背景上描述同一总体的同质性,揭示不同总体的变异性
1.2 为什么要学习生物统计
- 变异性(variation):个体之间存在差异,普遍性
- 不确定性:变异不能准确推断
- 复杂性:影响因素众多,存在未知因素:遗传、环境、噪音(随机因素)
1.3 变量
连续型变量/度量数据
- 与某种标准做比较得到的数据,通常为非整数值,如时间、长度、血压值等
离散型数据/计数数据 - 计数资料:通过计数方式得到,必须用整数表示
- 分类资料
- 不同类别之间无等级之分
- 有序变量:不同类别之间有内在的等级之分
可以从包含信息丰富的 向 包含信息简单 的转化:
连续型数据
-> 有序变量
-> 二分类变量
1.4 参数和统计量
参数:描述总体特征的数,通常是未知的
统计量:描述样本特征的数,是样本观测值的已知函数
1.5 准确性和精确性
准确性(accuracy):实验中 某一实验指标的观测值和真值接近的程度
精确性(precision):同一实验指标的重复观测值彼此接近的程度
试验(trial):涉及到人,临床试验
实验(experiment):不涉及到人,如小鼠实验
1.6 误差与错误
- 随机误差(不能完全消除):来源于试验过程中各种偶然因素的影响
- 系统误差(某种程度上可控):由于试验处理以外的其他条件明显不一致产生的带有倾向性的或定向性的偏差。主要由一些相对固定的因素引起。原因可能有仪器本身误差(instrumental errors)、采用方法的误差(method errors)、个人误差(personal errors)、环境误差(environmental error)
- 错误(在实验中完全可以避免):是指在试验过程中,人为的作用所引起的差错。