1. 数据 总体population、横截面研究cross-sectional study,周期cycle,纵向研究longtitudinal study,记录record,参与调查的人respondent、样本sample、有代表性representative、过度抽样oversampling、原始数据raw data、重编码recode、数据清洗data cleaning。
数据的分组——相关分组处理方法 |
|
2. 分布—— 值及出现的次数——直方图histogram——每个值的频数frequency 描述变量的最佳方法之一是列出该变量在数据集中的值,以及每个值出现的次数。这种描述称为该变量的分布distribution。
汇总统计量summary statistic:针对一个群组进行统计。 均值 、平均数 方差variance、标准差standard deviation(又称为:均方差)。
效应量effect size:描述两个群组之间的差异。如, (1)使用两个群组均值的差值描述两个群组之间的差值。 (2)将群组之间的差值与群组内的变化性进行比较——统计量Cohen's d。
正态分布normal distribution——钟形的理想化分布,也称为高斯分布。 均匀分布uniform distribution——所有值具有相同的分布。
临床显著clinically significant——在实践中有意义的结果,如群组之间的差异。 page28——对图形中一部分数据进行放大,并转换数据,以强调种种区别。
|
|
3. 概率质量函数 概率probability:是频数的分数表示。 概率质量函数probability mass function,PMP:将每个值映射到其概率。 |
|