统计学——复习笔记

标签：bar 复习 dfrac sum 笔记统计学平均数例题 sigma

算数平均数计算
加权算术平均数
调和平均数（倒数平均数）
加权调和平均数
几何平均数
在组距数列中确定中位数
在组距数组中确定众数
在组距数组中确定四分位数
极差（全距）
四分位差（內距）
异众比率
平均差
加权平均差
方差
加权方差
样本方差
标准差
离散系数
是非标志
标准差系数
样本平均数的抽样标准误差
样本成数的抽样标准误差
抽样极限误差计算
置信区间
推测总数平均数需要的样本容量
推测总数成数需要的样本容量
一元线性回归模型
综合总指数公式
加权算术平均指数公式
加权调和平均指数公式

算数平均数计算

\[\bar x = \frac{\sum^n_{i=1}x_i}{n} \]

加权算术平均数

\[\bar x = \frac{\sum^n_{i=1}x_i*f_i}{\sum^n_{i=1}f_i} \]

其中，\(x_i\) 表示各组平均水平值，\(f_i\) 代表频数。

例题

\[解：\bar x=\frac{1070+11100+...+14*100}{70+100+...+100} \]

调和平均数（倒数平均数）

\[\bar x_h=\dfrac{n}{\sum^n_{i=1}\frac{1}{x_i}} \]

先取倒数再计算。

例题

\[已知(x,y,z)，则Ans=\dfrac{3}{\frac{1}{x}+\frac{1}{y}+\frac{1}{z}} \]

加权调和平均数

\[\bar x_h=\dfrac{\sum^n_{i=1}n}{\sum^n_{i=1}\frac{n}{x_i}} \]

例题1

例题2

几何平均数

\[\bar x_g=\sqrt[n]{\prod^n_{i=1}x_i} \]

例题1

题目中说按照复利，故使用几何平均数。当按照单利计算时，答案如下：

例题2

在组距数列中确定中位数

假定数据均匀分布，直接推导可以得到答案，公式傻长，建议手推，不要背。

在组距数组中确定众数

\[M_o=L+\dfrac{\Delta_1}{\Delta_1+\Delta_2}*i \]

在组距数组中确定四分位数

同中位数的计算.

极差（全距）

最大值-最小值 \(R=Max-Min\)

四分位差（內距）

四分之三分位数-四分之一位数

异众比率

\[假设众数为M_o，则异众比率V_r=\dfrac{\sum n-M_o}{\sum n} \]

例题

平均差

\[假设算术平均数是 \bar x，则平均差A·D=\dfrac{\sum^n_{i=1}|x_i-\bar x|}{n} \]

例题

加权平均差

\[假设加权算术平均数是 \bar X，则加权平均差A·D=\dfrac{\sum^n_{i=1}|x_i-\bar X|*f_i}{\sum_{i=1}^nf_i} \]

例题

方差

\[\sigma^2=\dfrac{\sum^n_{i=1}(x_i-\bar x)^2}{n}=\bar {x^2}-\bar x ^ 2 \]

即把平均差的绝对值换成了平方

例题

加权方差

\[\sigma^2=\dfrac{\sum^n_{i=1}(x_i-\bar X)^2*f_i}{\sum_{i=1}^nf_i} \]

样本方差

把方差的分母多减去一个 \(1\) ，加权样本方差同。

标准差

方差开平方。

离散系数

\[V_\sigma = \dfrac {\sigma}{\bar x} \]

标准差除以算术平均数

例题

这里只演算产品销售额：首先计算 \(\bar x=536.25\) ，随后计算 \(\sigma =\sqrt{\dfrac{\sum^n_{i=1}(x_i-\bar x)^2}{n-1}} \approx 309.1896\) ，随后计算 \(V_\sigma=\dfrac {\sigma}{\bar x}\approx 0.577\) 。

是非标志

即将普通的 \((x_1,x_2,...,x_N)\) 变为 \((0,1)\) ，公式同上，稍微变换即可。

均值：\(\bar x=\dfrac{1*f_1+0*f_2}{n}\)
标准差：记 \(P=\dfrac{f_1}{n},Q=\dfrac{f_2}{n}\) ，则可以简化为 \(\sigma=\sqrt{P*Q}\)
方差：\(简记为\sigma^2=P*Q\)

标准差系数

\[简记为 V=\sqrt {\dfrac{Q}{P}} \]

例题

样本平均数的抽样标准误差

重复抽样时：\(\mu=\sqrt{\dfrac{\sigma^2}{n}}\) ，不重复抽样时：\(\mu=\sqrt {\dfrac{\sigma^2}{n}(\dfrac{N-n}{N-1})}\) 。

样本成数的抽样标准误差

即在 \(N\) 个样本中随机挑选 \(n\) 个进行抽查——发现合格率是 \(p\) ，则

重复抽样时：\(\mu=\sqrt{\dfrac{p*(1-p)}{n}}\) ，不重复抽样时：\(\mu=\sqrt {\dfrac{p*(1-p)}{n}(\dfrac{N-n}{N-1})}\) 。

抽样极限误差计算

在原来的抽样标准误差的基础上乘以 \(t\) 得到误差 \(\Delta\) 。

样本成数、样本平均数的极限误差：\(\Delta=t*\mu\) 。

置信区间

由上面计算出的误差，可以得到置信区间的范围：

总体平均数的置信区间——\(\bar x -\Delta \le \bar X \le \bar x + \Delta\) 。
总体成数的置信区间——\(p -\Delta \le P \le p + \Delta\) 。

推测总数平均数需要的样本容量

重复抽样—— \(n=\dfrac{t^2\sigma^2}{\Delta^2}=\dfrac{\sigma^2}{\mu^2}\) 。
不重复抽样—— \(n=\dfrac{Nt^2\sigma^2}{N\Delta^2+t^2\sigma ^2}=\dfrac{N\sigma ^2}{N\mu ^2+\sigma ^2}\) 。

推测总数成数需要的样本容量

重复抽样—— \(n=\dfrac{t^2p(1-p)}{\Delta^2}=\dfrac{p(1-p)}{\mu^2}\) 。
不重复抽样—— \(n=\dfrac{Nt^2p(1-p)}{N\Delta^2+t^2p(1-p)}=\dfrac{Np(1-p)}{N\mu ^2+p(1-p)}\) 。

一元线性回归模型

\[\left\{\begin{matrix}b=\dfrac{n\sum xy-\sum x\sum y}{n\sum x^2-(\sum x)^2}\\a=\dfrac{\sum y}{n}-b\dfrac{\sum x}{n}=\bar y-b\bar x\end{matrix}\right. \]

\[r^2=\dfrac{\sum(\hat y-\bar y)^2}{\sum(y-\bar y)^2}=\dfrac{(n\sum xy-\sum x\sum y)^2}{(n\sum x^2-(\sum x)^2)(n\sum y^2-(\sum y)^2)}=\dfrac{a\sum y+b\sum xy-n \bar y^2}{\sum y^2-n\bar y ^2} \]

综合总指数公式

\(p\) 表示价格，\(q\) 表示销售量；下标 \(_0\) 表示基期，下标 \(_1\) 表示报告期；\(I\) 表示指数。

\[销售额总指数=\dfrac{\sum p_1q_1}{\sum p_0 q_0} \]

\[销售量（数量）总指数：I_q=\dfrac{\sum p_0q_1}{\sum p_0q_0}（拉式公式） \]

\[价格（质量）总指数：I_p=\dfrac{\sum p_1q_1}{\sum p_0q_1}（派式公式） \]

加权算术平均指数公式

已知“销售量个体指数”与”基期销售额“：

\[I_q=\dfrac{\sum k_qp_0q_0}{\sum p_0q_0}，其中k_q=\dfrac{q_1}{q_0} \]

加权调和平均指数公式

已知”个体价格指数“与”报告期销售额“：

\[I_p=\dfrac{\sum p_1q_1}{\sum \frac{1}{k_p}p_1q_1}，其中k_p=\dfrac{p_1}{p_0} \]

标签：bar,复习,dfrac,sum,笔记,统计学,平均数,例题,sigma
From： https://www.cnblogs.com/WIDA/p/17127125.html