假设检验也叫显著性检验,是以小概率反证法的逻辑推理,判断假设是否成立的统计方法,它首先假设样本对应的总体参数(或分布)与某个已知总体参数(或分布)相同,然后根据统计量的分布规律来分析样本数据,利用样本信息判断是否支持这种假设,并对检验假设做出取舍抉择,做出的结论是概率性的,不是绝对的肯定或否定。
T检验的概念
t检验的前提是要求样本服从正态分布或近似正态分布,不然可以利用一些变换(取对数、开根号、倒数等等)试图将其转化为服从正态分布是数据,如若还是不满足正态分布,只能利用非参数检验方法。不过当样本量大于30的时候,可以认为数据近似正态分布。
T检验:亦称student t检验(Student’s t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。
T检验 是用于小样本(样本容量小于30)的两个平均值差异程度的检验方法。它是用T分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。
T检验的用途:
- 单样本均值检验(One-sample t-test) 用于检验 总体方差未知、正态数据或近似正态的 单样本的均值 是否与 已知的总体均值相等
- 两独立样本均值检验(Independent two-sample t-test) 用于检验 两对独立的 正态数据或近似正态的 样本的均值 是否相等,这里可根据总体方差是否相等分类讨论
- 配对样本均值检验(Dependent t-test for paired samples) 用于检验 一对配对样本的均值的差 是否等于某一个值
- 回归系数的显著性检验(t-test for regression coefficient significance) 用于检验 回归模型的解释变量对被解释变量是否有显著影响
单个样本的T检验
此种用样本量较少的正态检验,一般n在30左右。
-
目的:检验单样本的均值是否和已知总体的均值相等。
-
统计公式
自由度 $V=n-1$
- 假设总体均数和样本均数相近,或者无差别。设定检验水平 $\alpha$=0.05(一般用0.05)
- 查t界值表,根据自由度,检验水平,确定对应的 $t1$ 值,若 $t1>t$ 值,则在 $\alpha$ 水平下,不拒绝原假设。否则拒绝原假设。
适用条件:
(1) 已知一个总体均数;
(2) 可得到一个样本均数及该样本标准误;
(3) 样本来自正态或近似正态总体。
- 应用场景举例:
- 从某厂生产的零件中随机抽取若干件,检验其某种规格的均值是否与要求的规格相等(双侧检验)
- 在某偏远地区随机抽取若干健康男子,检验其脉搏均数是否高于全体健康男子平均水平(单侧检验)
- 检验某一线城市全体高三学生视力水平是否比全国全体高三学生视力水平低(单侧检验)
- 检验原理: :样本均值与总体均值相等 :样本均值与总体均值不等
推导
记总体均值为,总体方差为(未知),样本均值,样本标准差 $s=\sqrt{\frac{1}{n-1} \sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}}$ 有:
\[\begin{equation}\begin{aligned} X_{i} \sim N\left(\mu, \sigma^{2}\right) & \rightarrow \bar{X}=\frac{1}{n} \sum_{i=1}^{n} X_{i} \sim N\left(\mu, \frac{\sigma^{2}}{n}\right) \\ & \rightarrow \frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}=\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma} \sim N(0,1) \end{aligned} \tag{1} \end{equation}\]构造出一个 $t $ 统计量,我们知道 $t $ 变量的构造定义是一个 分子为标准正态变量、分母为卡方变量除以它自由度后开根号 的分式。上面我们已经得到了一个标准正态变量,不难想到卡方变量的一个重要定理: \(\begin{equation} \frac{(n-1) s^{2}}{\sigma^{2}} \sim \chi^{2}(n-1) \tag{2} \end{equation}\)
$(1) \div \sqrt{(2) /(n-1)}$
检验原理
在成立的条件下,,若上述统计量的值偏离0“太多”,是小概率事件,在一次抽样中几乎不可能发生,其发生的概率即为值。给定显著性水平(如0.05),根据研究的问题确定是双侧检验(two-side test)还是单侧检验(one-side test),若为双侧检验,则查t界值表中自由度为,双侧,得到临界值;若为单侧检验,则查t界值表中自由度为,双侧,得到临界值。
在成立的条件下,,若上述统计量的值偏离0“太多”,是小概率事件,在一次抽样中几乎不可能发生,其发生的概率即为值。给定显著性水平(如0.05),根据研究的问题确定是双侧检验(two-side test)还是单侧检验(one-side test),若为双侧检验,则查t界值表中自由度为,双侧,得到临界值;若为单侧检验,则查t界值表中自由度为,双侧,得到临界值。
- 对于要检验样本均值是否等于总体均值的双侧检验,若根据样本数据算出来的统计量的绝对值 ,则拒绝原假设,认为样本均值与总体均值不等,否则不拒绝原假设。
- 对于要检验样本均值是否比总体均值大的单侧检验,若根据样本数据算出来的统计量 ,则拒绝原假设,认为样本均值不大于总体均值,否则不拒绝原假设。
- 对于要检验样本均值是否比总体均值小的单侧检验,若根据样本数据算出来的统计量 ,则拒绝原假设,认为样本均值不小于总体均值,否则不拒绝原假设。
单个样本的t检验实例分析
例1 难产儿出生体重 $n=35, \bar{X}=3.42, S=0.40$
一般婴儿出生体重 $\mu_{0}=3.30$(大规模调查获得),问相同否?
解:
1.建立假设、确定检验水准 $\alpha$
-
$H_{0}: \mu=\mu_{0}$ 难产儿与一般婴儿出生体重的总均数相等;$H_{0}$无效假设,null hypothesis)
-
$H_{1}: \mu \neq \mu_{0}$ (难产儿与一般婴儿出生体重的总均数不等;$H_{1}$备择假设,alternative hypothesis,)
-
双侧检验,检验水准:α = 0.05
2.计算检验统计量
</br>
\[\begin{equation}t=\frac{\bar{X}-\mu_{0}}{S / \sqrt{n}}=\frac{3.42-3.30}{0.40 / \sqrt{35}}=1.77, v=n-1=35-1=34\end{equation}\]</br>
3.查相应界值表,确定P值,下结论
查附表1: $t_{0.05/ 2.34} =2.032, t=1.77, t<t_{0.05 / 2.34}, P>0.05$ , 按α = 0.05水准,不拒绝H0,两者的差别无统计学意义,尚不能认为难产儿平均出生体重与一般婴儿的出生体重不同
两独立样本均值检验
-
目的:检验两独立样本的均值是否相等。
-
要求:两样本独立,服从正态分布或近似正态。
-
应用场景举例:
- 检验两工厂生产同种零件的规格是否相等(单侧检验)
- 为研究某种治疗儿童贫血新药的疗效,以常规药作为对照,治疗一段时间后,检验施以新药的儿童血红蛋白的增加量是否比常规药的大(单侧检验)
- 检验两种药物对治疗高血压的效果,检验两组药物的降压水平是否相等(双侧检验)
记两总体分别为$X_{1} \sim N\left(\mu_{1}, \sigma_{1}^{2}\right), X_{2} \sim N\left(\mu_{2}, \sigma_{2}^{2}\right)$ 样本均值、样本标准差:
\[\begin{equation}\bar{X}_{1}=\frac{1}{n_{1}} \sum_{i=1}^{n_{1}} X_{1 i}, \quad \bar{X}_{2}=\frac{1}{n_{2}} \sum_{i=1}^{n_{2}} X_{2 i}\end{equation}\] \[\begin{equation}s_{1}=\sqrt{\frac{1}{n_{1}-1} \sum_{i=1}^{n_{1}}\left(X_{1 i}-\bar{X}_{1}\right)^{2}}, \quad s_{2}=\sqrt{\frac{1}{n_{2}-1} \sum_{i=1}^{n_{2}}\left(X_{2 i}-\bar{X}_{2}\right)^{2}}\end{equation}\]根据总体方差是否相等可以分为两类
总体方差相等且未知
总体方差相等且未知,样本方差满足 $\frac{1}{2}<\frac{s_{1}^{2}}{s_{2}^{2}}<2$
记总体方差为 $\sigma^{2}=\sigma_{1}^{2}=\sigma_{2}^{2}$
要检验两总体均值是否相等,先给出 样本均值的差 的分布,根据假设易得:
\[\begin{equation}\begin{array}{c} \bar{X}_{1}-\bar{X}_{2} \sim N\left(\mu_{1}-\mu_{2},\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right) \sigma^{2}\right) \\ \rightarrow \frac{\left(\bar{X}_{1}-\bar{X}_{2}\right)-\left(\mu_{1}-\mu_{2}\right)}{\sigma \sqrt{\frac{1}{n_{1}}+\frac{1}{n_{2}}}} \sim N(0,1) \end{array} \tag{4} \end{equation}\]由卡方变量的重要定理:
\[\begin{equation}\frac{\left(n_{1}-1\right) s_{1}^{2}}{\sigma^{2}} \sim \chi^{2}\left(n_{1}-1\right), \quad \frac{\left(n_{2}-1\right) s_{2}^{2}}{\sigma^{2}} \sim \chi^{2}\left(n_{2}-1\right)\end{equation}\]由于两分布独立,则 $s_{1}^{2}, s_{2}^{2}$ 独立,由卡方变量的可加性:
\[\begin{equation}\frac{\left(n_{1}-1\right) s_{1}^{2}}{\sigma^{2}}+\frac{\left(n_{2}-1\right) s_{2}^{2}}{\sigma^{2}} \sim \chi^{2}\left(n_{1}+n_{2}-1\right) \tag{5} \end{equation}\]由 $t$ 分布的构造定义 $(4) \div \sqrt{(5) /\left(n_{1}+n_{2}-1\right)}$ 化简整理后可以得到:
\[\begin{equation}\frac{\left(\bar{X}_{1}-\bar{X}_{2}\right)-\left(\mu_{1}-\mu_{2}\right)}{s_{p} \sqrt{\frac{1}{n_{1}}+\frac{1}{n_{2}}}} \sim t\left(n_{1}+n_{2}-2\right) \tag{6} \end{equation}\]其中:
\[\begin{equation} \begin{aligned} s_{p}&=\sqrt{\frac{\left(n_{1}-1\right) s_{1}^{2}+\left(n_{2}-1\right) s_{2}^{2}}{n_{1}+n_{2}-2}}\\ &=\sqrt{\frac{\sum_{i=1}^{n_{1}}\left(X_{1 i}-\bar{X}_{1}\right)^{2}+\sum_{i=1}^{n_{2}}\left(X_{2 i}-\bar{X}_{2}\right)^{2}}{n_{1}+n_{2}-2}} \end{aligned} \tag{7} \end{equation}\]为两样本的合并标准差(pooled standard deviation),可以证明它的方差,即两样本的合并方差是总体方差的无偏估计(unbiased estimator)
同样地,在成立的条件下,。根据研究的问题确定是双侧检验(two-side test)还是单侧检验(one-side test),若为双侧检验,则查t界值表中自由度为,双侧,得到临界值;若为单侧检验,则查t界值表中自由度为,双侧,得到临界值。
检验原理
- 对于要检验两总体均值是否相等的双侧检验,若根据样本数据算出来的统计量的绝对值 ,则拒绝原假设,认为样本均值与总体均值不等,否则不拒绝原假设。
- 对于要检验总体均值单侧检验,若根据样本数据算出来的统计量 ,则拒绝原假设,认为总体均值,否则不拒绝原假设。
- 对于要检验总体均值单侧检验,若根据样本数据算出来的统计量 ,则拒绝原假设,认为总体均值,否则不拒绝原假设。
总体方差不等且未知(或者对它们一无所知)
总体方差不等且未知(或者对它们一无所知),满足$s_{1}^{2}>2 s_{2}^{2}$ 或 $s_{2}^{2}>2 s_{1}^{2}$
在总体方差不等的情况下,2.1中统计量的分母已不是总体方差的无偏估计,已不再适用,需重新构造一个统计量,这里需要利用Satterthwaite近似法。
取统计量:
\[\begin{equation}t=\frac{\bar{X}_{1}-\bar{X}_{2}}{\sqrt{\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}}} \tag{8} \end{equation}\]它的合并后的自由度(df, degrees of freedom):
\[\begin{equation}\nu \approx \frac{\left(\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}\right)^{2}}{\frac{s_{1}^{4}}{n_{1}^{2} \nu_{1}}+\frac{s_{2}^{4}}{n_{2}^{2} \nu_{2}}} \tag{9} \end{equation}\]其中分别是的自由度,当时,近似分布的效果比较好。
合并后的自由度可由 statsmodels.stats.weightstats.ttest_ind
计算,该函数返回合并后的自由度
合并标准差标准差计算:
\[s_p=\begin{equation}\sqrt{\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}}\end{equation}\]同样地,根据研究的问题确定是双侧检验(two-side test)还是单侧检验(one-side test),若为双侧检验,则查界值表中自由度为,双侧,得到临界值;若为单侧检验,则查t界值表中自由度为,单侧,得到临界值。
检验原理同上
计算置信区间
配对样本T检验
用于分析配对定量数据之间的差异对比关系。与独立样本t检验相比,配对样本T检验要求样本是配对的。两个样本的样本量要相同;样本先后的顺序是一一对应的。
这种情况常常出现在生物医学研究中,常见的情形有:
- 配对的受试对象分别接受不同的处理(如将小白鼠配对为两组,分别接受不同的处理,检验处理结果的差异)
- 同一受试对象的两个部分接受不同的处理(如对于一批血清样本,将其分为两个部分,利用不同的方法接受某种化合物的检验,检验结果的差异)
- 同一受试对象的自身前后对照(如检验癌症患者术前、术后的某种指标的差异)
要求:
- 总体方差相等
- 正态数据或近似正态
既然是配对设计,不妨设 \(n=n_{1}=n_{2}\);方差相等,有 \(\sigma^{2}=\sigma_{1}^{2}=\sigma_{2}^{2}\)。取要检验的指标的差值 \(d_{i}=X_{1 i}-X_{2 i}\),计算 $d_i$ 的样本标准差 。要检验配对样本均数的差是否为0,即检验 $d_i$ 的均值是否为0,这样就转化为了“1.单样本t检验”,
由于正态性和方差相等的假定,差值的均值(以大写字母表示随机变量,小写字母表示样本取值):
\[\begin{equation}\bar{D}=\bar{X}_{1}-\bar{X}_{2} \sim N\left(\mu_{1}-\mu_{2}, \frac{2 \sigma^{2}}{n}\right)\end{equation}\]从而: \(\begin{equation}\frac{\bar{D}-\left(\mu_{1}-\mu_{2}\right)}{\sigma \sqrt{\frac{2}{n}}} \sim N(0,1) \;\; \tag{10} \end{equation}\) 构造 $\mathbf{\chi^2}$ 变量: \(\begin{equation}\frac{(n-1) s_{d}}{2 \sigma^{2}} \sim \chi^{2}(n-1)\tag{11}\end{equation}\)
\[(10) \div \sqrt{(11) /(n-1)} \text { 化简整理得到: }\] \[\begin{equation}\frac{\sqrt{n}\left(\bar{D}-\left(\mu_{1}-\mu_{2}\right)\right)}{s_{d}} \sim t(n-1) \;\;\tag{12}\end{equation}\]同样地,在$\boldsymbol{H_0}$成立的条件下,$\boldsymbol{\mu_1-\mu_2=0}$ 。根据研究的问题确定是双侧检验(two-side test)还是单侧检验(one-side test),若为双侧检验,则查t界值表中自由度为 $n-1$,双侧 $\alpha$ ,得到临界值 \(t _{\frac{\alpha}{2}, n-1}\);若为单侧检验,则查界值表中自由度为 $n-1$,双侧 $\alpha$,得到临界值\(t _{\alpha, n-1}\)。
检验原理
- 对于要检验差值的均值是否为0的双侧检验,若根据样本数据算出来的统计量的绝对值,则拒绝原假设,认为样本均值与总体均值不等,否则不拒绝原假设。
- 对于要检验的单侧检验,若根据样本数据算出来的统计量,则拒绝原假设,认为,否则不拒绝原假设。
- 对于要检验的单侧检验,若根据样本数据算出来的统计量,则拒绝原假设,认为,否则不拒绝原假设。
回归系数的显著性检验
目的:检验回归模型的回归系数是否等于给定的值,一般取为0,此时检验的意义是检验该回归系数对应的解释变量对被解释变量是否有显著影响(因为若接受取值为0的假设,则该解释变量的项对被解释变量没有作用了)。
将多元线性回归模型:
写为矩阵形式:
其中:
其中为阶单位方阵。方程满足满秩、Gauss-Markov条件、随机误差项服从正态分布等假定。
可以证明
其中表示的方差-协方差矩阵。在服从正态分布的假定下,由于是常向量(回归模型背后蕴含的未知的规律),给定一组(可以看成变量,但不是随机变量,因为的取值是人为给定的),从而是常向量,从而 是正态变量。由(15),是的线性函数,从而也是正态变量,再由(16)、(17):
令 \(\left(\boldsymbol{X}^{T} \boldsymbol{X}\right)^{-1}=\left(c_{i j}\right), \quad i, j=1,2, \cdots, p+1\) ,从而:
\[\begin{equation}\hat{\beta}_{j} \sim N\left(\beta_{j}, \sigma^{2} c_{j j}\right) \rightarrow \frac{\hat{\beta}_{j}-\beta_{j}}{\sigma \sqrt{c_{j j}}} \sim N(0,1) \tag{19} \end{equation}\]这样我们找到了一个标准正态变量,为了构造一个统计量,接着就是要寻找一个卡方变量,
\(\begin{equation}\frac{\hat{\sigma}^{2}(n-p-1)}{\sigma^{2}} \sim \chi^{2}(n-p-1) \tag{20} \end{equation}\) 其中 是 $\sigma^2$的无偏估计(证明见附录2.2)。
根据 分布的构造定义,由 得:
一般要检验解释变量对被解释变量是否有显著影响,也即检验回归系数是否显著不为0,在这种情况下取。而在一般情况下,要检验回归系数是否等于给定的就有:
\[\begin{array}{l} H_{0}: \hat{\beta}_{j} \text { 等于 } \beta_{j} \\ H_{1}: \hat{\beta}_{j} \text { 不等于 } \beta_{j} \end{array}\]取显著性水平,查得自由度为的双侧的界值。若计算出来的统计量的绝对值 ,则拒绝原假设,认为不等于,否则不拒绝原假设。绝大多数情况都是取。