概统-假设检验

基本概念

$H_{0} :$ 该女士不具备鉴别能力若全部选对

$H_{0}$ 为真时，全选对的概率为

p = \frac{1}{( 4 8 )} = \frac{1}{70}

$H_{0}$ 为假二者必有其一成立。若只选对了 3 杯， $H_{0}$ 成立时，猜对至少三杯的概率为

\frac{( 3 4 ) ( 1 4 ) + 1}{( 4 8 )} = \frac{17}{70}

这一概率是出现观测结果或更极端的观测的概率，称为P 值

Neyman-Pearson 假设检验

统计假设：对一个或多个统计总体的猜测. 考虑两个对立的假设：原假设 $H_{0}$ 和备择假设 $H_{1}$ ， $H_{0}$ 是被检验的假设， $H_{1}$ 时拒绝 $H_{0}$ 后可供选择的假设

H_{0} : θ \in Θ_{0}, H_{1} : θ \in Θ_{1}

$Θ_{0} \cap Θ_{1} = \emptyset, Θ_{0} \cup Θ_{1} = θ$ 的所有可能取值之集

Example

$X \sim N (μ, σ^{2}), H_{0} : μ = μ_{0}, H_{1} : μ \neq = μ_{0}$

将所有可能的样本观测结果的集合划分为 $R$ 和 $R^{c}$ 两部分，当观测值落在拒绝域 $R$ 内时拒绝 $H_{0}$ ，否则不拒绝 $H_{0}$ 拒绝域可抽象表示为

R = {(X_{1}, .., X_{n}) ∣ T (X_{1}, \dots, X_{n}) \geq c}

有两种可能发生的错误：

第一类错误，弃真错误： $H_{0}$ 实际为真但被拒绝了
第二类错误，取伪错误： $H_{0}$ 实际为假但没有被拒绝

N-P 范式： $n$ 固定时，控制 $P (I)$ 不超过 $α$ ，再尽可能减小 $P (II)$

定义 $1 - P (II)$ 为检验的功效。

如果 $P (II)$ 足够小，功效足够大，则不拒绝 $H_{0}$ 可以升级为接受 $H_{0}$

假设检验与置信区间

Example

$X \sim N (μ, σ^{2})$ ， $σ^{2}$ 已知， $μ$ 未知置信区间 $(\overline{X} - z_{α /2} \frac{σ}{n}, \overline{X} + z_{α /2} \frac{σ}{n})$ 假设检验： $H_{0} : μ = μ_{0}, H_{1} : μ \neq = μ_{0}$ 拒绝域： $∣ \overline{X} - μ_{0} ∣ \geq z_{α /2} \frac{σ}{n}$ 若 $μ_{0}$ 位于置信区间内，则不拒绝。

区间估计和假设检验间存在对偶关系

检验的 P 值

当 $H_{0}$ 为真时，出现观测结果或更极端的观测结果的概率称为该检验的 $P$ 值. $P$ 值越小，在原假设下观测到结果的可能性就越低，越有充分证据拒绝 $H_{0}$ $P_{n} = \overline{X}$ 作为检验统计量 $H_{0} : p = p_{0}, H_{1} : p > p_{0}$

\frac{P _{n} - p}{S e ( P _{n} )} \sim N (0, 1)

S e (P_{n}) = \frac{p ( 1 - p )}{n}

$H_{0}$ 为真时， $p = p_{0}$ ，

S e (P_{n}) = \frac{p _{0} ( 1 - p _{0} )}{n}

P 值 = P (P_{n} \geq p_{n} ∣ H_{0}) = P Z \geq \frac{p _{n} - p}{\frac{p ( 1 - p )}{n}}

拟合优度检验

$H_{0} : p_{1} = p_{1}^{0}, p_{2} = p_{2}^{0}, \dots, p_{k} = p_{k}^{0}$

χ^{2} = i = 1 \sum k \frac{( O _{i} - E _{i} ) ^{2}}{E _{i}}

若 $H_{0}$ 为真，则 $n \to \infty$ 时， $χ^{2} \to d χ^{2} (k - 1)$

P 值 = P (χ^{2} \geq χ_{0}^{2} ∣ H_{0})

$H_{0} : 独立, H_{1} : 不独立$

χ^{2} = i, j \sum \frac{( O _{ij} - E _{ij} ) ^{2}}{E _{ij}}

$H_{0}$ 为真时， $p_{ij} = p_{i +} p_{+ j} \approx p_{i +}^{*} p_{+ j}^{*}$ 自由度为 $(a - 1) (b - 1)$

似然比检验

H_{0} : θ \in Θ_{0}, H_{1} : θ \in Θ_{1}

Λ^{*} = \frac{sup _{θ \in Θ_{0}} L ( θ )}{sup _{θ \in Θ_{1}} L ( θ )}

Λ = \frac{sup _{θ \in Θ_{0}} L ( θ )}{sup _{θ \in Θ_{0} \cup Θ_{1}} L ( θ )} = min {Λ^{*}, 1} = \frac{sup _{θ \in Θ_{0}} L ( θ )}{L ( θ ^{*} )}

$Λ$ 越小，越反对 $H_{0}$ 可根据 $P (Λ \leq c ∣ H_{0}) \leq α$ 确定临界值 $c$ 和拒绝域当 $f$ 满足一定正则性条件时，当 $H_{0}$ 为真时，

- 2 lo g Λ \to d χ^{2} (d), n \to \infty

其中自由度 $d = dim (Θ_{0} \cup Θ_{1}) - dim (Θ_{0})$

$(X_{1}, \dots, X_{k})$ 服从多项分布， $H_{0} : p_{1} = p_{1}^{0}, \dots, p_{k} = p_{k}^{0}$

L (p_{1}, \dots, p_{k}) = (n _{1} , \dots , n _{k} n) p_{1}^{n_{1}} \dots p_{k}^{n_{k}}

Λ = \frac{( p _{1}^{0} ) ^{n_{1}} \dots ( p _{k}^{0} ) ^{n_{k}}}{( p _{1}^{*} ) ^{n_{1}} \dots ( p _{k}^{*} ) ^{n_{k}}}

- 2 lo g Λ = 2 i = 1 \sum k n_{i} lo g \frac{p _{i}^{0}}{p _{i}^{*}} = 2 i = 1 \sum k O_{i} lo g \frac{O _{i}}{E _{i}} = 2 i = 1 \sum k (O_{i} - E_{i}) + i = 1 \sum k \frac{( O _{i} - E _{i} ) ^{2}}{E _{i}} + o ((O_{i} - E_{i})^{2}) = i = 1 \sum k \frac{( O _{i} - E _{i} ) ^{2}}{E _{i}}

自由度为 $(k - 1) - 0 = k - 1$ 与卡方检验等价

两总体比较

若 $X \sim N (μ_{1}, σ_{1}^{2}), Y \sim N (μ_{2}, σ_{2}^{2})$

比较均值

$H_{0} : μ_{1} = μ_{2}, H_{1} : μ_{1} \neq = μ_{2}$ 若 $σ_{1}, σ_{2}$ 已知，

Z = \frac{X - Y}{\frac{σ _{1}^{2}}{n} + \frac{σ _{2}^{2}}{m}}

$H_{0}$ 为真时， $Z \sim N (0, 1)$ $∣ Z ∣ \geq z_{α /2}$ 时拒绝 $H_{0}$

若 $σ_{1}, σ_{2}$ 未知，但已知 $σ_{1} = σ_{2}$

T = \frac{X - Y}{S \frac{1}{n} + \frac{1}{m}}

其中

S^{2} = \frac{( n - 1 ) S _{X}^{2} + ( m - 1 ) S _{Y}^{2}}{n + m - 2}

$H_{0}$ 为真时， $T \sim t (n + m - 2)$ $∣ T ∣ \geq t_{α /2} (n + m - 2)$ 时拒绝 $H_{0}$

若 $σ_{1}, σ_{2}$ 未知且不相等可使用大样本方法

Z = \frac{X - Y}{\frac{S _{X}^{2}}{n} + \frac{S _{Y}^{2}}{m}}

$Z \sim N (0, 1)$

比较方差

$H_{0} : σ_{1}^{2} = σ_{2}^{2}, H_{1} : σ_{1}^{2} \neq = σ_{2}^{2}$

\frac{( n - 1 ) S _{1}^{2}}{σ _{1}^{2}} \sim χ^{2} (n - 1), \frac{( m - 1 ) S _{2}^{2}}{σ _{2}^{2}} \sim χ^{2} (m - 1)

F = \frac{\frac{( n - 1 ) S _{1}^{2}}{σ _{1}^{2}} / ( n - 1 )}{\frac{( m - 1 ) S _{2}^{2}}{σ _{2}^{2}} / ( m - 1 )} = \frac{S _{1}^{2}}{S _{2}^{2}} \sim F (n - 1, m - 1)

$F \geq F_{α /2} (n - 1, m - 1)$ 或 $F \leq F_{1 - α /2} (n - 1, m - 1)$ 时拒绝 $H_{0}$

比例比较

$H_{0} : p_{1} = p_{2}, H_{1} : p_{1} < p_{2}$

\frac{( P _{1} - P _{2} ) - ( p _{1} - p _{2} )}{S e ( P _{1} - P _{2} )} \sim N (0, 1)

S e (P_{1} - P_{2}) = \frac{p _{1} ( 1 - p _{1} )}{n _{1}} + \frac{p _{2} ( 1 - p _{2} )}{n _{2}}

$H_{0}$ 为真时，可用极大似然估计 $p^{*}$ 来代替 $p_{1} = p_{2}$ 估计标准误

S e = p^{*} (1 - p^{*}) (\frac{1}{n _{1}} + \frac{1}{n _{2}})

Evan's blog

Explorer

概统-假设检验

基本概念

Neyman-Pearson 假设检验

假设检验与置信区间

检验的 P 值

拟合优度检验

似然比检验

两总体比较

比较均值

比较方差

比例比较

Graph View

Table of Contents

Backlinks