基本概念
H0: 该女士不具备鉴别能力
若全部选对
p=(48)1=701
- H0 为假
二者必有其一成立。
若只选对了 3 杯,H0 成立时,猜对至少三杯的概率为
(48)(34)(14)+1=7017
这一概率是出现观测结果或更极端的观测的概率,称为P 值
Neyman-Pearson 假设检验
统计假设:对一个或多个统计总体的猜测.
考虑两个对立的假设:原假设H0 和备择假设H1,
H0 是被检验的假设,H1 时拒绝 H0 后可供选择的假设
H0:θ∈Θ0, H1:θ∈Θ1
Θ0∩Θ1=∅,Θ0∪Θ1=θ 的所有可能取值之集
X∼N(μ,σ2), H0:μ=μ0, H1:μ=μ0
将所有可能的样本观测结果的集合划分为 R 和 Rc 两部分,当观测值落在拒绝域 R 内时拒绝 H0,否则不拒绝 H0
拒绝域可抽象表示为
R={(X1,..,Xn)∣T(X1,…,Xn)≥c}
有两种可能发生的错误:
- 第一类错误,弃真错误:H0 实际为真但被拒绝了
- 第二类错误,取伪错误:H0 实际为假但没有被拒绝
N-P 范式:n 固定时,控制 P(I) 不超过 α,再尽可能减小 P(II)
定义 1−P(II) 为检验的功效。
如果 P(II) 足够小,功效足够大,则不拒绝 H0 可以升级为接受 H0
假设检验与置信区间
X∼N(μ,σ2),σ2 已知,μ 未知
置信区间 (X−zα/2nσ,X+zα/2nσ)
假设检验:
H0:μ=μ0,H1:μ=μ0
拒绝域:∣X−μ0∣≥zα/2nσ
若 μ0 位于置信区间内,则不拒绝。
检验的 P 值
当 H0 为真时,出现观测结果或更极端的观测结果的概率称为该检验的 P 值.
P 值越小,在原假设下观测到结果的可能性就越低,越有充分证据拒绝 H0
Pn=X 作为检验统计量
H0:p=p0,H1:p>p0
Se(Pn)Pn−p∼N(0,1)
Se(Pn)=np(1−p)
H0 为真时,p=p0,
Se(Pn)=np0(1−p0)
P值=P(Pn≥pn∣H0)=PZ≥np(1−p)pn−p
拟合优度检验
H0:p1=p10,p2=p20,…,pk=pk0
χ2=i=1∑kEi(Oi−Ei)2
若 H0 为真,则 n→∞ 时,χ2→dχ2(k−1)
P值=P(χ2≥χ02∣H0)
H0:独立,H1:不独立
χ2=i,j∑Eij(Oij−Eij)2
H0 为真时,pij=pi+p+j≈pi+∗p+j∗
自由度为 (a−1)(b−1)
似然比检验
H0:θ∈Θ0,H1:θ∈Θ1
Λ∗=supθ∈Θ1L(θ)supθ∈Θ0L(θ)
Λ=supθ∈Θ0∪Θ1L(θ)supθ∈Θ0L(θ)=min{Λ∗,1}=L(θ∗)supθ∈Θ0L(θ)
Λ 越小,越反对 H0
可根据 P(Λ≤c∣H0)≤α 确定临界值 c 和拒绝域
当 f 满足一定正则性条件时,当 H0 为真时,
−2logΛ→dχ2(d),n→∞
其中自由度 d=dim(Θ0∪Θ1)−dim(Θ0)
(X1,…,Xk) 服从多项分布,
H0:p1=p10,…,pk=pk0
L(p1,…,pk)=(n1,…,nkn)p1n1…pknk
Λ=(p1∗)n1…(pk∗)nk(p10)n1…(pk0)nk
−2logΛ=2i=1∑knilogpi∗pi0=2i=1∑kOilogEiOi=2i=1∑k(Oi−Ei)+i=1∑kEi(Oi−Ei)2+o((Oi−Ei)2)=i=1∑kEi(Oi−Ei)2
自由度为 (k−1)−0=k−1
与卡方检验等价
两总体比较
若 X∼N(μ1,σ12),Y∼N(μ2,σ22)
比较均值
H0:μ1=μ2,H1:μ1=μ2
若 σ1,σ2 已知,
Z=nσ12+mσ22X−Y
H0 为真时,Z∼N(0,1)
∣Z∣≥zα/2 时拒绝 H0
若 σ1,σ2 未知,但已知 σ1=σ2
T=Sn1+m1X−Y
其中
S2=n+m−2(n−1)SX2+(m−1)SY2
H0 为真时,T∼t(n+m−2)
∣T∣≥tα/2(n+m−2) 时拒绝 H0
若 σ1,σ2 未知且不相等
可使用大样本方法
Z=nSX2+mSY2X−Y
Z∼N(0,1)
比较方差
H0:σ12=σ22,H1:σ12=σ22
σ12(n−1)S12∼χ2(n−1),σ22(m−1)S22∼χ2(m−1)
F=σ22(m−1)S22/(m−1)σ12(n−1)S12/(n−1)=S22S12∼F(n−1,m−1)
F≥Fα/2(n−1,m−1) 或 F≤F1−α/2(n−1,m−1) 时拒绝 H0
比例比较
H0:p1=p2,H1:p1<p2
Se(P1−P2)(P1−P2)−(p1−p2)∼N(0,1)
Se(P1−P2)=n1p1(1−p1)+n2p2(1−p2)
H0 为真时,可用极大似然估计 p∗ 来代替 p1=p2 估计标准误
Se=p∗(1−p∗)(n11+n21)