基本概念

该女士不具备鉴别能力 若全部选对

  • 为真时,全选对的概率为
  • 为假 二者必有其一成立。 若只选对了 3 杯, 成立时,猜对至少三杯的概率为

这一概率是出现观测结果或更极端的观测的概率,称为P 值

Neyman-Pearson 假设检验

统计假设:对一个或多个统计总体的猜测. 考虑两个对立的假设:原假设备择假设 是被检验的假设, 时拒绝 后可供选择的假设

的所有可能取值之集

Example

将所有可能的样本观测结果的集合划分为 两部分,当观测值落在拒绝域 内时拒绝 ,否则不拒绝 拒绝域可抽象表示为

有两种可能发生的错误:

  • 第一类错误,弃真错误: 实际为真但被拒绝了
  • 第二类错误,取伪错误: 实际为假但没有被拒绝

N-P 范式: 固定时,控制 不超过 ,再尽可能减小

定义 为检验的功效。

如果 足够小,功效足够大,则不拒绝 可以升级为接受

假设检验与置信区间

Example

已知, 未知 置信区间 假设检验: 拒绝域: 位于置信区间内,则不拒绝。

  • 区间估计和假设检验间存在对偶关系

检验的 P 值

为真时,出现观测结果或更极端的观测结果的概率称为该检验的 值. 值越小,在原假设下观测到结果的可能性就越低,越有充分证据拒绝 作为检验统计量

为真时,

拟合优度检验

为真,则 时,

为真时, 自由度为

似然比检验

越小,越反对 可根据 确定临界值 和拒绝域 当 满足一定正则性条件时,当 为真时,

其中自由度

服从多项分布,

自由度为 与卡方检验等价

两总体比较

比较均值

已知,

为真时, 时拒绝

未知,但已知

其中

为真时, 时拒绝

未知且不相等 可使用大样本方法

比较方差

时拒绝

比例比较

为真时,可用极大似然估计 来代替 估计标准误