Math ClubMath Club
v1 · padrão canônico

Lição 103 — Teste de hipótese: estrutura e lógica

Estrutura formal do teste de hipótese: H0 vs H1, estatística de teste, p-valor, nível de significância, erros tipo I e II, e poder do teste.

Used in: 3.º ano do EM (17-18 anos) · Equiv. Stochastik LK alemão · Equiv. Math B japonês · H2 Statistics singapurense

p-valor=P(TtobsH0)αrejeita H0p\text{-valor} = P(T \geq t_{\mathrm{obs}} \mid H_0) \leq \alpha \Rightarrow \text{rejeita } H_0
Choose your door

Rigorous notation, full derivation, hypotheses

严格定义

假设检验的五个要素

"零假设 H0H_0 代表怀疑的主张。这是除非有充分证据反对它,否则将保持的现状。" — OpenIntro Statistics, §5.1

错误与检验功效

p值的形式定义

"p值衡量数据与 H0H_0 的一致性程度。小的p值表明数据与 H0H_0 不相容 — 而非 H0H_0 以概率 1p1-p 为假。" — OpenIntro Statistics, §5.1

备选假设的类型

已解决的例子

Exercise list

26 exercises · 6 with worked solution (25%)

Application 18Understanding 4Modeling 2Challenge 1Proof 1
  1. Ex. 103.1ApplicationAnswer key

    为以下情景表述假设 H0H_0H1H_1:消费者保护机构想要验证500克面粉包装的平均重量是否符合声明。

  2. Ex. 103.2Application

    研究人员想要验证巴西青少年睡眠时间是否少于每晚推荐的8小时。表述 H0H_0H1H_1

  3. Ex. 103.3Application

    H0:μ=50H_0: \mu = 50H1:μ50H_1: \mu \neq 50。数据:n=25n = 25Xˉ=52\bar X = 52σ=10\sigma = 10(已知)。计算z统计量和p值。在 α=0,05\alpha = 0{,}05 处得出结论。

  4. Ex. 103.4Application

    一个制造商声称其灯泡平均持续1000小时。一个 n=64n = 64 个灯泡的样本给出 Xˉ=985\bar X = 985 小时,σ=50\sigma = 50 小时(已知)。在5%水平上,平均寿命是否小于声称的值?

  5. Ex. 103.5Application

    在刑事审判中,H0H_0 是"被告无罪",H1H_1 是"被告有罪"。在这个背景下描述第I型和第II型错误。巴西司法系统认为哪一个更严重?为什么?

  6. Ex. 103.6Understanding

    一个检验产生 p=0,03p = 0{,}03。下列哪个陈述是正确的?

  7. Ex. 103.7Understanding

    一个 n=10n = 10 的检验产生 p=0,12p = 0{,}12。研究者得出结论"效应不存在"。可能有什么问题?

  8. Ex. 103.8Application

    一所学校实施了一种新方法。历史平均分为 μ0=35\mu_0 = 35 分。干预后,n=40n = 40 名学生的成绩为 Xˉ=37\bar X = 37σ=8\sigma = 8(已知)。在5%水平上,成绩改善了吗?

  9. Ex. 103.9Application

    一家紧急护理单位想要检测服务时间减少5分钟(δ=5\delta = 5σ=10\sigma = 10)。使用 α=0,05\alpha = 0{,}05 和90%功效,最少的 nn 是多少?

  10. Ex. 103.10ApplicationAnswer key

    一枚硬币掷100次,出现60次正面。在5%水平上,硬币是公正的吗?

  11. Ex. 103.11Application

    一个研究者改变显著性水平从 α=0,05\alpha = 0{,}05α=0,01\alpha = 0{,}01 同时保持 nn 固定。解释对第II型错误和检验功效的效应。

  12. Ex. 103.12ApplicationAnswer key

    空腹血糖的正常水平为 μ0=120\mu_0 = 120 mg/dL。一个 n=50n = 50 个糖尿病患者的样本给出 Xˉ=128\bar X = 128 mg/dL,σ=20\sigma = 20 mg/dL。在1%水平上,平均血糖升高了吗?

  13. Ex. 103.13Understanding

    一个结果"在5%水平上统计显著"。这正确意味着什么?

  14. Ex. 103.14Application

    一家公司想要检测其产品的平均重量是否从 μ0=250\mu_0 = 250 克下降到 μ1=245\mu_1 = 245 克,σ=20\sigma = 20 克,α=0,05\alpha = 0{,}05 和80%功效。最少的 nn 是多少?

  15. Ex. 103.15Application

    一个基因组学研究进行1000个同时检验,α=0,05\alpha = 0{,}05。所有检验的基因都是零(无真实效应)。预期多少个假阳性?如果60个基因"显著",估计的假发现率是多少?

  16. Ex. 103.16Application

    一枚硬币掷800次,出现384次正面。在5%水平上,硬币是公正的吗?

  17. Ex. 103.17ApplicationAnswer key

    一项包括 n=30n = 30 个青少年的研究记录了平均睡眠 Xˉ=7,5\bar X = 7{,}5 小时,σ=1,5\sigma = 1{,}5 小时(来自以前的研究)。在5%水平上,他们睡眠少于8小时吗?

  18. Ex. 103.18UnderstandingAnswer key

    下列哪个关于统计显著性的陈述是正确的?

  19. Ex. 103.19Modeling

    一项临床试验同时检验20个端点,α=0,05\alpha = 0{,}05。不校正的情况下至少一个假阳性的概率是多少?描述Bonferroni校正如何解决问题以及其局限性。

  20. Ex. 103.20Application

    一所学校在全国中学教育考试(ENEM)中的历史批准率为30%。实施新方法后,100名学生中有38人通过。在5%水平上,批准率改善了吗?

  21. Ex. 103.21Application

    检验 H0:μ=50H_0: \mu = 50 对比 H1:μ50H_1: \mu \neq 50σ=10\sigma = 10Xˉ=51\bar X = 51。为 n=10n = 10n=10000n = 10000 计算p值。这对p值和效应大小揭示了什么?

  22. Ex. 103.22ApplicationAnswer key

    正常血压:μ0=120\mu_0 = 120 mmHg。一个 n=60n = 60 个久坐成人的样本:Xˉ=125\bar X = 125 mmHg,σ=15\sigma = 15 mmHg。在1%水平上,平均血压升高了吗?

  23. Ex. 103.23Application

    一个兽医研究想要检测一个品种的猪的平均重量从125千克变为120千克(δ=5\delta = 5σ=15\sigma = 15)。使用 α=0,05\alpha = 0{,}05 双侧和80%功效,需要多少只动物?

  24. Ex. 103.24Modeling

    一所学校的全国中学教育考试(ENEM)得分 Xˉ=52\bar X = 52 分对比州平均数 μ0=50\mu_0 = 50s=10s = 10n=10000n = 10000 名学生。结果"高度显著"(p<0,001p < 0{,}001)。计算Cohen的效应大小 dd。2分的差异在教育上相关吗?讨论。

  25. Ex. 103.25Challenge

    对于连续检验,证明在 H0H_0 为真时p值有Uniforme(0,1)(0,1)分布。使用这个结果验证 P(拒绝 H0H0)=αP(\text{拒绝 } H_0 \mid H_0) = \alpha

  26. Ex. 103.26Proof

    使用Neyman-Pearson引理证明单侧z检验(如果 Xˉ>c\bar X > c 则拒绝)是水平 α\alpha 最有力的检验,对于 H0:μ=μ0H_0: \mu = \mu_0 对比 H1:μ=μ1>μ0H_1: \mu = \mu_1 > \mu_0 含已知 σ\sigma 的正态数据。

来源

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.