Math ClubMath Club
v1 · padrão canônico

Lição 110 — Consolidação Trim 11: Inferência Estatística

Workshop de síntese do trim 11: IC para média, testes z e t, ANOVA, qui-quadrado, regressão simples e múltipla, e inferência bayesiana — todos os pilares da estatística inferencial em um mapa integrado.

Used in: 3.º ano do EM / Stochastik LK alemão · Math B japonês (Estatística) · H2 Mathematics (Singapura) — Statistics

θ^±zα/2σn;T=Xˉμ0s/n;P(θD)P(Dθ)P(θ)\hat\theta \pm z_{\alpha/2}\frac{\sigma}{\sqrt{n}};\quad T = \frac{\bar X - \mu_0}{s/\sqrt{n}};\quad P(\theta \mid D) \propto P(D \mid \theta)\,P(\theta)
Choose your door

Rigorous notation, full derivation, hypotheses

第11三学期的正式综合

统计推断的三个支柱

"置信区间为总体参数提供了一个合理的值域。正确的解释:如果多次重复该程序,构建的区间中有 (1α)100%(1-\alpha)100\% 将包含真实参数。" — OpenIntro Statistics §5.2

问题:估计μ?CI: X̄ ± t·s/√nn ≥ (z·σ/E)²检验 H₀z / t / F / χ²预测Y?回归OLS更新信念?贝叶斯定理

第11三学期决策流程——每个统计问题都有相应的方法。

已解决的例子

Exercise list

42 exercises · 10 with worked solution (25%)

Application 17Understanding 14Modeling 5Challenge 2Proof 4
  1. Ex. 110.1Application

    n=64n = 64xˉ=50\bar x = 50σ=8\sigma = 8(已知)。为 μ\mu 构建95%置信区间。

  2. Ex. 110.2Application

    用上一个练习的数据(xˉ=50\bar x = 50s=8s = 8n=64n = 64),检验 H0:μ=48H_0: \mu = 48 vs H1:μ48H_1: \mu \neq 48 在5%水平上。计算 TT 并做决定。

  3. Ex. 110.3ApplicationAnswer key

    两个独立样本:xˉ1=100\bar x_1 = 100s1=10s_1 = 10n1=50n_1 = 50xˉ2=95\bar x_2 = 95s2=12s_2 = 12n2=60n_2 = 60。在5%水平上执行双侧Welch t检验。

  4. Ex. 110.4Application

    三个组各 ni=20n_i = 20 株植物,平均 Xˉ1=10\bar X_1 = 10Xˉ2=12\bar X_2 = 12Xˉ3=14\bar X_3 = 14。假设 σ2=4\sigma^2 = 4(组内方差),计算方差分析的 FF 并在5%水平上做决定。

  5. Ex. 110.5ApplicationAnswer key

    拟合模型:Y^=5+2X\hat Y = 5 + 2X。对 X=10X = 10 的点预测是多少?

  6. Ex. 110.6ApplicationAnswer key

    R2=0,8R^2 = 0{,}8n=50n = 50p=4p = 4 个预测变量。计算 Radj2R^2_{\text{adj}}

  7. Ex. 110.7Application

    列联表 2×32 \times 3 产生 χ2=8\chi^2 = 8。自由度有多少个?在5%水平上有关联吗?

  8. Ex. 110.8Application

    先验 θBeta(2,2)\theta \sim \text{Beta}(2, 2)。观察 X=8X = 8 次成功在 n=10n = 10 次试验中。θ\theta 的后验分布是什么?

  9. Ex. 110.9Application

    用上一个练习的后验 Beta(10,4)\text{Beta}(10, 4),计算后验平均和MAP(后验分布的众数)。

  10. Ex. 110.10ApplicationAnswer key

    从标准正态分布表中找:z0,025z_{0,025} 是多少?(答:1,9601{,}960。)

  11. Ex. 110.11Application

    从 t 表中找:t0,025;19t_{0,025;\,19}。(答:2,0932{,}093。)

  12. Ex. 110.12ApplicationAnswer key

    从F表中找 F0,05;2,27F_{0,05;\,2,\,27}。(答:3,35{\approx}\,3{,}35。)

  13. Ex. 110.13Application

    χ0,05;42\chi^2_{0,05;\,4}。(答:9,4889{,}488。)

  14. Ex. 110.14Understanding

    哪个检验适合比较公司中男性和女性的平均薪资,样本独立,方差未知?

  15. Ex. 110.15Understanding

    调查有100个人,记录性别(男/女)和偏好政党(A/B/C)。哪个检验验证变量间的关联?

  16. Ex. 110.16Understanding

    一项研究测试4种药物剂量(低、中、高、安慰剂)对20个患者/组的体重减轻(kg)的影响。分析方法是什么?

  17. Ex. 110.17Understanding

    测量20个人的体重在3个月节食前后。数据是配对的。正确的检验是什么?

  18. Ex. 110.18Application

    在双侧检验中得到统计量 Z=2,1Z = 2{,}1。计算p值并在 α=5%\alpha = 5\% 水平上做决定。

  19. Ex. 110.19ApplicationAnswer key

    对于95%置信区间,误差界 E=2E = 2σ=10\sigma = 10,最小样本量是多少?

  20. Ex. 110.20Understanding

    Cohen的 d=0,5d = 0{,}5。按Cohen惯例,效应量大小是多少?

  21. Ex. 110.21Application

    列联表产生Cramér的 V=0,25V = 0{,}25。分类效应量。

  22. Ex. 110.22Application

    方差分析产生 η2=0,10\eta^2 = 0{,}10。效应量大小是多少?

  23. Ex. 110.23Understanding

    BF10=5BF_{10} = 5。按Jeffreys量表,这代表对 H1H_1 的什么样强度的证据?

  24. Ex. 110.24Understanding

    各用一句话:频率论置信区间(95%)和贝叶斯可信区间(95%)的解释有什么区别?

  25. Ex. 110.25Understanding

    在一个假设检验中,用一句话区分第一类错误与第二类错误。

  26. Ex. 110.26Understanding

    区分:统计显著性与实际显著性。为什么一个结果可能在统计上显著但实际上无关?

  27. Ex. 110.27UnderstandingAnswer key

    区分:统计关联与因果关系。为什么线性回归衡量关联而不是原因?

  28. Ex. 110.28Understanding

    区分:配对数据与独立样本。各举一个例子。

  29. Ex. 110.29Understanding

    在多元回归中区分:R2R^2Radj2R^2_{\text{adj}}。为什么第二个对于比较预测变量数量不同的模型更可靠?

  30. Ex. 110.30Understanding

    在贝叶斯推断中,区分:先验分布与后验分布。

  31. Ex. 110.31ModelingAnswer key

    A/B测试:版本A在1000名访客中获得80次转化;版本B获得110/1000。应用比例差异的z检验(频率论)并用先验 Beta(1,1)\text{Beta}(1,1) 估计 P(θB>θA)P(\theta_B > \theta_A) 的贝叶斯方法。

  32. Ex. 110.32Modeling

    临床试验:药物降低血压。对 n=64n = 64 名患者,配对差值(用药前-用药后)有 Dˉ=7\bar D = 7 mmHg 和 sD=5s_D = 5 mmHg。进行配对t检验(单侧:H1:μD>0H_1: \mu_D > 0)并为平均减少量构建95%置信区间。

  33. Ex. 110.33Modeling

    房产价格回归:仅用 m2m^2 的模型有 R2=0,70R^2 = 0{,}70n=200n = 200)。添加卧室数后,R2=0,78R^2 = 0{,}78。计算每个模型的 Radj2R^2_{\text{adj}} 并决定额外预测变量是否合理。

  34. Ex. 110.34Modeling

    五种饮食,每种30个人。概述完整分析协议:假设检验、方差分析、事后分析和所有要报告的内容。

  35. Ex. 110.35ModelingAnswer key

    选举调查:4个地区(北、东北、东南、南)×\times 3名候选人。列联表,N=400N = 400。计算自由度,执行卡方、Cramér的V,并识别最大标准化残差的单元格。

  36. Ex. 110.36Understanding

    证明为什么 p=0,06p = 0{,}06 不构成 H0H_0 为真的证据。

  37. Ex. 110.37Proof

    证明一个二元虚拟变量的简单线性回归(0/1指示组)产生完全相同的结果作为两个独立样本t检验(等方差)。

  38. Ex. 110.38Proof

    证明当方差分析仅有 k=2k = 2 组时,F统计量等于双侧t检验的T统计量的平方。明确自由度。

  39. Ex. 110.39ProofAnswer key

    证明带均匀先验的MAP估计量与最大似然估计(MLE)完全相同。从MAP定义开始。

  40. Ex. 110.40Challenge

    用伪代码或结构化列表描述电商转化率A/B测试的完整流程:从功效分析(最小可检测效应2个百分点,α=5%\alpha = 5\%,80%功效)到最终报告,包括统计审查者需要的所有元素。

  41. Ex. 110.41Challenge

    用详细文本(至少200字)比较在在线A/B测试中何时优选频率论方法与贝叶斯方法。考虑:可解释性、序列决策、先验融入和错误保证。

  42. Ex. 110.42Proof

    通过积分(或通过核识别)证明如果 θBeta(α,β)\theta \sim \text{Beta}(\alpha, \beta)XθBin(n,θ)X \mid \theta \sim \text{Bin}(n, \theta),则 θXBeta(α+X,  β+nX)\theta \mid X \sim \text{Beta}(\alpha + X,\; \beta + n - X)

参考资源

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.