Lição 110 — Consolidação Trim 11: Inferência Estatística
Workshop de síntese do trim 11: IC para média, testes z e t, ANOVA, qui-quadrado, regressão simples e múltipla, e inferência bayesiana — todos os pilares da estatística inferencial em um mapa integrado.
Used in: 3.º ano do EM / Stochastik LK alemão · Math B japonês (Estatística) · H2 Mathematics (Singapura) — Statistics
Rigorous notation, full derivation, hypotheses
第11三学期的正式综合
统计推断的三个支柱
"置信区间为总体参数提供了一个合理的值域。正确的解释:如果多次重复该程序,构建的区间中有 将包含真实参数。" — OpenIntro Statistics §5.2
第11三学期决策流程——每个统计问题都有相应的方法。
已解决的例子
Exercise list
42 exercises · 10 with worked solution (25%)
- Ex. 110.1Application
,,(已知)。为 构建95%置信区间。
- Ex. 110.2Application
用上一个练习的数据(,,),检验 vs 在5%水平上。计算 并做决定。
- Ex. 110.3ApplicationAnswer key
两个独立样本:,,;,,。在5%水平上执行双侧Welch t检验。
- Ex. 110.4Application
三个组各 株植物,平均 ,,。假设 (组内方差),计算方差分析的 并在5%水平上做决定。
- Ex. 110.5ApplicationAnswer key
拟合模型:。对 的点预测是多少?
- Ex. 110.6ApplicationAnswer key
,, 个预测变量。计算 。
- Ex. 110.7Application
列联表 产生 。自由度有多少个?在5%水平上有关联吗?
- Ex. 110.8Application
先验 。观察 次成功在 次试验中。 的后验分布是什么?
- Ex. 110.9Application
用上一个练习的后验 ,计算后验平均和MAP(后验分布的众数)。
- Ex. 110.10ApplicationAnswer key
从标准正态分布表中找: 是多少?(答:。)
- Ex. 110.11Application
从 t 表中找:。(答:。)
- Ex. 110.12ApplicationAnswer key
从F表中找 。(答:。)
- Ex. 110.13Application
找 。(答:。)
- Ex. 110.14Understanding
哪个检验适合比较公司中男性和女性的平均薪资,样本独立,方差未知?
- Ex. 110.15Understanding
调查有100个人,记录性别(男/女)和偏好政党(A/B/C)。哪个检验验证变量间的关联?
- Ex. 110.16Understanding
一项研究测试4种药物剂量(低、中、高、安慰剂)对20个患者/组的体重减轻(kg)的影响。分析方法是什么?
- Ex. 110.17Understanding
测量20个人的体重在3个月节食前后。数据是配对的。正确的检验是什么?
- Ex. 110.18Application
在双侧检验中得到统计量 。计算p值并在 水平上做决定。
- Ex. 110.19ApplicationAnswer key
对于95%置信区间,误差界 和 ,最小样本量是多少?
- Ex. 110.20Understanding
Cohen的 。按Cohen惯例,效应量大小是多少?
- Ex. 110.21Application
列联表产生Cramér的 。分类效应量。
- Ex. 110.22Application
方差分析产生 。效应量大小是多少?
- Ex. 110.23Understanding
。按Jeffreys量表,这代表对 的什么样强度的证据?
- Ex. 110.24Understanding
各用一句话:频率论置信区间(95%)和贝叶斯可信区间(95%)的解释有什么区别?
- Ex. 110.25Understanding
在一个假设检验中,用一句话区分第一类错误与第二类错误。
- Ex. 110.26Understanding
区分:统计显著性与实际显著性。为什么一个结果可能在统计上显著但实际上无关?
- Ex. 110.27UnderstandingAnswer key
区分:统计关联与因果关系。为什么线性回归衡量关联而不是原因?
- Ex. 110.28Understanding
区分:配对数据与独立样本。各举一个例子。
- Ex. 110.29Understanding
在多元回归中区分: 与 。为什么第二个对于比较预测变量数量不同的模型更可靠?
- Ex. 110.30Understanding
在贝叶斯推断中,区分:先验分布与后验分布。
- Ex. 110.31ModelingAnswer key
A/B测试:版本A在1000名访客中获得80次转化;版本B获得110/1000。应用比例差异的z检验(频率论)并用先验 估计 的贝叶斯方法。
- Ex. 110.32Modeling
临床试验:药物降低血压。对 名患者,配对差值(用药前用药后)有 mmHg 和 mmHg。进行配对t检验(单侧:)并为平均减少量构建95%置信区间。
- Ex. 110.33Modeling
房产价格回归:仅用 的模型有 ()。添加卧室数后,。计算每个模型的 并决定额外预测变量是否合理。
- Ex. 110.34Modeling
五种饮食,每种30个人。概述完整分析协议:假设检验、方差分析、事后分析和所有要报告的内容。
- Ex. 110.35ModelingAnswer key
选举调查:4个地区(北、东北、东南、南) 3名候选人。列联表,。计算自由度,执行卡方、Cramér的V,并识别最大标准化残差的单元格。
- Ex. 110.36Understanding
证明为什么 不构成 为真的证据。
- Ex. 110.37Proof
证明一个二元虚拟变量的简单线性回归(0/1指示组)产生完全相同的结果作为两个独立样本t检验(等方差)。
- Ex. 110.38Proof
证明当方差分析仅有 组时,F统计量等于双侧t检验的T统计量的平方。明确自由度。
- Ex. 110.39ProofAnswer key
证明带均匀先验的MAP估计量与最大似然估计(MLE)完全相同。从MAP定义开始。
- Ex. 110.40Challenge
用伪代码或结构化列表描述电商转化率A/B测试的完整流程:从功效分析(最小可检测效应2个百分点,,80%功效)到最终报告,包括统计审查者需要的所有元素。
- Ex. 110.41Challenge
用详细文本(至少200字)比较在在线A/B测试中何时优选频率论方法与贝叶斯方法。考虑:可解释性、序列决策、先验融入和错误保证。
- Ex. 110.42Proof
通过积分(或通过核识别)证明如果 且 ,则 。
参考资源
- OpenIntro Statistics(第4版) — Diez, Çetinkaya-Rundel, Barr · 2019 · CC-BY-SA。置信区间、检验、方差分析、卡方和回归的主要来源(§5–9)。
- Statistics(OpenStax) — Illowsky, Dean · CC-BY。置信区间、z和t检验、分布表的实际例子来源(§8–13)。
- Statistical Thinking for the 21st Century — Russell Poldrack · CC-BY-NC。贝叶斯推断、效应量、可重复性和重复危机来源(第9、15章)。