Math ClubMath Club
v1 · padrão canônico

Lição 109 — Estatística bayesiana introdutória

Prior, verossimilhança, posterior. Regra de Bayes. Conjugados Beta-Bernoulli. MAP versus MLE. Intervalo credível. Introdução à inferência pelo paradigma bayesiano.

Used in: Stochastik LK (Alemanha, Klasse 12) · H2 Math Statistics (Singapura) · AP Statistics (EUA)

P(θD)=P(Dθ)P(θ)P(D)P(\theta \mid D) = \frac{P(D \mid \theta)\,P(\theta)}{P(D)}
Choose your door

Rigorous notation, full derivation, hypotheses

严格定义

贝叶斯定理

"贝叶斯定理是条件概率的基本结果,但其解释改变了一切:它提供了一个正式的方法,在证据的照亮下更新信念。" — OpenIntro Statistics §3.6

共轭先验:Beta-Bernoulli情形

点估计量

可信区间

贝叶斯因子

先验 P(θ)Beta(α, β)似然函数P(D | θ)s次成功 / n次试验×后验 P(θ|D)Beta(α+s, β+n−s)更新的信念贝叶斯更新循环——后验成为下一批数据的先验

贝叶斯流程:先验 × 似然 → 后验。当新数据到达时,后验成为新的先验。

解决的例子

Exercise list

34 exercises · 8 with worked solution (25%)

Application 24Understanding 3Modeling 4Challenge 1Proof 2
  1. Ex. 109.1Application

    某疾病的患病率:1%。测试灵敏度:95%。假阳性率:10%。患者测试呈阳性。计算患有该疾病的概率。

  2. Ex. 109.2Application

    一枚硬币掷10次,得到4次正面。先验:Beta(1,1)(均匀)。计算后验、后验平均值并与MLE比较。

  3. Ex. 109.3Application

    先验:Beta(4, 6)。样本:10次中有7次成功。计算后验、后验平均值和MAP。

  4. Ex. 109.4Application

    先验:Beta(2, 2)。批次1:10次中有5次成功。批次2:10次中有8次成功。进行顺序更新,计算最终后验平均值。

  5. Ex. 109.5Application

    患病率:0.5%。灵敏度:99%。假阳性率:2%。患者测试呈阳性。患有该疾病的概率是多少?

  6. Ex. 109.6Application

    10次试验中有3次成功。比较先验Beta(1,1)和Beta(5,5)的后验平均值。哪个先验对后验影响更大?

  7. Ex. 109.7Application

    三家工厂生产螺钉:E1(产量的60%,缺陷率30%)、E2(30%,缺陷率50%)、E3(10%,缺陷率10%)。取出一个缺陷螺钉。它来自E1的概率是多少?

  8. Ex. 109.8Application

    先验:Beta(3, 3)(对公平硬币的轻微信念,平均值0.5)。掷5次,出现0次正面。计算后验和新的平均值。

  9. Ex. 109.9Application

    先验:Beta(1,1)。数据:20次中15次成功。计算MAP和MLE。它们相等吗?为什么?

  10. Ex. 109.10Application

    袋子里有两枚硬币:一枚总是出现正面(H),另一枚公平(J)。随机选一枚。掷两次,都是正面。是硬币H的概率是多少?

  11. Ex. 109.11Understanding

    95%贝叶斯可信区间意味着什么?

  12. Ex. 109.12UnderstandingAnswer key

    关于MAP和MLE哪个陈述是错误的?

  13. Ex. 109.13Understanding

    样本大小n如何影响先验和后验之间的关系?

  14. Ex. 109.14Application

    一名学生通过了考试(AA)。已知:P(AB1)=0.8P(A \mid B_1) = 0.8(学了很多,概率60%),P(AB2)=0.2P(A \mid B_2) = 0.2(没学,概率40%)。已知他通过了,学了很多的概率是多少?

  15. Ex. 109.15Application

    机器的成功率未知。先验:Beta(4, 2)(4次成功和2次失败的历史)。新测试:6次连续成功。计算后验、平均值和MAP。

  16. Ex. 109.16Application

    在10次掷币中得到8次正面后,计算H1:θ=0.7H_1: \theta = 0.7 vs H0:θ=0.5H_0: \theta = 0.5的贝叶斯因子。

  17. Ex. 109.17ApplicationAnswer key

    三批各10次试验:7次成功、6次成功、7次成功。先验:Beta(1,1)。进行顺序更新,计算最终后验平均值。

  18. Ex. 109.18Application

    患病率:30%。灵敏度:95%。假阳性率:20%。患者测试呈阳性。计算患有该疾病的概率,并与练习109.1比较。

  19. Ex. 109.19ApplicationAnswer key

    证明Beta-Bernoulli模型的后验平均值是先验和样本比例之间的加权平均。识别权重。

  20. Ex. 109.20Application

    先验:Beta(2, 2)。数据:3次中0次成功。计算后验、MAP和后验平均值。

  21. Ex. 109.21Application

    在福塔莱萨某一天下雨的概率:40%。若要下雨,有85%的可能会有浓密乌云。若不下雨,有30%的可能。有浓密乌云。下雨的概率是多少?

  22. Ex. 109.22ApplicationAnswer key

    生产历史:10%缺陷(相当于100件产品中有10个缺陷 = Beta(10,90))。新检查:20件中有3个缺陷。计算后验和后验平均值。

  23. Ex. 109.23Application

    袋子里有3枚硬币:1枚总出现正面(H),2枚公平(J)。随机取一枚并掷一次:出现正面。是硬币H的概率是多少?

  24. Ex. 109.24Application

    先验Beta(1,1)。数据:20次中10次成功。描述后验和95%中心可信区间(使用Beta(11,11)的2.5%分位数≈0.31)。

  25. Ex. 109.25Modeling

    一个培训班历史上在ENEM中通过率为70%。新班级,20名学生:15人通过。提出合适的Beta先验,计算后验和通过率的后验平均值。

  26. Ex. 109.26ModelingAnswer key

    胰腺癌患病率:0.2%。活检:灵敏度92%,特异度97%。阳性检查。计算P(癌 | 正)并讨论医学决定。

  27. Ex. 109.27Modeling

    物流公司报告在监管的50次交付中有20次延迟。使用先验Beta(1,1),以90%可信区间估计延迟率。

  28. Ex. 109.28ModelingAnswer key

    一家金融科技公司知道1%的交易是欺诈性的。一个算法检测到当前交易的值超出了客户的正常范围。P(异常值 | 欺诈) = 85%,P(异常值 | 合法) = 2%。计算欺诈的概率。

  29. Ex. 109.29Proof

    证明对于具有Beta先验的Bernoulli模型,后验也是Beta。识别参数。

  30. Ex. 109.30ProofAnswer key

    论证对于Bernoulli模型,使用Beta(1,1)先验(均匀)时,MAP估计量与MLE重合。

  31. Ex. 109.31ApplicationAnswer key

    垃圾邮件过滤器:20%的邮件是垃圾。在垃圾邮件中,每个可疑关键词出现的概率为60%;在合法邮件中为5%。一封邮件有3个关键词。是垃圾的概率是多少?

  32. Ex. 109.32Application

    两组大鼠:系列1(10个动物,暴露后8个肿瘤)和系列2(10个动物,3个肿瘤)。两个费率的先验Beta(1,1)。计算每个系列的后验和后验平均值。

  33. Ex. 109.33Application

    一个罐子内橙球的比例未知。100次有放回抽取后,50个是橙色。先验Beta(1,1)。计算后验、平均值和95%可信区间。

  34. Ex. 109.34Challenge

    Bernoulli的Jeffreys先验是Beta(0.5; 0.5)。在10次中6次成功后,计算后验。研究该先验意味着什么"对参数化不变",并将后验平均值与先验Beta(1,1)比较。

来源

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.