Math ClubMath Club
v1 · padrão canônico

Lição 79 — Teorema de Bayes aprofundado

Priors, posteriors e atualização sequencial. Forma de odds, prior conjugado Beta-binomial, base rate fallacy, Naive Bayes. Aplicações em diagnóstico médico, spam filtering e ML.

Used in: Stochastik LK alemão · H2 Math Statistics singapurense · Math B japonês · Equiv. AP Statistics EUA

P(HE)=P(EH)P(H)P(E)P(H \mid E) = \frac{P(E \mid H)\,P(H)}{P(E)}
Choose your door

Rigorous notation, full derivation, hypotheses

Definições e teoremas

Probabilidade condicional

"The conditional probability P(EF)P(E \mid F), the probability of EE given FF, expresses the probability of EE when we know that FF has occurred. It can be computed using the formula P(EF)=P(EF)/P(F)P(E \mid F) = P(EF)/P(F), assuming P(F)>0P(F) > 0." — Grinstead & Snell, Introduction to Probability, §4.1

Lei da probabilidade total

Teorema de Bayes

"Bayes' Theorem is just a formula that comes from the definition of conditional probability. Yet it is extremely powerful, and is the key to understanding what it means to rationally revise your beliefs in light of new evidence." — OpenIntro Statistics 4e, §3.2

Forma de odds

Atualização sequencial

Prior conjugado Beta-binomial

SVG — Diagrama de Bayes na tabela 2×2

Tabela 2×2 — Valor Preditivo PositivoDoente (prevalência p)Teste + : sens · p(verdadeiro positivo)TPSaudável (1 − p)Teste + : (1−espec)·(1−p)(falso positivo)FPVPP = TP / (TP + FP)= posterior P(doente | teste+)Prevalência baixa → FP domina → VPP baixo (base rate fallacy)

Diagrama de frequências absolutas. O VPP (Valor Preditivo Positivo) é o posterior bayesiano P(doente | teste positivo). Quando a prevalência é baixa, os falsos positivos superam os verdadeiros positivos mesmo com teste de alta qualidade.

Exemplos resolvidos

Exercise list

40 exercises · 10 with worked solution (25%)

Application 18Understanding 4Modeling 10Challenge 5Proof 3
  1. Ex. 79.1ApplicationAnswer key

    P(A)=0,3P(A) = 0{,}3, P(B)=0,5P(B) = 0{,}5, P(AB)=0,15P(A \cap B) = 0{,}15. Calcule P(AB)P(A \mid B).

  2. Ex. 79.2Application

    P(AB)=0,6P(A \mid B) = 0{,}6, P(B)=0,5P(B) = 0{,}5. Calcule P(AB)P(A \cap B).

  3. Ex. 79.3Application

    P(A)=0,1P(A) = 0{,}1, P(BA)=0,8P(B \mid A) = 0{,}8, P(BAˉ)=0,2P(B \mid \bar A) = 0{,}2. Calcule P(B)P(B).

  4. Ex. 79.4Application

    Com os dados do exercício 79.3, calcule P(AB)P(A \mid B).

  5. Ex. 79.5ApplicationAnswer key

    Doença com prevalência 0,5%. Teste diagnóstico: sensibilidade 95%, especificidade 95%. Calcule o VPP usando frequências em 10 000 pessoas.

  6. Ex. 79.6ApplicationAnswer key

    Mesmos dados do exercício 79.5, mas com prevalência 50%. Calcule o VPP e compare com o resultado anterior.

  7. Ex. 79.7Application

    Spam filter: P(spam)=0,3P(\text{spam}) = 0{,}3. Palavra "GRÁTIS" aparece em 60% dos spams e 5% dos e-mails legítimos. Calcule P(spamGRAˊTIS)P(\text{spam} \mid \text{GRÁTIS}).

  8. Ex. 79.8Application

    Urna A: 2 vermelhas, 3 azuis. Urna B: 5 vermelhas, 1 azul. Escolhe-se uma urna ao acaso e retira-se uma bola vermelha. Qual a probabilidade de a urna ser A?

  9. Ex. 79.9ApplicationAnswer key

    3 moedas: 2 honestas, 1 com duas caras. Escolhe-se uma ao acaso, lança-se uma vez, sai cara. Qual a probabilidade de a moeda escolhida ser a de duas caras?

  10. Ex. 79.10Application

    P(fumante)=0,2P(\text{fumante}) = 0{,}2. P(caˆncerfumante)=0,1P(\text{câncer} \mid \text{fumante}) = 0{,}1. P(caˆncer¬fumante)=0,01P(\text{câncer} \mid \neg\text{fumante}) = 0{,}01. Dado que uma pessoa tem câncer, qual a probabilidade de ser fumante?

  11. Ex. 79.11Application

    Atualização sequencial: dois testes positivos com sensibilidade 90% e especificidade 90%, aplicados a uma doença com prevalência 1%. Use o posterior do 1.º teste como prior do 2.º. Qual o VPP após os dois testes positivos consecutivos?

  12. Ex. 79.12Application

    Para um teste com sensibilidade 90% e especificidade 95%, calcule a razão de verossimilhança positiva LR+=sens/(1espec)\text{LR}^+ = \text{sens}/(1 - \text{espec}).

  13. Ex. 79.13Application

    Prior odds de 1:99 (prevalência 1%). LR+=18\text{LR}^+ = 18 (sensibilidade 90%, especificidade 95%). Calcule os posterior odds e o posterior.

  14. Ex. 79.14Application

    Qual dos valores a seguir é o posterior correto em um contexto com prior odds 1:99 e LR+=18\text{LR}^+ = 18?

  15. Ex. 79.15Application

    Prior θBeta(2,2)\theta \sim \text{Beta}(2, 2). Observa-se 7 caras em 10 lançamentos. Determine o posterior.

  16. Ex. 79.16Application

    Prior θBeta(1,1)\theta \sim \text{Beta}(1, 1) (uniforme). Observa-se 0 caras em 5 lançamentos. Determine o posterior e sua média.

  17. Ex. 79.17Application

    No exercício 79.15, qual é a média do posterior?

  18. Ex. 79.18Application

    Prior θBeta(2,8)\theta \sim \text{Beta}(2, 8). Novo lote: 30 peças inspecionadas, 6 defeituosas. Determine o posterior e a média posterior.

  19. Ex. 79.19ModelingAnswer key

    COVID-19 em fase endêmica: prevalência 5%. Teste rápido: sensibilidade 80%, especificidade 95%. Calcule o VPP usando frequências em 10 000 pessoas. Vale a pena isolar automaticamente todos os positivos?

  20. Ex. 79.20Modeling

    Naive Bayes para e-mail: P(spam)=0,3P(\text{spam}) = 0{,}3. No treino: "GRÁTIS" aparece em 60% dos spams e 5% dos hams; "ganhou" aparece em 50% dos spams e 10% dos hams. Um e-mail contém ambas as palavras. Classifique assumindo independência condicional.

  21. Ex. 79.21Modeling

    Três doenças: A (10% na população), B (5%), C (1%). Paciente apresenta sintoma S com P(SA)=0,3P(S|A) = 0{,}3, P(SB)=0,9P(S|B) = 0{,}9, P(SC)=0,9P(S|C) = 0{,}9. Qual a doença mais provável?

  22. Ex. 79.22Modeling

    Falácia do promotor: evidência de DNA tem frequência 1/1000 na população. O promotor afirma que a probabilidade de inocência é 1/1000. Por que este raciocínio está errado? Calcule o posterior correto assumindo que há 100 000 suspeitos plausíveis na cidade.

  23. Ex. 79.23ModelingAnswer key

    Classificador de fraude: sensibilidade 95%, especificidade 99,9%. Fraudes: 0,1% das transações. Calcule o VPP. Quantos falsos positivos por cada verdadeiro positivo?

  24. Ex. 79.24Modeling

    Teste de gravidez: sensibilidade 99%, especificidade 98%. Mulher com probabilidade prévia de gravidez de 30%. Calcule o VPP.

  25. Ex. 79.25ModelingAnswer key

    Polígrafo: sensibilidade 70%, especificidade 80%. Em interrogatório com suspeito que tem prior de culpa de 5%. Calcule o posterior após resultado positivo. O resultado é admissível como prova suficiente para condenar?

  26. Ex. 79.26ModelingAnswer key

    Dois testes independentes positivos (sens1_1 = 0,9, espec1_1 = 0,95; sens2_2 = 0,85, espec2_2 = 0,90). Prevalência 2%. Calcule o posterior após ambos os resultados positivos via atualização sequencial.

  27. Ex. 79.27Modeling

    Em uma fila de suspeitos, um tem cabelo vermelho (H) com probabilidade 70% de ser o culpado. Uma testemunha identifica o de cabelo vermelho com probabilidade 90% quando o culpado é H, e erroneamente 15% das vezes quando o culpado não é H. Dado que a testemunha apontou H, qual o posterior de culpa?

  28. Ex. 79.28Modeling

    Controle de qualidade com 3 linhas (A: 40% da produção, 2% defeito; B: 35%, 3%; C: 25%, 5%). Encontra-se uma peça defeituosa. Determine a probabilidade de cada linha ser a origem.

  29. Ex. 79.29Understanding

    O que é a base rate fallacy (falácia da taxa base)?

  30. Ex. 79.30Understanding

    Por que o prior importa mesmo em "ciência objetiva"? Uma análise que ignora o prior equivale a qual suposição implícita?

  31. Ex. 79.31Understanding

    Dois testes positivos independentes com razões de verossimilhança r1r_1 e r2r_2. Qual o efeito na forma de odds?

  32. Ex. 79.32Understanding

    Qual a diferença prática entre usar um prior Beta(1,1) e um prior Beta(10,10) para uma moeda? Em qual caso o posterior será mais sensível a novos dados?

  33. Ex. 79.33Challenge

    Mostre que dois testes positivos independentes condicionalmente dado HH resultam em posterior odds igual a r1×r2×r_1 \times r_2 \times prior odds, onde ri=LRi+r_i = \text{LR}_i^+.

  34. Ex. 79.34Challenge

    Demonstre que o posterior do modelo Bernoulli-Beta é Beta(α+k\alpha + k, β+nk\beta + n - k) quando o prior é Beta(α\alpha, β\beta) e observamos kk sucessos em nn ensaios.

  35. Ex. 79.35Proof

    Demonstre o teorema de Bayes a partir da definição de probabilidade condicional e da lei da probabilidade total.

  36. Ex. 79.36Proof

    Mostre que P(AB)=P(BA)P(A)/P(B)P(A \mid B) = P(B \mid A)\,P(A)/P(B) usando apenas a definição de probabilidade condicional. Identifique por que P(AB)P(BA)P(A \mid B) \neq P(B \mid A) em geral.

  37. Ex. 79.37Challenge

    Problema de Monty Hall com 3 portas. Use Bayes para calcular a probabilidade de o carro estar em cada porta depois que Monty (que sabe onde está o carro) abre uma porta vazia. Deve-se trocar?

  38. Ex. 79.38ChallengeAnswer key

    No Naive Bayes com features binárias, mostre que o classificador é equivalente a multiplicar os LRs individuais de cada feature. O que acontece quando a suposição de independência condicional é violada?

  39. Ex. 79.39ProofAnswer key

    Demonstre que a forma de odds de Bayes, posterior odds = LR ×\times prior odds, segue diretamente da forma usual do teorema de Bayes para dois eventos complementares HH e ¬H\neg H.

  40. Ex. 79.40Challenge

    Mostre que a média do posterior Beta(α+k\alpha + k, β+nk\beta + n - k) converge para o estimador de máxima verossimilhança k/nk/n quando nn \to \infty, para qualquer prior fixo Beta(α\alpha, β\beta). O que isso implica sobre a relação entre Bayes e frequentismo para grandes amostras?

Fontes

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.