v1 · padrão canônico

Lição 79 — Teorema de Bayes aprofundado

Priors, posteriors e atualização sequencial. Forma de odds, prior conjugado Beta-binomial, base rate fallacy, Naive Bayes. Aplicações em diagnóstico médico, spam filtering e ML.

Used in: Stochastik LK alemão · H2 Math Statistics singapurense · Math B japonês · Equiv. AP Statistics EUA

P(H \mid E) = \frac{P(E \mid H)\,P(H)}{P(E)}

O teorema de Bayes é a regra de atualização racional de crenças. O prior $P(H)$ representa o que acreditamos antes de ver a evidência; a verossimilhança $P(E \mid H)$ mede o quanto a evidência favorece a hipótese; o posterior $P(H \mid E)$ é a crença atualizada depois de observar $E$ . O denominador $P(E)$ normaliza o resultado para que a probabilidade some 1.

Choose your door

Rigorous notation, full derivation, hypotheses

Definições e teoremas

Probabilidade condicional

"The conditional probability $P(E \mid F)$ , the probability of $E$ given $F$ , expresses the probability of $E$ when we know that $F$ has occurred. It can be computed using the formula $P(E \mid F) = P(EF)/P(F)$ , assuming $P(F) > 0$ ." — Grinstead & Snell, Introduction to Probability, §4.1

Lei da probabilidade total

Teorema de Bayes

"Bayes' Theorem is just a formula that comes from the definition of conditional probability. Yet it is extremely powerful, and is the key to understanding what it means to rationally revise your beliefs in light of new evidence." — OpenIntro Statistics 4e, §3.2

Forma de odds

Definition· Forma de odds (razão de probabilidades)

A forma de odds reescreve Bayes como uma multiplicação de razões:

$\underbrace{\frac{P(H \mid E)}{P(\neg H \mid E)}}_{\text{posterior odds}} = \underbrace{\frac{P(E \mid H)}{P(E \mid \neg H)}}_{\text{razão de verossimilhança (LR)}} \times \underbrace{\frac{P(H)}{P(\neg H)}}_{\text{prior odds}}$

A razão de verossimilhança positiva $\text{LR}^+ = \text{sensibilidade}/(1 - \text{especificidade})$ quantifica o quanto um resultado positivo de teste favorece a hipótese.

Atualização sequencial

Prior conjugado Beta-binomial

Definition· Prior conjugado

O prior $\pi(\theta)$ é conjugado à likelihood $L(\theta \mid \mathbf{x})$ se o posterior $\pi(\theta \mid \mathbf{x})$ pertence à mesma família paramétrica que o prior.

Para o modelo Bernoulli: se $X_1, \ldots, X_n \overset{\text{iid}}{\sim} \text{Bernoulli}(\theta)$ e $k = \sum X_i$ , com prior $\theta \sim \text{Beta}(\alpha, \beta)$ :

$\theta \mid k \sim \text{Beta}(\alpha + k,\; \beta + n - k)$

Prior Beta(1,1) = uniforme em $[0,1]$ (prior não-informativo). Média do posterior: $(\alpha + k)/(\alpha + \beta + n)$ .

SVG — Diagrama de Bayes na tabela 2×2

Diagrama de frequências absolutas. O VPP (Valor Preditivo Positivo) é o posterior bayesiano P(doente | teste positivo). Quando a prevalência é baixa, os falsos positivos superam os verdadeiros positivos mesmo com teste de alta qualidade.

Exemplos resolvidos

Example— 1· Cálculo direto com lei da probabilidade total (aplicacao)

Problema: Uma fábrica tem três linhas de produção: A (40% da produção), B (35%) e C (25%). As taxas de defeito são: A: 2%, B: 3%, C: 5%. Uma peça é retirada ao acaso e está defeituosa. Qual a probabilidade de ter sido produzida pela linha B?

Estratégia: Aplicar a lei da probabilidade total para calcular $P(\text{defeito})$ , depois usar o teorema de Bayes para obter $P(B \mid \text{defeito})$ .

Resolução:

Definir os eventos: $H_A$ , $H_B$ , $H_C$ = peça vem da linha A, B, C. $D$ = peça defeituosa.
Priors: $P(H_A) = 0{,}40$ , $P(H_B) = 0{,}35$ , $P(H_C) = 0{,}25$ .
Likelihoods: $P(D \mid H_A) = 0{,}02$ , $P(D \mid H_B) = 0{,}03$ , $P(D \mid H_C) = 0{,}05$ .
Lei da probabilidade total: $P(D) = 0{,}02 \times 0{,}40 + 0{,}03 \times 0{,}35 + 0{,}05 \times 0{,}25 = 0{,}008 + 0{,}0105 + 0{,}0125 = 0{,}031$
Bayes para a linha B: $P(H_B \mid D) = \frac{0{,}03 \times 0{,}35}{0{,}031} = \frac{0{,}0105}{0{,}031} \approx 0{,}339$

Verificação: Calculemos também para A e C: $P(H_A \mid D) = 0{,}008/0{,}031 \approx 0{,}258$ ; $P(H_C \mid D) = 0{,}0125/0{,}031 \approx 0{,}403$ . Soma: $0{,}258 + 0{,}339 + 0{,}403 = 1{,}000$ . Correto.

Fonte. Grinstead & Snell — Introduction to Probability §4.1 — GNU FDL. (Problema adaptado da estrutura do Exemplo 4.11, três causas com diferentes likelihoods.)

Example— 2· Base rate fallacy e VPP (aplicacao)

Problema: Doença X afeta 0,5% da população. Teste diagnóstico: sensibilidade 95%, especificidade 90%. Um paciente testa positivo. Qual é o valor preditivo positivo?

Estratégia: Usar frequências absolutas em uma amostra de 10 000 pessoas — método recomendado por OpenIntro Statistics para evitar erros de intuição.

Resolução:

Em 10 000 pessoas:

Doentes: $10000 \times 0{,}005 = 50$ .
Verdadeiros positivos (TP): $50 \times 0{,}95 = 47{,}5 \approx 48$ (arredondado).
Saudáveis: $10000 - 50 = 9950$ .
Falsos positivos (FP): $9950 \times (1 - 0{,}90) = 9950 \times 0{,}10 = 995$ .
Total de positivos: $48 + 995 = 1043$ .
$\text{VPP} = 48/1043 \approx 4{,}6\%$ .

Verificação: Via fórmula direta: $\text{VPP} = \frac{0{,}95 \times 0{,}005}{0{,}95 \times 0{,}005 + 0{,}10 \times 0{,}995} = \frac{0{,}00475}{0{,}00475 + 0{,}0995} = \frac{0{,}00475}{0{,}10425} \approx 4{,}6\%$

Coincide. A intuição de "95% de chance de estar doente" está errada por um fator de 20 — ilustração clássica da base rate fallacy.

Fonte. OpenIntro Statistics 4e §3.2 — CC-BY-SA. (Estrutura do Exemplo 3.10, diagnóstico médico com prevalência baixa.)

Example— 3· Urna com duas causas — forma clássica (aplicacao)

Problema: Urna A contém 3 bolas vermelhas e 2 azuis. Urna B contém 1 bola vermelha e 4 azuis. Uma urna é escolhida ao acaso (50%-50%) e uma bola é retirada. A bola é vermelha. Qual a probabilidade de a urna escolhida ter sido a A?

Estratégia: Duas hipóteses ( $H_A$ e $H_B$ ), prior uniforme, evidência = bola vermelha. Aplicar Bayes diretamente.

Resolução:

Priors: $P(H_A) = P(H_B) = 0{,}5$ .
Likelihoods: $P(V \mid H_A) = 3/5 = 0{,}60$ ; $P(V \mid H_B) = 1/5 = 0{,}20$ .
Probabilidade total da bola vermelha: $P(V) = 0{,}60 \times 0{,}50 + 0{,}20 \times 0{,}50 = 0{,}30 + 0{,}10 = 0{,}40$
Posterior: $P(H_A \mid V) = \frac{0{,}60 \times 0{,}50}{0{,}40} = \frac{0{,}30}{0{,}40} = 0{,}75$

Verificação: $P(H_B \mid V) = 0{,}10/0{,}40 = 0{,}25$ . Soma $= 1$ . A urna A tem bolas vermelhas em proporção 3 vezes maior que a urna B, então faz sentido que o posterior de A seja 3 vezes o de B ( $0{,}75 = 3 \times 0{,}25$ ).

Fonte. Grinstead & Snell — Introduction to Probability §4.1 — GNU FDL. (Adaptado do Exercício 4.1.1 sobre duas urnas.)

Example— 4· Atualização sequencial com dois testes (intermediario)

Problema: Prevalência de uma doença: 2%. Dois testes independentes: Teste 1 com sensibilidade 90% e especificidade 95%; Teste 2 com sensibilidade 85% e especificidade 92%. Ambos dão positivo. Qual o posterior após os dois resultados positivos?

Estratégia: Aplicar Bayes sequencialmente: o posterior do Teste 1 torna-se o prior para o Teste 2.

Resolução:

Passo 1 — após Teste 1 positivo: $P(D \mid T_1^+) = \frac{0{,}90 \times 0{,}02}{0{,}90 \times 0{,}02 + 0{,}05 \times 0{,}98} = \frac{0{,}018}{0{,}018 + 0{,}049} = \frac{0{,}018}{0{,}067} \approx 0{,}269$

Passo 2 — após Teste 2 positivo (prior = 0,269): $P(D \mid T_1^+, T_2^+) = \frac{0{,}85 \times 0{,}269}{0{,}85 \times 0{,}269 + 0{,}08 \times 0{,}731} = \frac{0{,}229}{0{,}229 + 0{,}0585} = \frac{0{,}229}{0{,}287} \approx 0{,}798$

Verificação pela forma de odds:

Prior odds: $0{,}02/0{,}98 \approx 0{,}0204$ .
$\text{LR}_1^+ = 0{,}90/0{,}05 = 18$ ; $\text{LR}_2^+ = 0{,}85/0{,}08 = 10{,}625$ .
Posterior odds: $0{,}0204 \times 18 \times 10{,}625 = 3{,}898$ .
Posterior: $3{,}898/(1 + 3{,}898) \approx 79{,}6\%$ . Confirma o cálculo acima.

Fonte. OpenIntro Statistics 4e §3.3 — CC-BY-SA. (Extensão do Exemplo 3.13 sobre atualização sequencial com dois testes independentes.)

Example— 5· Prior conjugado Beta-binomial (avancado)

Problema: Um controle de qualidade usa prior Beta(2, 8) para a taxa de defeitos $\theta$ de uma linha de produção (equivalente a "observamos historicamente 2 defeitos em 10 inspeções"). Em um novo lote, inspeciona-se 20 peças e encontra-se 4 defeituosas. Determine: (a) o posterior, (b) a média posterior, (c) um intervalo de credibilidade aproximado de 90%.

Estratégia: Usar a propriedade de conjugação Beta-Binomial. Posterior = Beta( $\alpha + k$ , $\beta + n - k$ ). Para o intervalo, usar a aproximação pela distribuição normal da Beta para parâmetros moderados.

Resolução:

(a) Posterior: Prior Beta(2, 8), $n = 20$ , $k = 4$ . $\theta \mid 4 \sim \text{Beta}(2 + 4,\; 8 + 20 - 4) = \text{Beta}(6, 24)$

(b) Média posterior: $\mu = \alpha/(\alpha + \beta) = 6/(6 + 24) = 6/30 = 0{,}20$ .

Compare com o prior: $\mu_{\text{prior}} = 2/10 = 0{,}20$ . A MLE seria $k/n = 4/20 = 0{,}20$ . Neste caso coincidem porque o prior era construído com as mesmas proporções.

(c) Intervalo de credibilidade 90%: A distribuição Beta(6, 24) tem desvio padrão $\sigma = \sqrt{\alpha\beta/((\alpha+\beta)^2(\alpha+\beta+1))} = \sqrt{6 \times 24/(900 \times 31)} \approx \sqrt{144/27900} \approx 0{,}0718$ .

Intervalo aproximado $\mu \pm 1{,}645\sigma$ : $[0{,}20 - 0{,}118, 0{,}20 + 0{,}118] = [0{,}082, 0{,}318]$ . (O intervalo exato, por quantis da Beta(6,24), é aproximadamente $[0{,}090, 0{,}338]$ .)

Verificação: Conforme $n \to \infty$ , a influência do prior diminui e o posterior concentra-se na MLE. Com prior Beta(2,8) e 200 peças observadas com 40 defeitos, o posterior seria Beta(42, 168) com média $42/210 \approx 0{,}20$ e desvio padrão $\approx 0{,}028$ — muito mais concentrado.

Fonte. OpenIntro Statistics 4e §3.4 — CC-BY-SA. (Estrutura do exercício sobre inferência bayesiana com prior conjugado, Seção de inferência bayesiana introdutória.)

Exercise list

40 exercises · 10 with worked solution (25%)

Application 18Understanding 4Modeling 10Challenge 5Proof 3

Fontes

Grinstead, C.M. & Snell, J.L. — Introduction to Probability (2nd ed.) · GNU FDL · Dartmouth College. Capítulo 4 (§4.1): Probabilidade condicional, independência, teorema de Bayes — fonte primária da maioria dos exercícios de urnas, moedas e demonstrações desta lição.
Diez, D.M., Çetinkaya-Rundel, M., Barr, C.D. — OpenIntro Statistics (4th ed.) · CC-BY-SA · OpenIntro. Seções §3.2–3.4: probabilidade condicional, Bayes, tabelas de frequência e atualização bayesiana — fonte dos exercícios de VPP, atualização sequencial e prior conjugado.
Illowsky, B. & Dean, S. — Statistics (OpenStax) · CC-BY · OpenStax. Seção §3.4 (Contingency Tables and Probability Trees): diagnóstico médico, spam filtering e árvores de probabilidade — base dos exercícios de Naive Bayes e fraude.