Lección 79 — Teorema de Bayes profundizado
Priors, posteriors y actualización secuencial. Forma de odds, prior conjugado Beta-binomial, base rate fallacy, Naive Bayes. Aplicaciones en diagnóstico médico, filtro de spam y ML.
Used in: Stochastik LK alemão · H2 Math Statistics singapurense · Math B japonês · Equiv. AP Statistics EUA
Rigorous notation, full derivation, hypotheses
Definiciones y teoremas
Probabilidad condicional
"The conditional probability , the probability of given , expresses the probability of when we know that has occurred. It can be computed using the formula , assuming ." — Grinstead & Snell, Introduction to Probability, §4.1
Ley de la probabilidad total
Teorema de Bayes
"Bayes' Theorem is just a formula that comes from the definition of conditional probability. Yet it is extremely powerful, and is the key to understanding what it means to rationally revise your beliefs in light of new evidence." — OpenIntro Statistics 4e, §3.2
Forma de odds
Actualización secuencial
Prior conjugado Beta-binomial
SVG — Diagrama de Bayes en la tabla 2×2
Diagrama de frecuencias absolutas. El VPP (Valor Predictivo Positivo) es el posterior bayesiano P(enfermo | test positivo). Cuando la prevalencia es baja, los falsos positivos superan a los verdaderos positivos incluso con un test de alta calidad.
Ejemplos resueltos
Exercise list
40 exercises · 10 with worked solution (25%)
- Ex. 79.1ApplicationAnswer key
, , . Calcula .
- Ex. 79.2Application
, . Calcula .
- Ex. 79.3Application
, , . Calcula .
- Ex. 79.4Application
Con los datos del ejercicio 79.3, calcula .
- Ex. 79.5ApplicationAnswer key
Enfermedad con prevalencia 0,5%. Test diagnóstico: sensibilidad 95%, especificidad 95%. Calcula el VPP usando frecuencias en 10 000 personas.
- Ex. 79.6ApplicationAnswer key
Mismos datos del ejercicio 79.5, pero con prevalencia 50%. Calcula el VPP y compáralo con el resultado anterior.
- Ex. 79.7Application
Filtro de spam: . La palabra "GRATIS" aparece en el 60% de los spams y en el 5% de los correos legítimos. Calcula .
- Ex. 79.8Application
Urna A: 2 rojas, 3 azules. Urna B: 5 rojas, 1 azul. Se escoge una urna al azar y se extrae una bola roja. ¿Cuál es la probabilidad de que la urna sea A?
- Ex. 79.9ApplicationAnswer key
3 monedas: 2 justas, 1 con dos caras. Se elige una al azar, se lanza una vez y sale cara. ¿Cuál es la probabilidad de que la moneda elegida sea la de dos caras?
- Ex. 79.10Application
. . . Dado que una persona tiene cáncer, ¿cuál es la probabilidad de que sea fumadora?
- Ex. 79.11Application
Actualización secuencial: dos tests positivos con sensibilidad 90% y especificidad 90%, aplicados a una enfermedad con prevalencia 1%. Usa el posterior del 1.er test como prior del 2.º. ¿Cuál es el VPP tras los dos tests positivos consecutivos?
- Ex. 79.12Application
Para un test con sensibilidad 90% y especificidad 95%, calcula la razón de verosimilitud positiva .
- Ex. 79.13Application
Prior odds de 1:99 (prevalencia 1%). (sensibilidad 90%, especificidad 95%). Calcula los posterior odds y el posterior.
- Ex. 79.14Application
¿Cuál de los siguientes valores es el posterior correcto en un contexto con prior odds 1:99 y ?
- Ex. 79.15Application
Prior . Se observan 7 caras en 10 lanzamientos. Determina el posterior.
- Ex. 79.16Application
Prior (uniforme). Se observan 0 caras en 5 lanzamientos. Determina el posterior y su media.
- Ex. 79.17Application
En el ejercicio 79.15, ¿cuál es la media del posterior?
- Ex. 79.18Application
Prior . Nuevo lote: 30 piezas inspeccionadas, 6 defectuosas. Determina el posterior y la media posterior.
- Ex. 79.19ModelingAnswer key
COVID-19 en fase endémica: prevalencia 5%. Test rápido: sensibilidad 80%, especificidad 95%. Calcula el VPP usando frecuencias en 10 000 personas. ¿Vale la pena aislar automáticamente a todos los positivos?
- Ex. 79.20Modeling
Naive Bayes para correo electrónico: . En el entrenamiento: "GRATIS" aparece en el 60% de los spams y en el 5% de los hams; "ganaste" aparece en el 50% de los spams y en el 10% de los hams. Un correo contiene ambas palabras. Clasifícalo asumiendo independencia condicional.
- Ex. 79.21Modeling
Tres enfermedades: A (10% en la población), B (5%), C (1%). El paciente presenta el síntoma S con , , . ¿Cuál es la enfermedad más probable?
- Ex. 79.22Modeling
Falacia del fiscal: la evidencia de ADN tiene una frecuencia de 1/1000 en la población. El fiscal afirma que la probabilidad de inocencia es 1/1000. ¿Por qué este razonamiento es incorrecto? Calcula el posterior correcto asumiendo que hay 100 000 sospechosos plausibles en la ciudad.
- Ex. 79.23ModelingAnswer key
Clasificador de fraude: sensibilidad 95%, especificidad 99,9%. Fraudes: 0,1% de las transacciones. Calcula el VPP. ¿Cuántos falsos positivos hay por cada verdadero positivo?
- Ex. 79.24Modeling
Test de embarazo: sensibilidad 99%, especificidad 98%. Mujer con probabilidad previa de embarazo del 30%. Calcula el VPP.
- Ex. 79.25ModelingAnswer key
Polígrafo: sensibilidad 70%, especificidad 80%. En un interrogatorio con un sospechoso que tiene prior de culpa del 5%. Calcula el posterior tras un resultado positivo. ¿Es el resultado admisible como prueba suficiente para condenar?
- Ex. 79.26ModelingAnswer key
Dos tests independientes positivos (sens = 0,9, espec = 0,95; sens = 0,85, espec = 0,90). Prevalencia 2%. Calcula el posterior tras ambos resultados positivos mediante actualización secuencial.
- Ex. 79.27Modeling
En una rueda de reconocimiento, uno de los sospechosos tiene el pelo rojo (H) con probabilidad 70% de ser el culpable. Un testigo identifica al de pelo rojo con probabilidad 90% cuando el culpable es H, y erróneamente el 15% de las veces cuando el culpable no es H. Dado que el testigo señaló a H, ¿cuál es el posterior de culpabilidad?
- Ex. 79.28Modeling
Control de calidad con 3 líneas (A: 40% de la producción, 2% defecto; B: 35%, 3%; C: 25%, 5%). Se encuentra una pieza defectuosa. Determina la probabilidad de que cada línea sea el origen.
- Ex. 79.29Understanding
¿Qué es la base rate fallacy (falacia de la tasa base)?
- Ex. 79.30Understanding
¿Por qué importa el prior incluso en la "ciencia objetiva"? ¿A qué supuesto implícito equivale un análisis que ignora el prior?
- Ex. 79.31Understanding
Dos tests positivos independientes con razones de verosimilitud y . ¿Cuál es el efecto en la forma de odds?
- Ex. 79.32Understanding
¿Cuál es la diferencia práctica entre usar un prior Beta(1,1) y un prior Beta(10,10) para una moneda? ¿En qué caso el posterior será más sensible a los nuevos datos?
- Ex. 79.33Challenge
Demuestra que dos tests positivos condicionalmente independientes dado dan lugar a un posterior odds igual a prior odds, donde .
- Ex. 79.34Challenge
Demuestra que el posterior del modelo Bernoulli-Beta es Beta(, ) cuando el prior es Beta(, ) y se observan éxitos en ensayos.
- Ex. 79.35Proof
Demuestra el teorema de Bayes a partir de la definición de probabilidad condicional y la ley de la probabilidad total.
- Ex. 79.36Proof
Demuestra que usando solo la definición de probabilidad condicional. Identifica por qué en general.
- Ex. 79.37Challenge
Problema de Monty Hall con 3 puertas. Usa Bayes para calcular la probabilidad de que el coche esté en cada puerta después de que Monty (que sabe dónde está el coche) abra una puerta vacía. ¿Conviene cambiar?
- Ex. 79.38ChallengeAnswer key
En Naive Bayes con características binarias, demuestra que el clasificador es equivalente a multiplicar los LRs individuales de cada característica. ¿Qué ocurre cuando se viola el supuesto de independencia condicional?
- Ex. 79.39ProofAnswer key
Demuestra que la forma de odds de Bayes, posterior odds = LR prior odds, se deduce directamente de la forma usual del teorema de Bayes para dos eventos complementarios y .
- Ex. 79.40Challenge
Demuestra que la media del posterior Beta(, ) converge al estimador de máxima verosimilitud cuando , para cualquier prior fijo Beta(, ). ¿Qué implica esto sobre la relación entre Bayes y el frecuentismo para muestras grandes?
Fuentes
-
Grinstead, C.M. & Snell, J.L. — Introduction to Probability (2nd ed.) · GNU FDL · Dartmouth College. Capítulo 4 (§4.1): Probabilidad condicional, independencia, teorema de Bayes — fuente primaria de la mayoría de los ejercicios de urnas, monedas y demostraciones de esta lección.
-
Diez, D.M., Çetinkaya-Rundel, M., Barr, C.D. — OpenIntro Statistics (4th ed.) · CC-BY-SA · OpenIntro. Secciones §3.2–3.4: probabilidad condicional, Bayes, tablas de frecuencias y actualización bayesiana — fuente de los ejercicios de VPP, actualización secuencial y prior conjugado.
-
Illowsky, B. & Dean, S. — Statistics (OpenStax) · CC-BY · OpenStax. Sección §3.4 (Contingency Tables and Probability Trees): diagnóstico médico, filtro de spam y árboles de probabilidad — base de los ejercicios de Naive Bayes y fraude.