Lección 108 — Prueba chi-cuadrado: bondad de ajuste e independencia
Estadística chi-cuadrado: distribución asintótica, grados de libertad, prueba de bondad de ajuste y prueba de independencia en tablas de contingencia. Corrección de Yates, V de Cramér.
Used in: 3.º año Bachillerato · Stochastik LK alemán · H2 Statistics singapurense · Matemáticas B japonés — estadística inferencial
Rigorous notation, full derivation, hypotheses
Definición rigurosa
Distribución chi-cuadrado
"Las distribuciones chi-cuadrado tienen una propiedad de aditividad: si y son independientes, entonces ." — OpenStax Statistics, §11.1
Prueba de bondad de ajuste (goodness of fit)
Prueba de independencia en tabla
"Las frecuencias esperadas para una prueba de independencia se calculan asumiendo que las proporciones de la fila son iguales en todas las columnas. Si la hipótesis nula es verdadera (variables independientes), este supuesto se satisface." — OpenIntro Statistics, §6.4
Supuestos de validez (regla de Cochran)
Corrección de Yates (tabla )
Tamaño de efecto: V de Cramér
Curva chi-cuadrado con df = 5. La región amarilla a la derecha del valor crítico es el área de rechazo de H0 al nivel alfa = 5%.
Ejemplos resueltos
Exercise list
42 exercises · 10 with worked solution (25%)
- Ex. 108.1Application
Un dado de seis caras es lanzado 60 veces. ¿Cuál es el número de grados de libertad en la prueba de bondad de ajuste a la distribución uniforme?
- Ex. 108.2Application
Para el dado del ejercicio anterior lanzado 60 veces, ¿cuál es la frecuencia esperada por cara?
- Ex. 108.3Application
Un dado es lanzado 60 veces: se observan 12, 8, 11, 9, 13, 7 para las caras 1 a 6. Calcula y concluye al 5%.
- Ex. 108.4Application
Calcula los grados de libertad para la prueba de independencia en una tabla de contingencia .
- Ex. 108.5Application
En una tabla de contingencia con , , , calcula .
- Ex. 108.6Application
En una prueba de independencia, se obtuvo con . El valor crítico al 5% es 5,99. ¿Cuál es la conclusión?
- Ex. 108.7ApplicationAnswer key
Calcula el V de Cramér: , , tabla (luego ).
- Ex. 108.8ApplicationAnswer key
¿En qué situaciones debe aplicarse la corrección de Yates en la prueba chi-cuadrado?
- Ex. 108.9ApplicationAnswer key
Un investigador tiene en dos de las cinco celdas de una tabla. ¿Es apropiada la prueba chi-cuadrado? Justifica.
- Ex. 108.10Application
Se observa en observaciones con proporciones esperadas . Calcula .
- Ex. 108.11Application
Para el ejercicio anterior (3 categorías, distribución completamente especificada), ¿cuál es el número de grados de libertad?
- Ex. 108.12Application
Un estudio mide presión arterial (alta/normal) en el mismo grupo de pacientes antes y después de un programa de ejercicios. ¿Por qué la prueba chi-cuadrado de independencia no es apropiada?
- Ex. 108.13Application
¿Cuál es el valor crítico (chi-cuadrado con 1 grado de libertad al nivel 5%)?
- Ex. 108.14Application
Calcula las frecuencias esperadas para la tabla con celdas , , , .
- Ex. 108.15Application
Con los esperados del ejercicio anterior, calcula y concluye al 5%.
- Ex. 108.16ApplicationAnswer key
¿Por qué en toda tabla de contingencia ? Explica geométrica o algebraicamente.
- Ex. 108.17Application
¿Cuáles son la media y la varianza de ? Para , ¿es la distribución aproximadamente simétrica?
- Ex. 108.18Application
En prueba de bondad de ajuste con categorías, ¿cómo cambian los grados de libertad cuando estimamos parámetros de la distribución a partir de los propios datos?
- Ex. 108.19Application
Muestra que el estadístico chi-cuadrado es siempre no-negativo.
- Ex. 108.20ApplicationAnswer key
¿La prueba chi-cuadrado de bondad de ajuste es unilateral (cola derecha) o bilateral? ¿Por qué?
- Ex. 108.21Application
en con distribución uniforme esperada. Calcula y concluye al 1%.
- Ex. 108.22Application
¿Cuál es la diferencia conceptual entre prueba de homogeneidad y prueba de independencia? ¿Cambia la fórmula de ?
- Ex. 108.23Application
con . ¿Cuál es la conclusión al 5% y al 1%? (Críticos: 11,07 y 15,09 respectivamente.)
- Ex. 108.24Understanding
¿Qué significaría obtener en una prueba de bondad de ajuste? ¿Es posible en datos reales?
- Ex. 108.25Understanding
¿Por qué muestras muy grandes hacen que el sea una medida problemática? ¿Qué alternativa usar?
- Ex. 108.26UnderstandingAnswer key
Describe la forma de la curva chi-cuadrado para pequeño (ej. ) vs. grande (ej. ). ¿Cómo se relaciona esto con el origen de la distribución como suma de cuadrados?
- Ex. 108.27UnderstandingAnswer key
¿Cuál de las fórmulas abajo es el estadístico chi-cuadrado de Pearson?
- Ex. 108.28Understanding
Explica por qué la regla de Cochran () es necesaria para la validez de la prueba chi-cuadrado.
- Ex. 108.29ModelingAnswer key
Cruzamiento dihíbrido de guisantes predice fenotipos en la proporción 9:3:3:1. En 160 descendientes se observan 95, 30, 27, 8. Prueba bondad de ajuste al 5%.
- Ex. 108.30Modeling
En encuesta con 400 estudiantes universitarios (200 hombres, 200 mujeres), se obtuvo la siguiente tabulación de opinión sobre cuotas (Favorable/Neutral/Contrario): hombres 70/60/70, mujeres 110/50/40. Prueba independencia al 5%.
- Ex. 108.31Modeling
Una muestra de 200 M&M's de un paquete presenta: 30 rojos, 35 naranjas, 22 amarillos, 40 verdes, 55 azules, 18 marrones. Según el fabricante, las proporciones son 13%, 20%, 14%, 16%, 24%, 13%. Prueba bondad de ajuste al 5%.
- Ex. 108.32Modeling
Test A/B/C en landing page: 200 visitantes por variación. Conversiones: A = 24, B = 30, C = 40. Prueba homogeneidad de tasas de conversión al 5%.
- Ex. 108.33Modeling
Cuatro máquinas producen defectos: 30, 40, 25, 35 defectos respectivamente (total 130). Prueba si la tasa de defectos es uniforme entre máquinas al nivel 5%.
- Ex. 108.34ModelingAnswer key
Ensayo clínico con 50 pacientes (25 por grupo): vacuna resultó en 18 curas, placebo en 12 curas. Monta la tabla y aplica la prueba chi-cuadrado con corrección de Yates al 5%.
- Ex. 108.35Modeling
¿Los datos de accidentes en carreteras del DNIT siguen distribución Poisson? Describe el procedimiento completo de la prueba de bondad de ajuste, incluyendo cómo tratar el parámetro desconocido.
- Ex. 108.36Understanding
¿Cuál de las condiciones abajo es necesaria para la validez de la prueba chi-cuadrado de independencia?
- Ex. 108.37Understanding
En un estudio antes-después, los mismos 80 pacientes se clasifican como hipertensos o normales antes y después de intervención. ¿Por qué usar McNemar en lugar del chi-cuadrado estándar?
- Ex. 108.38Understanding
Una encuesta con 500 brasileños registra región (Norte, Sudeste, Sur) y preferencia por pago (al contado vs. a plazos). ¿Cuál es la prueba más apropiada para verificar si preferencia y región son independientes?
- Ex. 108.39Challenge
Un servicio de urgencias registró 210 atendimientos en una semana (30 por día esperado). Se observó: Dom=18, Lun=40, Mar=28, Mié=25, Jue=29, Vie=42, Sab=28. ¿Es uniforme el flujo entre días? Prueba al 5%.
- Ex. 108.40Challenge
Encuesta electoral en 3 estados brasileños (SP, RJ, MG) con 600 electores (200 por estado) registra preferencia por candidato (A, B, C). Datos: SP=(80,70,50), RJ=(60,90,50), MG=(70,60,70). Prueba independencia entre estado y candidato al 5% y calcula V de Cramér.
- Ex. 108.41ProofAnswer key
Muestra que para categorías, donde es el estadístico de la prueba bilateral para proporción. Esto explica por qué .
- Ex. 108.42Proof
Demuestra la fórmula para la prueba de independencia en tabla , explicando cuántas restricciones independientes los marginales imponen al vector de conteos.
Fuentes
- OpenStax Statistics — Illowsky, Dean · CC-BY · Capítulo 11 (§11.1–11.5). Fuente primaria de ejercicios y ejemplos.
- OpenIntro Statistics (4ª ed) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA · §6.3–6.4. Enfoque conceptual y ejercicios de contexto.
- Introduction to Modern Statistics — Çetinkaya-Rundel, Hardin · CC-BY-SA · §18–19. Perspectiva mediante simulación e inferencia moderna.