Lección 103 — Prueba de hipótesis: estructura y lógica
Estructura formal del test de hipótesis: H0 vs H1, estadístico de prueba, p-valor, nivel de significación, errores de tipo I y II, y potencia del test.
Used in: 3.º año de Bachillerato (17-18 años) · Equiv. Stochastik LK alemán · Equiv. Math B japonés · H2 Statistics de Singapur
Rigorous notation, full derivation, hypotheses
Definición rigurosa
Los cinco elementos de un test de hipótesis
"La hipótesis nula representa una afirmación de escepticismo. Es el statu quo que se mantendría salvo que exista evidencia suficiente en su contra." — OpenIntro Statistics, §5.1
Errores y potencia del test
Definición formal del p-valor
"El p-valor mide en qué medida los datos son consistentes con . Un p-valor pequeño indica que los datos son incompatibles con — no que sea falsa con probabilidad ." — OpenIntro Statistics, §5.1
Tipos de hipótesis alternativa
Ejemplos resueltos
Exercise list
26 exercises · 6 with worked solution (25%)
- Ex. 103.1ApplicationAnswer key
Formula las hipótesis y para el siguiente escenario: una agencia de defensa del consumidor quiere verificar si el peso medio de un envase de 500 g de harina es conforme a lo declarado.
- Ex. 103.2Application
Unos investigadores quieren verificar si los adolescentes duermen menos de las 8 horas recomendadas por noche. Formula y .
- Ex. 103.3Application
, . Datos: , , (conocido). Calcula el estadístico z y el p-valor. Concluye para .
- Ex. 103.4Application
Un fabricante afirma que sus bombillas duran en media 1000 h. Una muestra de bombillas da h con h (conocido). Al nivel del 5%, ¿es la vida útil media inferior a lo declarado?
- Ex. 103.5Application
En un juicio penal, es "el acusado es inocente" y es "el acusado es culpable". Describe los errores de tipo I y tipo II en este contexto. ¿Cuál se considera más grave en un sistema jurídico democrático? ¿Por qué?
- Ex. 103.6Understanding
Un test da . ¿Cuál de las siguientes afirmaciones es correcta?
- Ex. 103.7Understanding
Un test con da . El investigador concluye: "el efecto no existe." ¿Qué puede estar fallando?
- Ex. 103.8Application
Un centro educativo ha implementado una nueva metodología. La nota media histórica es puntos. Tras la intervención, alumnos obtuvieron y (conocido). Al nivel del 5%, ¿ha mejorado la nota?
- Ex. 103.9Application
Un servicio de urgencias quiere detectar una reducción de 5 min en el tiempo de atención (, ). Con y potencia del 90%, ¿cuál es el mínimo?
- Ex. 103.10ApplicationAnswer key
Una moneda se lanza 100 veces y sale cara 60 veces. Al nivel del 5%, ¿es la moneda justa?
- Ex. 103.11Application
Un investigador cambia el nivel de significación de a manteniendo fijo. Explica el efecto sobre el error de tipo II y la potencia del test.
- Ex. 103.12ApplicationAnswer key
El nivel normal de glucemia en ayunas es mg/dL. Una muestra de diabéticos da mg/dL con mg/dL. Al nivel del 1%, ¿es la glucemia media elevada?
- Ex. 103.13Understanding
Un resultado es "estadísticamente significativo al 5%". ¿Qué significa esto correctamente?
- Ex. 103.14Application
Una empresa quiere detectar si el peso medio de sus productos ha caído de g a g, con g, y potencia del 80%. ¿Cuál es el mínimo?
- Ex. 103.15Application
Un estudio de genómica realiza 1000 tests simultáneos con . Todos los genes testados son nulos (sin efecto real). ¿Cuántos falsos positivos se esperan? Si 60 genes resultan "significativos", ¿cuál es la tasa de falsas descubiertas estimada?
- Ex. 103.16Application
Una moneda se lanza 800 veces y sale cara 384 veces. Al nivel del 5%, ¿es la moneda justa?
- Ex. 103.17ApplicationAnswer key
Una encuesta con adolescentes registró un sueño medio de h con h (de estudios anteriores). Al nivel del 5%, ¿duermen menos de 8 horas?
- Ex. 103.18UnderstandingAnswer key
¿Cuál de las siguientes afirmaciones sobre la significación estadística es correcta?
- Ex. 103.19Modeling
Un ensayo clínico contrasta 20 endpoints simultáneamente con . ¿Cuál es la probabilidad de al menos un falso positivo sin corrección? Describe cómo la corrección de Bonferroni resuelve el problema y discute sus limitaciones.
- Ex. 103.20Application
La tasa histórica de aprobados en una prueba de acceso de un centro es el 30%. Tras una nueva metodología, 38 de 100 alumnos superaron la prueba. Al nivel del 5%, ¿ha mejorado la tasa?
- Ex. 103.21Application
Contrasta frente a con y . Calcula el p-valor para y . ¿Qué revela esto sobre el p-valor y el tamaño del efecto?
- Ex. 103.22ApplicationAnswer key
Presión sistólica normal: mmHg. Muestra de adultos sedentarios: mmHg, mmHg. Al nivel del 1%, ¿es la presión media elevada?
- Ex. 103.23Application
Un estudio veterinario quiere detectar que el peso medio de cerdos de una raza ha cambiado de 125 kg a 120 kg (, ). Con bilateral y potencia del 80%, ¿cuántos animales se necesitan?
- Ex. 103.24Modeling
Una prueba de evaluación de un centro da puntos frente a de la media regional, con y alumnos. El resultado es "altamente significativo" (). Calcula el tamaño del efecto de Cohen . ¿Es educativamente relevante la diferencia de 2 puntos? Razona la respuesta.
- Ex. 103.25Challenge
Muestra que, bajo verdadera, el p-valor sigue una distribución Uniforme para tests continuos. Usa ese resultado para verificar que .
- Ex. 103.26Proof
Usa el Lema de Neyman-Pearson para mostrar que el test z unilateral (rechazar si ) es el test más potente de nivel para frente a con datos normales y conocido.
Fuentes
- OpenIntro Statistics (4.ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA. Secciones §5.1–5.3 (estructura del test, p-valor, potencia, tamaño muestral).
- Statistics (OpenStax) — Illowsky, Dean · CC-BY. Capítulo 9 (hipótesis nula y alternativa, errores de tipo I y II, ejemplos completos con z).
- Statistical Thinking for the 21st Century — Russell Poldrack · CC-BY-NC. Capítulos 10–11 (crisis de replicabilidad, uso responsable del p-valor, FDR, tamaño del efecto).