v1 · padrão canônico

Lección 103 — Prueba de hipótesis: estructura y lógica

Estructura formal del test de hipótesis: H0 vs H1, estadístico de prueba, p-valor, nivel de significación, errores de tipo I y II, y potencia del test.

Used in: 3.º año de Bachillerato (17-18 años) · Equiv. Stochastik LK alemán · Equiv. Math B japonés · H2 Statistics de Singapur

p\text{-valor} = P(T \geq t_{\mathrm{obs}} \mid H_0) \leq \alpha \Rightarrow \text{rejeita } H_0

Choose your door

Rigorous notation, full derivation, hypotheses

Definición rigurosa

Los cinco elementos de un test de hipótesis

"La hipótesis nula $H_0$ representa una afirmación de escepticismo. Es el statu quo que se mantendría salvo que exista evidencia suficiente en su contra." — OpenIntro Statistics, §5.1

Errores y potencia del test

Definition· Error de tipo I, error de tipo II y potencia

	$H_0$ verdadera	$H_0$ falsa
Rechaza $H_0$	Error de tipo I ( $\alpha$ )	Decisión correcta (potencia $= 1-\beta$ )
No rechaza $H_0$	Decisión correcta	Error de tipo II ( $\beta$ )

Error de tipo I (falso positivo): rechazar $H_0$ cuando es verdadera. La probabilidad se controla mediante $\alpha$ .
Error de tipo II (falso negativo): no rechazar $H_0$ cuando es falsa. Probabilidad $\beta$ (depende de $H_1$ , $\sigma$ , $n$ ).
Potencia $= 1 - \beta$ : probabilidad de detectar el efecto real.

Para un tamaño muestral fijo, reducir $\alpha$ aumenta $\beta$ (compromiso). Para incrementar la potencia sin sacrificar $\alpha$ : aumentar $n$ .

Definición formal del p-valor

"El p-valor mide en qué medida los datos son consistentes con $H_0$ . Un p-valor pequeño indica que los datos son incompatibles con $H_0$ — no que $H_0$ sea falsa con probabilidad $1-p$ ." — OpenIntro Statistics, §5.1

Tipos de hipótesis alternativa

Ejemplos resueltos

Example— 103.1· Test bilateral para la media con z (basico)

Problema. Una empresa afirma que el peso medio de sus paquetes de café es $\mu_0 = 500$ g. Una muestra de $n = 36$ paquetes da $\bar X = 492$ g con $\sigma = 24$ g (conocido). Al nivel $\alpha = 0{,}05$ , ¿contradicen los datos la afirmación?

Estrategia. $H_0: \mu = 500$ , $H_1: \mu \neq 500$ (bilateral). Se usa el estadístico z porque $\sigma$ es conocido.

Resolución.

$Z = \frac{\bar X - \mu_0}{\sigma/\sqrt{n}} = \frac{492 - 500}{24/\sqrt{36}} = \frac{-8}{4} = -2{,}00$

p-valor bilateral: $p = 2\,P(Z \leq -2{,}00) = 2 \times 0{,}0228 = 0{,}0456$ .

Como $p = 0{,}0456 < \alpha = 0{,}05$ , rechazamos $H_0$ . Los datos contradicen la afirmación de la empresa al nivel del 5%.

Verificación. El valor crítico para el test bilateral con $\alpha = 0{,}05$ es $z_{0{,}025} = 1{,}960$ . Como $|{-}2{,}00| = 2{,}00 > 1{,}960$ , el rechazo mediante el estadístico concuerda con el p-valor. Coherente.

Fuente. OpenStax Statistics, §9.2, Ejemplo 9.3 — CC-BY.

Example— 103.2· Identificacion de errores de tipo I y II (conceptual)

Problema. Un test de calidad verifica si un lote de medicamentos tiene una concentración media de principio activo de 50 mg ( $H_0$ ). Al nivel del 5%, el lote se aprueba o se rechaza. (a) ¿Qué constituye un error de tipo I en este contexto? (b) ¿Y un error de tipo II? (c) ¿Cuál es más grave?

Estrategia. Trasladar las definiciones formales al contexto específico.

Resolución.

(a) Error de tipo I: rechazar $H_0$ cuando $\mu = 50$ mg — es decir, rechazar un lote que en realidad está conforme. Consecuencia: desperdicio de producto válido y coste de reelaboración.

(b) Error de tipo II: no rechazar $H_0$ cuando $\mu \neq 50$ mg — es decir, aprobar un lote fuera de especificación. Consecuencia: el medicamento subdosificado o sobredosificado llega al paciente.

(c) En la mayoría de los contextos farmacéuticos, el error de tipo II es más grave: un medicamento fuera de especificación puede causar daño al paciente. Por eso los ensayos clínicos utilizan $\alpha$ pequeño pero exigen una potencia alta (bajo $\beta$ ), aumentando $n$ .

Verificación. La asimetría entre los errores justifica calibrar $\alpha$ y $\beta$ de forma diferente según el contexto — en medicina se usa $\alpha = 0{,}01$ y una potencia del 80-90%.

Fuente. OpenIntro Statistics, §5.2, Ejemplo 5.4 — CC-BY-SA.

Example— 103.3· Calculo de potencia y tamanio muestral (intermedio)

Problema. Un investigador quiere detectar que el tiempo medio de atención de una urgencia hospitalaria ha cambiado de $\mu_0 = 30$ min a $\mu_1 = 27$ min ( $\delta = 3$ min), con $\sigma = 10$ min, $\alpha = 0{,}05$ (bilateral) y potencia del 80%. ¿Cuál es el $n$ mínimo?

Estrategia. Aplicar la fórmula de tamaño muestral para la potencia: $n = (z_{\alpha/2} + z_\beta)^2 \sigma^2/\delta^2$ .

Resolución.

$z_{0{,}025} = 1{,}960$ , $z_{0{,}20} = 0{,}842$ (potencia del 80% $\Rightarrow \beta = 0{,}20$ ).

$n = \frac{(1{,}960 + 0{,}842)^2 \times 10^2}{3^2} = \frac{(2{,}802)^2 \times 100}{9} = \frac{7{,}851 \times 100}{9} \approx 87{,}2$

Redondeando: $n = 88$ atenciones.

Verificación. Si $\delta = 6$ min (efecto doble): $n = 7{,}851 \times 100/36 \approx 22$ . Un efecto mayor requiere una muestra menor — coherente.

Fuente. OpenIntro Statistics, §5.3, Ejemplo 5.7 — CC-BY-SA.

Example— 103.4· Test unilateral — medicamento (intermedio)

Problema. Un nuevo anticoagulante afirma reducir el tiempo medio de coagulación de $\mu_0 = 12$ s a un valor inferior. Una muestra de $n = 20$ pacientes da $\bar X = 11{,}2$ s y $s = 2$ s. Al nivel $\alpha = 0{,}05$ , ¿es eficaz el medicamento?

Estrategia. $H_0: \mu \geq 12$ , $H_1: \mu < 12$ (unilateral a la izquierda). Estadístico t con 19 grados de libertad.

Resolución.

$T = \frac{11{,}2 - 12}{2/\sqrt{20}} = \frac{-0{,}8}{0{,}4472} = -1{,}789$

Para $H_1: \mu < 12$ , p-valor $= P(t_{19} \leq -1{,}789)$ . De la tabla t: $P(t_{19} \leq -1{,}729) = 0{,}05$ y $P(t_{19} \leq -2{,}093) = 0{,}025$ . Por tanto $p \approx 0{,}045$ .

Como $p = 0{,}045 < 0{,}05$ , rechazamos $H_0$ . Existe evidencia de que el medicamento reduce el tiempo de coagulación.

Verificación. Valor crítico unilateral: $t_{0{,}05,\,19} = -1{,}729$ . Como $T = -1{,}789 < -1{,}729$ , el rechazo mediante el estadístico concuerda. Coherente.

Fuente. OpenStax Statistics, §9.4, Ejemplo 9.8 — CC-BY.

Example— 103.5· Interpretacion erronea del p-valor y correccion (avanzado)

Problema. Un investigador obtiene $p = 0{,}03$ en un test de $H_0: \mu = 0$ y afirma: "Hay un 97% de probabilidad de que el efecto sea real." Identifica el error y formula la interpretación correcta.

Estrategia. Aplicar la definición formal del p-valor y distinguir las probabilidades sobre los datos de las probabilidades sobre las hipótesis.

Resolución.

La afirmación es incorrecta por dos motivos:

El p-valor es una probabilidad sobre los datos (dado $H_0$ ), no sobre las hipótesis. $P(\text{datos} \mid H_0) \neq P(H_0 \mid \text{datos})$ — confundir ambas es la falacia de la transposición del condicional (descuido de la tasa base).
$1 - p\text{-valor} = 0{,}97$ no tiene interpretación de probabilidad de $H_1$ . Para obtener $P(H_1 \mid \text{datos})$ sería necesario aplicar el teorema de Bayes con una distribución a priori sobre las hipóteses.

Interpretación correcta: "Si $H_0$ fuera verdadera, habría solo un 3% de probabilidad de observar un efecto tan grande (o mayor) que el observado. Los datos son estadísticamente incompatibles con $H_0$ al nivel del 5%."

Verificación. Dos estudios independientes con $p = 0{,}04$ cada uno no implican que un tercer estudio tenga $p = 0{,}04$ — la combinación de evidencias se realiza mediante metaanálisis, no multiplicando p-valores.

Fuente. OpenIntro Statistics, §5.1, Sección "Interpreting p-values" — CC-BY-SA.

Exercise list

26 exercises · 6 with worked solution (25%)

Application 18Understanding 4Modeling 2Challenge 1Proof 1

Ex. 103.1ApplicationAnswer key
Formula las hipótesis $H_0$ y $H_1$ para el siguiente escenario: una agencia de defensa del consumidor quiere verificar si el peso medio de un envase de 500 g de harina es conforme a lo declarado.
Solve online
Ex. 103.2Application
Unos investigadores quieren verificar si los adolescentes duermen menos de las 8 horas recomendadas por noche. Formula $H_0$ y $H_1$ .
Solve online
Ex. 103.3Application
$H_0: \mu = 50$ , $H_1: \mu \neq 50$ . Datos: $n = 25$ , $\bar X = 52$ , $\sigma = 10$ (conocido). Calcula el estadístico z y el p-valor. Concluye para $\alpha = 0{,}05$ .
Solve online
Ex. 103.4Application
Un fabricante afirma que sus bombillas duran en media 1000 h. Una muestra de $n = 64$ bombillas da $\bar X = 985$ h con $\sigma = 50$ h (conocido). Al nivel del 5%, ¿es la vida útil media inferior a lo declarado?
Solve online
Ex. 103.5Application
En un juicio penal, $H_0$ es "el acusado es inocente" y $H_1$ es "el acusado es culpable". Describe los errores de tipo I y tipo II en este contexto. ¿Cuál se considera más grave en un sistema jurídico democrático? ¿Por qué?
Solve online
Ex. 103.6Understanding
Un test da $p = 0{,}03$ . ¿Cuál de las siguientes afirmaciones es correcta?
Solve online
Ex. 103.7Understanding
Un test con $n = 10$ da $p = 0{,}12$ . El investigador concluye: "el efecto no existe." ¿Qué puede estar fallando?
Solve online
Ex. 103.8Application
Un centro educativo ha implementado una nueva metodología. La nota media histórica es $\mu_0 = 35$ puntos. Tras la intervención, $n = 40$ alumnos obtuvieron $\bar X = 37$ y $\sigma = 8$ (conocido). Al nivel del 5%, ¿ha mejorado la nota?
Solve online
Ex. 103.9Application
Un servicio de urgencias quiere detectar una reducción de 5 min en el tiempo de atención ( $\delta = 5$ , $\sigma = 10$ ). Con $\alpha = 0{,}05$ y potencia del 90%, ¿cuál es el $n$ mínimo?
Solve online
Ex. 103.10ApplicationAnswer key
Una moneda se lanza 100 veces y sale cara 60 veces. Al nivel del 5%, ¿es la moneda justa?
Solve online
Ex. 103.11Application
Un investigador cambia el nivel de significación de $\alpha = 0{,}05$ a $\alpha = 0{,}01$ manteniendo $n$ fijo. Explica el efecto sobre el error de tipo II y la potencia del test.
Solve online
Ex. 103.12ApplicationAnswer key
El nivel normal de glucemia en ayunas es $\mu_0 = 120$ mg/dL. Una muestra de $n = 50$ diabéticos da $\bar X = 128$ mg/dL con $\sigma = 20$ mg/dL. Al nivel del 1%, ¿es la glucemia media elevada?
Solve online
Ex. 103.13Understanding
Un resultado es "estadísticamente significativo al 5%". ¿Qué significa esto correctamente?
Solve online
Ex. 103.14Application
Una empresa quiere detectar si el peso medio de sus productos ha caído de $\mu_0 = 250$ g a $\mu_1 = 245$ g, con $\sigma = 20$ g, $\alpha = 0{,}05$ y potencia del 80%. ¿Cuál es el $n$ mínimo?
Solve online
Ex. 103.15Application
Un estudio de genómica realiza 1000 tests simultáneos con $\alpha = 0{,}05$ . Todos los genes testados son nulos (sin efecto real). ¿Cuántos falsos positivos se esperan? Si 60 genes resultan "significativos", ¿cuál es la tasa de falsas descubiertas estimada?
Solve online
Ex. 103.16Application
Una moneda se lanza 800 veces y sale cara 384 veces. Al nivel del 5%, ¿es la moneda justa?
Solve online
Ex. 103.17ApplicationAnswer key
Una encuesta con $n = 30$ adolescentes registró un sueño medio de $\bar X = 7{,}5$ h con $\sigma = 1{,}5$ h (de estudios anteriores). Al nivel del 5%, ¿duermen menos de 8 horas?
Solve online
Ex. 103.18UnderstandingAnswer key
¿Cuál de las siguientes afirmaciones sobre la significación estadística es correcta?
Solve online
Ex. 103.19Modeling
Un ensayo clínico contrasta 20 endpoints simultáneamente con $\alpha = 0{,}05$ . ¿Cuál es la probabilidad de al menos un falso positivo sin corrección? Describe cómo la corrección de Bonferroni resuelve el problema y discute sus limitaciones.
Solve online
Ex. 103.20Application
La tasa histórica de aprobados en una prueba de acceso de un centro es el 30%. Tras una nueva metodología, 38 de 100 alumnos superaron la prueba. Al nivel del 5%, ¿ha mejorado la tasa?
Solve online
Ex. 103.21Application
Contrasta $H_0: \mu = 50$ frente a $H_1: \mu \neq 50$ con $\sigma = 10$ y $\bar X = 51$ . Calcula el p-valor para $n = 10$ y $n = 10000$ . ¿Qué revela esto sobre el p-valor y el tamaño del efecto?
Solve online
Ex. 103.22ApplicationAnswer key
Presión sistólica normal: $\mu_0 = 120$ mmHg. Muestra de $n = 60$ adultos sedentarios: $\bar X = 125$ mmHg, $\sigma = 15$ mmHg. Al nivel del 1%, ¿es la presión media elevada?
Solve online
Ex. 103.23Application
Un estudio veterinario quiere detectar que el peso medio de cerdos de una raza ha cambiado de 125 kg a 120 kg ( $\delta = 5$ , $\sigma = 15$ ). Con $\alpha = 0{,}05$ bilateral y potencia del 80%, ¿cuántos animales se necesitan?
Solve online
Ex. 103.24Modeling
Una prueba de evaluación de un centro da $\bar X = 52$ puntos frente a $\mu_0 = 50$ de la media regional, con $s = 10$ y $n = 10000$ alumnos. El resultado es "altamente significativo" ( $p < 0{,}001$ ). Calcula el tamaño del efecto de Cohen $d$ . ¿Es educativamente relevante la diferencia de 2 puntos? Razona la respuesta.
Solve online
Ex. 103.25Challenge
Muestra que, bajo $H_0$ verdadera, el p-valor sigue una distribución Uniforme $(0,1)$ para tests continuos. Usa ese resultado para verificar que $P(\text{rechazar } H_0 \mid H_0) = \alpha$ .
Solve online
Ex. 103.26Proof
Usa el Lema de Neyman-Pearson para mostrar que el test z unilateral (rechazar si $\bar X > c$ ) es el test más potente de nivel $\alpha$ para $H_0: \mu = \mu_0$ frente a $H_1: \mu = \mu_1 > \mu_0$ con datos normales y $\sigma$ conocido.
Solve online

Fuentes

OpenIntro Statistics (4.ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA. Secciones §5.1–5.3 (estructura del test, p-valor, potencia, tamaño muestral).
Statistics (OpenStax) — Illowsky, Dean · CC-BY. Capítulo 9 (hipótesis nula y alternativa, errores de tipo I y II, ejemplos completos con z).
Statistical Thinking for the 21st Century — Russell Poldrack · CC-BY-NC. Capítulos 10–11 (crisis de replicabilidad, uso responsable del p-valor, FDR, tamaño del efecto).