Lección 73 — Cuartiles, percentiles y diagrama de caja
Resumen de 5 números: mín, Q1, mediana, Q3, máx. RIC, diagrama de caja y regla 1,5 RIC para detectar valores atípicos. Medidas robustas en datos asimétricos.
Used in: Stochastik — Leistungskurs alemão · H2 Math Statistics — Singapura · AP Statistics — EUA · Math B — Japón
Rigorous notation, full derivation, hypotheses
Definición rigurosa
Estadísticas de orden y percentiles
"El primer cuartil, , es el valor tal que el 25% de los datos cae por debajo de él, y el tercer cuartil, , es tal que el 75% de los datos cae por debajo de él." — OpenIntro Statistics §2.1
Anatomía del diagrama de caja: caja (Q1 a Q3), línea de mediana, bigotes hasta el extremo no-atípico, puntos aislados para valores atípicos.
Ejemplos resolvidos
Exercise list
40 exercises · 10 with worked solution (25%)
- Ex. 73.1ApplicationAnswer key
Datos: 1, 3, 5, 7, 9. Calcula mediana, y .
- Ex. 73.2Application
Datos: 2, 4, 6, 8, 10, 12. Calcula el resumen de 5 números.
- Ex. 73.3ApplicationAnswer key
Calificaciones: 4, 5, 6, 6, 7, 7, 8, 8, 9, 10. Calcula , , .
- Ex. 73.4Application
Calcula el de los datos: 12, 14, 18, 22, 25, 28, 32.
- Ex. 73.5ApplicationAnswer key
Edades: 18, 20, 21, 22, 23, 24, 25, 27, 30, 35, 60. Aplica la regla 1,5 RIC. ¿Hay valor atípico?
- Ex. 73.6Application
Salarios (RRIC$.
- Ex. 73.7ApplicationAnswer key
Para datos ordenados, ¿cuál es la posición de por el método de interpolación lineal?
- Ex. 73.8Application
Tiempos (s): 10, 11, 11, 12, 13, 13, 14, 14, 15, 100. Calcula límites de Tukey e identifica el/los valor(es) atípico(s).
- Ex. 73.9Application
Pesos (kg): 60, 62, 64, 65, 65, 67, 70, 72, 75, 80. Describe todos los elementos del diagrama de caja.
- Ex. 73.10Application
Para ,
- Ex. 73.11Application
Datos con . Usando el estimador robusto , calcula .
- Ex. 73.12Application
¿Cuántos puntos por encima de esperaríamos en una muestra de 1000 observaciones normales?
- Ex. 73.13Application
Diagrama A: caja estrecha, mediana centrada. Diagrama B: caja ancha, mediana próxima a . Compara dispersión y simetría de los dos conjuntos.
- Ex. 73.14Application
Distribución con cola larga a la derecha. ¿Dónde está la media en relación a la mediana?
- Ex. 73.15Application
Conjunto A tiene , conjunto B tiene . ¿En cuál hay más dispersión en los datos centrales?
- Ex. 73.16Application
Mediana de . de , de . ¿Cuál de los dos tiene distribución más asimétrica a la derecha?
- Ex. 73.17Application
de salarios de la empresa = R$ 30 mil. Interpreta esta información.
- Ex. 73.18Application
Un estudiante está en el del ENEM. ¿Qué significa eso?
- Ex. 73.19Application
Si , ¿qué se puede concluir sobre los datos?
- Ex. 73.20Understanding
¿La afirmación "la regla 1,5 RIC señala el 5% de los datos como valores atípicos" es correcta para datos normales?
- Ex. 73.21ApplicationAnswer key
Edades (años): 40, 52, 55, 58, 62, 66, 72. Calcula el resumen de 5 números y verifica si hay valores atípicos.
- Ex. 73.22ApplicationAnswer key
Calificaciones de 10 estudiantes: 3, 5, 6, 7, 7, 8, 8, 9, 10, 10. Diagrama de caja completo (con verificación de valores atípicos).
- Ex. 73.23Modeling
Clase de 100 estudiantes: , . Un estudiante sacó 9,5 — ¿está en el top 25%?
- Ex. 73.24Modeling
¿Por qué el IBGE divulga mediana de ingresos, y no solo la media, en los reportes sobre desigualdad en Brasil?
- Ex. 73.25Modeling
Piezas producidas con diámetro: mm, mm. Especificación: mm. ¿El proceso está centrado? ¿Hay riesgo de rechazo significativo?
- Ex. 73.26Modeling
Test A/B de sitio: variante A tiene mediana 1,2 s e ; variante B tiene mediana 1,1 s e . ¿Cuál preferirías para lanzar en producción? Justifica usando las estadísticas de dispersión.
- Ex. 73.27ModelingAnswer key
Detectas un valor atípico en transacciones financieras que parece ser fraude. ¿Debes removerlo antes de analizar los datos? Justifica con argumentos estadísticos.
- Ex. 73.28Modeling
Tiempos de respuesta (ms): 120, 130, 135, 140, 142, 145, 148, 150, 155, 380. Calcula el resumen de 5 números y evalúa si el sistema cumple SLA de 200 ms basado en los cuartiles.
- Ex. 73.29Modeling
Hospital con 4 alas. Tiempos de internación (días): Ala A: 5, 8, 9, 10, 12; Ala B: 3, 4, 4, 5, 20; Ala C: 7, 8, 8, 9, 10; Ala D: 2, 3, 15, 18, 25. Construye los resúmenes de 5 números e identifica cuál ala es más predecible en gestión de camas.
- Ex. 73.30Modeling
Notas del ENEM por escuela. Escuela A: mediana 650, . Escuela B: mediana 620, . ¿Cuál escuela tiene desempeño más uniforme? ¿Qué patrón sugiere cada uno para la política pedagógica?
- Ex. 73.31Modeling
Precipitación mensual media en São Paulo (mm): 234, 181, 130, 83, 68, 52, 44, 47, 82, 122, 145, 201. Calcula el resumen de 5 números e interpreta la estacionalidad.
- Ex. 73.32Modeling
Precios de inmuebles en un barrio (R$ miles): 250, 280, 310, 320, 340, 350, 380, 390, 420, 1800. Calcula mediana y media. ¿Por qué un comprador debe usar la mediana como referencia de precio típico?
- Ex. 73.33Understanding
Explica, en tus propias palabras, por qué mediana e RIC son "robustos" mientras que media y desviación estándar no lo son. Usa un ejemplo concreto.
- Ex. 73.34UnderstandingAnswer key
¿Un diagrama de caja puede esconder una distribución bimodal? Construye un ejemplo concreto de distribución bimodal que tiene el mismo diagrama de caja que una distribución unimodal.
- Ex. 73.35UnderstandingAnswer key
Para , el es:
- Ex. 73.36Challenge
Calcula analíticamente el de . Expresa en función de .
- Ex. 73.37Challenge
Argumenta por qué el punto de ruptura del es 25%, el de la mediana es 50% y el de la media es 0%.
- Ex. 73.38ProofAnswer key
Demuestra: si es v.a. continua con densidad simétrica en torno a , entonces es la mediana de .
- Ex. 73.39Proof
Muestra que para y muestras iid de Uniforme(0,1), el estimador muestral de converge a 0,25. Usa propiedades de estadísticas de orden.
- Ex. 73.40Proof
Demuestra que la mediana minimiza sobre todos los valores .
Fuentes
- OpenIntro Statistics (4.ª ed) — Diez, Çetinkaya-Rundel, Barr · 2019 · EN · CC-BY-SA. Fuente primaria — §2.1 (cuartiles, percentiles) y §2.2 (diagrama de caja, valores atípicos).
- Statistics (OpenStax) — Illowsky, Dean · 2022 · EN · CC-BY. §2.3 (percentiles por interpolación) y §2.4 (diagrama de caja y regla 1,5 RIC).
- Introduction to Probability (Grinstead-Snell) — Grinstead, Snell · 1997 · EN · GNU FDL. §5.1 — cuartiles de distribuciones continuas, estadísticas de orden.