Lección 71 — Medidas de tendencia central: media, mediana, moda
Resumir un conjunto de datos con un único número: media, mediana, moda. Cuándo usar cada una y qué revela la elección sobre la distribución.
Used in: 2.º ano do EM (16-17 anos) · Stochastik LK alemão · H2 Math Statistics singapurense · Math B japonês
Rigorous notation, full derivation, hypotheses
Definiciones y propiedades
Estadística descriptiva: el problema del resumen
Dado un conjunto de observaciones , queremos un único número que represente el "centro" de la distribución. No existe una respuesta única — hay tres preguntas diferentes, tres respuestas distintas.
"La media muestral puede calcularse para cualquier variable cuantitativa. Para una distribución discreta, la media es la suma de cada valor multiplicado por su probabilidad; para una distribución continua, la integral correspondiente." — OpenIntro Statistics, §1.6
Propiedades algebraicas de la media
"La media minimiza la suma de los cuadrados de las desviaciones (error ). La mediana minimiza la suma de los valores absolutos de las desviaciones (error ). Esta distinción tiene consecuencias profundas en regresión y aprendizaje automático." — OpenIntro Statistics, §2.1
Relación entre las tres medidas y la asimetría
Relación entre moda, mediana y media según la asimetría de la distribución. En la asimetría a la derecha (cola larga positiva): moda menor que mediana menor que media.
| Forma de la distribución | Relación |
|---|---|
| Simétrica unimodal | Moda Mediana Media |
| Asimetría a la derecha (cola positiva) | Moda Mediana Media |
| Asimetría a la izquierda (cola negativa) | Media Mediana Moda |
Ejemplos resueltos
Exercise list
42 exercises · 10 with worked solution (25%)
- Ex. 71.1Application
Datos: 5, 6, 7, 7, 7, 8, 9. Calcula la media, la mediana y la moda.
- Ex. 71.2Application
Notas de 8 alumnos: 4, 5, 6, 6, 7, 8, 9, 10. Calcula la media, la mediana y la moda.
- Ex. 71.3Application
Salarios mensuales (en miles de BRL): 2, 2, 3, 4, 5, 50. Compara la media y la mediana. ¿Cuál representa mejor el salario típico?
- Ex. 71.4Application
Edades de 7 participantes: 18, 19, 20, 21, 22, 23, 24. Calcula la media, la mediana y la moda.
- Ex. 71.5ApplicationAnswer key
Tiempos de carga (s): 0,5; 0,7; 0,8; 0,9; 1,1; 1,5; 7,0. Calcula la media y la mediana. ¿Es la mediana más informativa que la media en este caso?
- Ex. 71.6Application
Colores de coches en un aparcamiento: 12 blancos, 8 negros, 5 grises, 5 rojos. ¿Qué medida de tendencia central es apropiada?
- Ex. 71.7ApplicationAnswer key
Datos: 1, 1, 2, 3, 5, 5, 7. Determina la(s) moda(s). ¿Cómo se clasifica esta distribución?
- Ex. 71.8Application
Tabla de frecuencias: = 4, 5, 6, 7, 8 con frecuencias = 2, 3, 5, 3, 2. Calcula la media aritmética.
- Ex. 71.9Application
Datos agrupados: intervalos , , con frecuencias 5, 12, 3. Calcula la media usando puntos medios.
- Ex. 71.10Application
Una clase tiene una media de edad años. Un nuevo alumno de 20 años se incorpora y la nueva media pasa a años. ¿Cuántos alumnos había originalmente?
- Ex. 71.11ApplicationAnswer key
Calcula la media, la mediana y la moda para: 3, 3, 4, 5, 6, 6, 6, 9.
- Ex. 71.12ApplicationAnswer key
Calcula la media, la mediana y la(s) moda(s) para: 10, 10, 11, 12, 13, 14, 14, 15, 19.
- Ex. 71.13UnderstandingAnswer key
¿Por qué los organismos estadísticos prefieren usar la mediana (y no la media) para describir la renta domiciliaria per cápita?
- Ex. 71.14Understanding
Tiempo de espera en urgencias: la mayoría es atendida en 1 a 2 horas, pero algunos casos graves esperan más de 10 horas. ¿Qué medida usar para describir el tiempo de espera típico? Justifícalo.
- Ex. 71.15Understanding
Un fabricante quiere declarar la vida útil típica de sus bombillas LED. Sugiere qué medida de tendencia central usar y justifícalo.
- Ex. 71.16Understanding
Una encuesta electoral pregunta a 1.000 votantes qué partido piensan votar. ¿Qué medida de tendencia central identificará el partido preferido?
- Ex. 71.17Understanding
Para una distribución unimodal con asimetría a la derecha (cola larga positiva), ¿cuál es el orden típico entre moda, mediana y media? Explícalo intuitivamente.
- Ex. 71.18UnderstandingAnswer key
Distribución uniforme en . Determina la media, la mediana y comenta la moda. ¿Qué dice esto sobre las distribuciones simétricas?
- Ex. 71.19Understanding
Las notas del examen tienen una distribución próxima a la normal. ¿La media o la mediana es más adecuada para describir el rendimiento típico? Justifícalo.
- Ex. 71.20Understanding
Un inversor quiere saber el número de habitaciones más común en los pisos de un barrio. ¿Qué medida usar?
- Ex. 71.21UnderstandingAnswer key
Tiempo de carga de página: el 95% de las peticiones responde en menos de 300 ms, pero el 1% tarda más de 5 s. ¿Por qué los ingenieros de fiabilidad prefieren la mediana (P50) y los percentiles (P95, P99) en lugar de la media?
- Ex. 71.22Understanding
¿Por qué para una distribución continua simétrica unimodal las tres medidas de tendencia central son iguales? Explícalo geométricamente.
- Ex. 71.23Modeling
A/B testing: el tiempo de pago del Sitio A tiene media 12 s y mediana 9 s. El Sitio B tiene media 10 s y mediana 10 s. ¿Qué sitio ofrece mejor experiencia para el usuario típico? Justifícalo.
- Ex. 71.24Modeling
La empresa A solo reporta un salario medio de 10.000 euros. La empresa B reporta media de 8.000 euros y mediana de 7.000 euros. ¿Qué puede estar ocultando la ausencia de la mediana en A?
- Ex. 71.25Modeling
En K-means, el centroide de un clúster es la media. ¿Cuál es el efecto de un valor atípico sobre el centroide? ¿Cómo mitiga K-medoids (que usa el punto mediano) este problema?
- Ex. 71.26Modeling
Control de calidad: piezas con diámetro medio mm y distribución aproximadamente simétrica. ¿A qué valor esperarías que fuera próxima la mediana? ¿Por qué?
- Ex. 71.27Modeling
En aprendizaje automático, el MSE como función de pérdida implica que el modelo aprende a estimar la media condicional. El MAE implica que el modelo estima la mediana condicional. Explica por qué esto se deriva de la caracterización variacional de las medidas centrales.
- Ex. 71.28Modeling
Un meta-análisis con 50 estudios reporta la mediana del tamaño de efecto en lugar de la media. ¿Por qué se prefiere la mediana en el meta-análisis?
- Ex. 71.29Modeling
¿Por qué el diagrama de caja usa la mediana como línea central (y el IQR como anchura de la caja) en lugar de usar la media y la desviación típica?
- Ex. 71.30Modeling
En aprendizaje federado, ¿por qué sustituir la media de los gradientes por la mediana aumenta la resistencia a clientes maliciosos (ataques Byzantine)?
- Ex. 71.31Modeling
Para la distribución log-normal (): moda , mediana , media . Verifica el orden moda menor que mediana menor que media para .
- Ex. 71.32ModelingAnswer key
Salarios (en miles de BRL): 4, 4, 5, 5, 6, 7, 7, 8 (8 empleados). Se añade un CEO con salario de R$ 60 mil (sin eliminar a nadie). Calcula la media y la mediana antes y después. ¿Qué medida cambió más?
- Ex. 71.33Modeling
Notas de 30 alumnos en un examen, agrupadas: : 3 alumnos; : 8 alumnos; : 12 alumnos; : 7 alumnos. Calcula la media estimada por los puntos medios.
- Ex. 71.34Proof
Demuestra que .
- Ex. 71.35Proof
Demuestra que se minimiza en para cualquier sucesión .
- Ex. 71.36Proof
Demuestra que se minimiza en . (Sugerencia: analiza qué ocurre al desplazar hacia un lado u otro de la mediana, contando cuántos quedan por encima y por debajo.)
- Ex. 71.37Proof
Demuestra que si (transformación lineal), entonces .
- Ex. 71.38Challenge
¿Satisface la media en general? ¿Y la mediana? Investiga con y los datos .
- Ex. 71.39Challenge
Distribución de Cauchy: . Calcula la mediana. Demuestra que la media no existe (la integral diverge).
- Ex. 71.40Challenge
Demuestra que si sustituimos el valor más alto de un conjunto de datos por un valor todavía mayor, la mediana no cambia, pero la media aumenta.
- Ex. 71.41ChallengeAnswer key
Dos grupos tienen medias y con tamaños y . Deriva la fórmula de la media combinada de los dos grupos.
- Ex. 71.42ChallengeAnswer key
La desigualdad de Jensen afirma que para convexa, . Aplícala con para obtener una desigualdad entre y . ¿Qué implica esto sobre la varianza?
Fuentes
- OpenIntro Statistics (4.ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA 4.0 · §1.6 (medidas descriptivas básicas, elección de medida, asimetría) y §2.1 (caracterización variacional, robustez). Fuente primaria de esta lección.
- Introductory Statistics 2e (OpenStax) — Illowsky, Dean et al. · CC-BY 4.0 · §2.5 (cálculo de la media para datos agrupados, ejemplos extensos con tablas de frecuencias).
- Estatística (Wikilivros) — colaborativo · CC-BY-SA 4.0 · Secciones: Media, Mediana, Moda, Medidas de tendencia central (fórmula de Czuber para la moda en datos agrupados).
- Premio Nobel de Economía 2000 — Heckman y McFadden — métodos microeconométricos basados en la estimación robusta de la localización central.