Math ClubMath Club
v1 · padrão canônico

Lección 71 — Medidas de tendencia central: media, mediana, moda

Resumir un conjunto de datos con un único número: media, mediana, moda. Cuándo usar cada una y qué revela la elección sobre la distribución.

Used in: 2.º ano do EM (16-17 anos) · Stochastik LK alemão · H2 Math Statistics singapurense · Math B japonês

xˉ=1ni=1nxi\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i
Choose your door

Rigorous notation, full derivation, hypotheses

Definiciones y propiedades

Estadística descriptiva: el problema del resumen

Dado un conjunto de nn observaciones x1,x2,,xnx_1, x_2, \ldots, x_n, queremos un único número que represente el "centro" de la distribución. No existe una respuesta única — hay tres preguntas diferentes, tres respuestas distintas.

"La media muestral puede calcularse para cualquier variable cuantitativa. Para una distribución discreta, la media es la suma de cada valor multiplicado por su probabilidad; para una distribución continua, la integral correspondiente." — OpenIntro Statistics, §1.6

Propiedades algebraicas de la media

"La media minimiza la suma de los cuadrados de las desviaciones (error L2L^2). La mediana minimiza la suma de los valores absolutos de las desviaciones (error L1L^1). Esta distinción tiene consecuencias profundas en regresión y aprendizaje automático." — OpenIntro Statistics, §2.1

Relación entre las tres medidas y la asimetría

Simétrica unimodalModa=Med=MediaAsimetría a la derechaModaMedMediaAsimetría a la izquierdaModaMedMedia

Relación entre moda, mediana y media según la asimetría de la distribución. En la asimetría a la derecha (cola larga positiva): moda menor que mediana menor que media.

Forma de la distribuciónRelación
Simétrica unimodalModa == Mediana == Media
Asimetría a la derecha (cola positiva)Moda << Mediana << Media
Asimetría a la izquierda (cola negativa)Media << Mediana << Moda

Ejemplos resueltos

Exercise list

42 exercises · 10 with worked solution (25%)

Application 12Understanding 10Modeling 11Challenge 5Proof 4
  1. Ex. 71.1Application

    Datos: 5, 6, 7, 7, 7, 8, 9. Calcula la media, la mediana y la moda.

  2. Ex. 71.2Application

    Notas de 8 alumnos: 4, 5, 6, 6, 7, 8, 9, 10. Calcula la media, la mediana y la moda.

  3. Ex. 71.3Application

    Salarios mensuales (en miles de BRL): 2, 2, 3, 4, 5, 50. Compara la media y la mediana. ¿Cuál representa mejor el salario típico?

  4. Ex. 71.4Application

    Edades de 7 participantes: 18, 19, 20, 21, 22, 23, 24. Calcula la media, la mediana y la moda.

  5. Ex. 71.5ApplicationAnswer key

    Tiempos de carga (s): 0,5; 0,7; 0,8; 0,9; 1,1; 1,5; 7,0. Calcula la media y la mediana. ¿Es la mediana más informativa que la media en este caso?

  6. Ex. 71.6Application

    Colores de coches en un aparcamiento: 12 blancos, 8 negros, 5 grises, 5 rojos. ¿Qué medida de tendencia central es apropiada?

  7. Ex. 71.7ApplicationAnswer key

    Datos: 1, 1, 2, 3, 5, 5, 7. Determina la(s) moda(s). ¿Cómo se clasifica esta distribución?

  8. Ex. 71.8Application

    Tabla de frecuencias: xx = 4, 5, 6, 7, 8 con frecuencias ff = 2, 3, 5, 3, 2. Calcula la media aritmética.

  9. Ex. 71.9Application

    Datos agrupados: intervalos [0,10)[0,10), [10,20)[10,20), [20,30)[20,30) con frecuencias 5, 12, 3. Calcula la media usando puntos medios.

  10. Ex. 71.10Application

    Una clase tiene una media de edad xˉ=17,5\bar{x} = 17{,}5 años. Un nuevo alumno de 20 años se incorpora y la nueva media pasa a 17,7517{,}75 años. ¿Cuántos alumnos había originalmente?

  11. Ex. 71.11ApplicationAnswer key

    Calcula la media, la mediana y la moda para: 3, 3, 4, 5, 6, 6, 6, 9.

  12. Ex. 71.12ApplicationAnswer key

    Calcula la media, la mediana y la(s) moda(s) para: 10, 10, 11, 12, 13, 14, 14, 15, 19.

  13. Ex. 71.13UnderstandingAnswer key

    ¿Por qué los organismos estadísticos prefieren usar la mediana (y no la media) para describir la renta domiciliaria per cápita?

  14. Ex. 71.14Understanding

    Tiempo de espera en urgencias: la mayoría es atendida en 1 a 2 horas, pero algunos casos graves esperan más de 10 horas. ¿Qué medida usar para describir el tiempo de espera típico? Justifícalo.

  15. Ex. 71.15Understanding

    Un fabricante quiere declarar la vida útil típica de sus bombillas LED. Sugiere qué medida de tendencia central usar y justifícalo.

  16. Ex. 71.16Understanding

    Una encuesta electoral pregunta a 1.000 votantes qué partido piensan votar. ¿Qué medida de tendencia central identificará el partido preferido?

  17. Ex. 71.17Understanding

    Para una distribución unimodal con asimetría a la derecha (cola larga positiva), ¿cuál es el orden típico entre moda, mediana y media? Explícalo intuitivamente.

  18. Ex. 71.18UnderstandingAnswer key

    Distribución uniforme en [0,10][0, 10]. Determina la media, la mediana y comenta la moda. ¿Qué dice esto sobre las distribuciones simétricas?

  19. Ex. 71.19Understanding

    Las notas del examen tienen una distribución próxima a la normal. ¿La media o la mediana es más adecuada para describir el rendimiento típico? Justifícalo.

  20. Ex. 71.20Understanding

    Un inversor quiere saber el número de habitaciones más común en los pisos de un barrio. ¿Qué medida usar?

  21. Ex. 71.21UnderstandingAnswer key

    Tiempo de carga de página: el 95% de las peticiones responde en menos de 300 ms, pero el 1% tarda más de 5 s. ¿Por qué los ingenieros de fiabilidad prefieren la mediana (P50) y los percentiles (P95, P99) en lugar de la media?

  22. Ex. 71.22Understanding

    ¿Por qué para una distribución continua simétrica unimodal las tres medidas de tendencia central son iguales? Explícalo geométricamente.

  23. Ex. 71.23Modeling

    A/B testing: el tiempo de pago del Sitio A tiene media 12 s y mediana 9 s. El Sitio B tiene media 10 s y mediana 10 s. ¿Qué sitio ofrece mejor experiencia para el usuario típico? Justifícalo.

  24. Ex. 71.24Modeling

    La empresa A solo reporta un salario medio de 10.000 euros. La empresa B reporta media de 8.000 euros y mediana de 7.000 euros. ¿Qué puede estar ocultando la ausencia de la mediana en A?

  25. Ex. 71.25Modeling

    En K-means, el centroide de un clúster es la media. ¿Cuál es el efecto de un valor atípico sobre el centroide? ¿Cómo mitiga K-medoids (que usa el punto mediano) este problema?

  26. Ex. 71.26Modeling

    Control de calidad: piezas con diámetro medio dˉ=10,05\bar{d} = 10{,}05 mm y distribución aproximadamente simétrica. ¿A qué valor esperarías que fuera próxima la mediana? ¿Por qué?

  27. Ex. 71.27Modeling

    En aprendizaje automático, el MSE como función de pérdida implica que el modelo aprende a estimar la media condicional. El MAE implica que el modelo estima la mediana condicional. Explica por qué esto se deriva de la caracterización variacional de las medidas centrales.

  28. Ex. 71.28Modeling

    Un meta-análisis con 50 estudios reporta la mediana del tamaño de efecto en lugar de la media. ¿Por qué se prefiere la mediana en el meta-análisis?

  29. Ex. 71.29Modeling

    ¿Por qué el diagrama de caja usa la mediana como línea central (y el IQR como anchura de la caja) en lugar de usar la media y la desviación típica?

  30. Ex. 71.30Modeling

    En aprendizaje federado, ¿por qué sustituir la media de los gradientes por la mediana aumenta la resistencia a clientes maliciosos (ataques Byzantine)?

  31. Ex. 71.31Modeling

    Para la distribución log-normal (lnXN(μ,σ2)\ln X \sim N(\mu, \sigma^2)): moda =eμσ2= e^{\mu-\sigma^2}, mediana =eμ= e^\mu, media =eμ+σ2/2= e^{\mu+\sigma^2/2}. Verifica el orden moda menor que mediana menor que media para σ>0\sigma > 0.

  32. Ex. 71.32ModelingAnswer key

    Salarios (en miles de BRL): 4, 4, 5, 5, 6, 7, 7, 8 (8 empleados). Se añade un CEO con salario de R$ 60 mil (sin eliminar a nadie). Calcula la media y la mediana antes y después. ¿Qué medida cambió más?

  33. Ex. 71.33Modeling

    Notas de 30 alumnos en un examen, agrupadas: [60,70)[60,70): 3 alumnos; [70,80)[70,80): 8 alumnos; [80,90)[80,90): 12 alumnos; [90,100][90,100]: 7 alumnos. Calcula la media estimada por los puntos medios.

  34. Ex. 71.34Proof

    Demuestra que i=1n(xixˉ)=0\sum_{i=1}^{n}(x_i - \bar{x}) = 0.

  35. Ex. 71.35Proof

    Demuestra que i=1n(xic)2\sum_{i=1}^{n}(x_i - c)^2 se minimiza en c=xˉc = \bar{x} para cualquier sucesión x1,,xnRx_1, \ldots, x_n \in \mathbb{R}.

  36. Ex. 71.36Proof

    Demuestra que i=1nxic\sum_{i=1}^{n}|x_i - c| se minimiza en c=medianac = \text{mediana}. (Sugerencia: analiza qué ocurre al desplazar cc hacia un lado u otro de la mediana, contando cuántos xix_i quedan por encima y por debajo.)

  37. Ex. 71.37Proof

    Demuestra que si yi=axi+by_i = ax_i + b (transformación lineal), entonces yˉ=axˉ+b\bar{y} = a\bar{x} + b.

  38. Ex. 71.38Challenge

    ¿Satisface la media f(xi)=f(xˉ)\overline{f(x_i)} = f(\bar{x}) en general? ¿Y la mediana? Investiga con f(t)=t2f(t) = t^2 y los datos x={1,2,3}x = \{1, 2, 3\}.

  39. Ex. 71.39Challenge

    Distribución de Cauchy: f(x)=1/[π(1+x2)]f(x) = 1/[\pi(1+x^2)]. Calcula la mediana. Demuestra que la media no existe (la integral +xf(x)dx\int_{-\infty}^{+\infty} x f(x)\,dx diverge).

  40. Ex. 71.40Challenge

    Demuestra que si sustituimos el valor más alto de un conjunto de datos por un valor todavía mayor, la mediana no cambia, pero la media aumenta.

  41. Ex. 71.41ChallengeAnswer key

    Dos grupos tienen medias xˉ1\bar{x}_1 y xˉ2\bar{x}_2 con tamaños n1n_1 y n2n_2. Deriva la fórmula de la media combinada de los dos grupos.

  42. Ex. 71.42ChallengeAnswer key

    La desigualdad de Jensen afirma que para φ\varphi convexa, φ(E[X])E[φ(X)]\varphi(E[X]) \leq E[\varphi(X)]. Aplícala con φ(t)=t2\varphi(t) = t^2 para obtener una desigualdad entre xˉ2\bar{x}^2 y x2\overline{x^2}. ¿Qué implica esto sobre la varianza?

Fuentes

  • OpenIntro Statistics (4.ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA 4.0 · §1.6 (medidas descriptivas básicas, elección de medida, asimetría) y §2.1 (caracterización variacional, robustez). Fuente primaria de esta lección.
  • Introductory Statistics 2e (OpenStax) — Illowsky, Dean et al. · CC-BY 4.0 · §2.5 (cálculo de la media para datos agrupados, ejemplos extensos con tablas de frecuencias).
  • Estatística (Wikilivros) — colaborativo · CC-BY-SA 4.0 · Secciones: Media, Mediana, Moda, Medidas de tendencia central (fórmula de Czuber para la moda en datos agrupados).
  • Premio Nobel de Economía 2000 — Heckman y McFadden — métodos microeconométricos basados en la estimación robusta de la localización central.

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.