Math ClubMath Club
v1 · padrão canônico

Lição 71 — Medidas de tendência central: média, mediana, moda

Resumir um conjunto de dados com um único número: média, mediana, moda. Quando usar cada uma e o que a escolha revela sobre a distribuição.

Used in: 2.º ano do EM (16-17 anos) · Stochastik LK alemão · H2 Math Statistics singapurense · Math B japonês

xˉ=1ni=1nxi\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i
Choose your door

Rigorous notation, full derivation, hypotheses

Definizioni e proprietà

Statistica descrittiva: il problema del riassunto

Dato un insieme di nn osservazioni x1,x2,,xnx_1, x_2, \ldots, x_n, vogliamo un singolo numero che rappresenti il "centro" della distribuzione. Non c'è risposta unica — ci sono tre domande diverse, tre risposte diverse.

"La media campionaria può essere calcolata per qualsiasi variabile quantitativa. Per una distribuzione discreta, la media è la somma di ogni valore moltiplicato per la sua probabilità; per una distribuzione continua, l'integrale corrispondente." — OpenIntro Statistics, §1.6

Proprietà algebriche della media

"La media minimizza la somma dei quadrati degli scarti (errore L2L^2). La mediana minimizza la somma dei valori assoluti degli scarti (errore L1L^1). Questa distinzione ha conseguenze profonde in regressione e machine learning." — OpenIntro Statistics, §2.1

Relazione tra le tre misure e asimmetria

Simmetrica unimodaleModa=Med=MediaAsimmetria a destraModaMedMediaAsimmetria a sinistraModaMedMedia

Relazione tra moda, mediana e media secondo l'asimmetria della distribuzione. Nell'asimmetria a destra (coda lunga positiva): moda minore di mediana minore di media.

Forma della distribuzioneRelazione
Simmetrica unimodaleModa == Mediana == Media
Asimmetria a destra (coda positiva)Moda << Mediana << Media
Asimmetria a sinistra (coda negativa)Media << Mediana << Moda

Esempi risolti

Exercise list

42 exercises · 10 with worked solution (25%)

Application 12Understanding 10Modeling 11Challenge 5Proof 4
  1. Ex. 71.1Application

    Dati: 5, 6, 7, 7, 7, 8, 9. Calcola la media, la mediana e la moda.

  2. Ex. 71.2Application

    Voti di 8 alunni: 4, 5, 6, 6, 7, 8, 9, 10. Calcola la media, la mediana e la moda.

  3. Ex. 71.3Application

    Stipendi mensili (R$ mila): 2, 2, 3, 4, 5, 50. Confronta media e mediana. Quale rappresenta meglio lo stipendio tipico?

  4. Ex. 71.4Application

    Età di 7 partecipanti: 18, 19, 20, 21, 22, 23, 24. Calcola la media, mediana e moda.

  5. Ex. 71.5ApplicationAnswer key

    Tempi di caricamento (s): 0,5; 0,7; 0,8; 0,9; 1,1; 1,5; 7,0. Calcola la media e la mediana. La mediana è più informativa della media in questo caso?

  6. Ex. 71.6Application

    Colori di auto in un parcheggio: 12 bianche, 8 nere, 5 grigie, 5 rosse. Quale misura di tendenza centrale è appropriata?

  7. Ex. 71.7ApplicationAnswer key

    Dati: 1, 1, 2, 3, 5, 5, 7. Determina la(e) moda(e). Come si classifica questa distribuzione?

  8. Ex. 71.8Application

    Tabella di frequenze: xx = 4, 5, 6, 7, 8 con frequenze ff = 2, 3, 5, 3, 2. Calcola la media aritmetica.

  9. Ex. 71.9Application

    Dati raggruppati: intervalli [0,10)[0,10), [10,20)[10,20), [20,30)[20,30) con frequenze 5, 12, 3. Calcola la media usando punti medi.

  10. Ex. 71.10Application

    Una classe ha media di età xˉ=17,5\bar{x} = 17{,}5 anni. Un nuovo alunno di 20 anni entra e la nuova media passa a 17,7517{,}75 anni. Quanti alunni c'erano originalmente?

  11. Ex. 71.11ApplicationAnswer key

    Calcola media, mediana e moda per: 3, 3, 4, 5, 6, 6, 6, 9.

  12. Ex. 71.12ApplicationAnswer key

    Calcola media, mediana e moda(e) per: 10, 10, 11, 12, 13, 14, 14, 15, 19.

  13. Ex. 71.13UnderstandingAnswer key

    Perché l'IBGE preferisce usare la mediana (e non la media) per descrivere il reddito domiciliare pro capite del Brasile?

  14. Ex. 71.14Understanding

    Tempo di attesa in un pronto soccorso: la maggior parte è assistita in 1 a 2 ore, ma alcuni casi gravi aspettano più di 10 ore. Quale misura usare per descrivere il tempo di attesa tipico? Giustifica.

  15. Ex. 71.15Understanding

    Un produttore vuole dichiarare la vita utile tipica delle sue lampadine LED. Suggerisci quale misura di tendenza centrale usare e giustifica.

  16. Ex. 71.16Understanding

    Un sondaggio elettorale chiede a 1.000 elettori quale partito intendono votare. Quale misura di tendenza centrale identificherà il partito preferito?

  17. Ex. 71.17Understanding

    Per una distribuzione unimodale con asimmetria a destra (coda lunga positiva), quale è l'ordine tipico tra moda, mediana e media? Spiega intuitivamente.

  18. Ex. 71.18UnderstandingAnswer key

    Distribuzione uniforme in [0,10][0, 10]. Determina la media, la mediana e discuti la moda. Cosa dice questo su distribuzioni simmetriche?

  19. Ex. 71.19Understanding

    I voti dell'ENEM hanno distribuzione prossima al normale. Media o mediana è più adeguata per descrivere il rendimento tipico? Giustifica.

  20. Ex. 71.20Understanding

    Un investitore vuole sapere il numero di stanze più comune negli appartamenti di un quartiere. Quale misura usare?

  21. Ex. 71.21UnderstandingAnswer key

    Tempo di caricamento della pagina: 95% delle richieste rispondono in meno di 300 ms, ma 1% impiega più di 5 s. Perché gli ingegneri di affidabilità preferiscono mediana (P50) e percentili (P95, P99) invece della media?

  22. Ex. 71.22Understanding

    Perché per una distribuzione continua simmetrica unimodale, le tre misure di tendenza centrale sono uguali? Spiega geometricamente.

  23. Ex. 71.23Modeling

    A/B testing: tempo di checkout del sito A ha media 12 s e mediana 9 s. Sito B ha media 10 s e mediana 10 s. Quale sito ha migliore esperienza per l'utente tipico? Giustifica.

  24. Ex. 71.24Modeling

    Azienda A riporta solo stipendio medio di R$ 10 mila. Azienda B riporta media di R$ 8 mila e mediana di R$ 7 mila. Cosa l'assenza della mediana in A può stare nascondendo?

  25. Ex. 71.25Modeling

    In K-means, il centroide di un cluster è la media. Quale l'effetto di un outlier sul centroide? Come K-medoids (che usa il punto mediano) mitiga questo problema?

  26. Ex. 71.26Modeling

    Controllo di qualità: pezzi con diametro medio dˉ=10,05\bar{d} = 10{,}05 mm e distribuzione approssimativamente simmetrica. A che valore ti aspetteresti che la mediana sia prossima? Perché?

  27. Ex. 71.27Modeling

    Nell'apprendimento automatico, MSE come funzione di perdita implica che il modello apprenda a stimare la media condizionale. MAE implica che il modello stima la mediana condizionale. Spiega perché questo consegue dalla caratterizzazione variazionale delle misure centrali.

  28. Ex. 71.28Modeling

    Una meta-analisi con 50 studi riporta la mediana del size di effetto invece della media. Perché la mediana è preferita in meta-analisi?

  29. Ex. 71.29Modeling

    Perché il boxplot usa la mediana come linea centrale (e l'IQR come larghezza della scatola) invece di usare media e deviazione standard?

  30. Ex. 71.30Modeling

    Nel federated learning, perché sostituire la media dei gradienti con la mediana aumenta la resistenza a client malevolenti (attacchi Byzantine)?

  31. Ex. 71.31Modeling

    Per la distribuzione log-normale (lnXN(μ,σ2)\ln X \sim N(\mu, \sigma^2)): moda =eμσ2= e^{\mu-\sigma^2}, mediana =eμ= e^\mu, media =eμ+σ2/2= e^{\mu+\sigma^2/2}. Verifica l'ordinazione moda minore di mediana minore di media per σ>0\sigma > 0.

  32. Ex. 71.32ModelingAnswer key

    Stipendi (R$ mila): 4, 4, 5, 5, 6, 7, 7, 8 (8 dipendenti). Un AD con stipendio di R$ 60 mila è aggiunto (senza rimuovere nessuno). Calcola la media e mediana prima e dopo. Quale misura è cambiata più?

  33. Ex. 71.33Modeling

    Voti di 30 alunni in una prova, raggruppati: [60,70)[60,70): 3 alunni; [70,80)[70,80): 8 alunni; [80,90)[80,90): 12 alunni; [90,100][90,100]: 7 alunni. Calcola la media stimata dai punti medi.

  34. Ex. 71.34Proof

    Mostra che i=1n(xixˉ)=0\sum_{i=1}^{n}(x_i - \bar{x}) = 0.

  35. Ex. 71.35Proof

    Mostra che i=1n(xic)2\sum_{i=1}^{n}(x_i - c)^2 è minimizzato in c=xˉc = \bar{x} per qualsiasi sequenza x1,,xnRx_1, \ldots, x_n \in \mathbb{R}.

  36. Ex. 71.36Proof

    Mostra che i=1nxic\sum_{i=1}^{n}|x_i - c| è minimizzato in c=medianac = \text{mediana}. (Suggerimento: analizza cosa succede spostando cc da un lato o dall'altro della mediana, contando quanti xix_i rimangono sopra e sotto.)

  37. Ex. 71.37Proof

    Mostra che se yi=axi+by_i = ax_i + b (trasformazione lineare), allora yˉ=axˉ+b\bar{y} = a\bar{x} + b.

  38. Ex. 71.38Challenge

    La media soddisfa f(xi)=f(xˉ)\overline{f(x_i)} = f(\bar{x}) in generale? E la mediana? Investiga con f(t)=t2f(t) = t^2 e i dati x={1,2,3}x = \{1, 2, 3\}.

  39. Ex. 71.39Challenge

    Distribuzione di Cauchy: f(x)=1/[π(1+x2)]f(x) = 1/[\pi(1+x^2)]. Calcola la mediana. Mostra che la media non esiste (l'integrale +xf(x)dx\int_{-\infty}^{+\infty} x f(x)\,dx diverge).

  40. Ex. 71.40Challenge

    Mostra che se sostituiamo il valore più grande di un insieme di dati con un valore ancora più grande, la mediana non cambia, ma la media aumenta.

  41. Ex. 71.41ChallengeAnswer key

    Due gruppi hanno medie xˉ1\bar{x}_1 e xˉ2\bar{x}_2 con tagli n1n_1 e n2n_2. Deriva la formula della media combinata dei due gruppi.

  42. Ex. 71.42ChallengeAnswer key

    La disuguaglianza di Jensen afferma che per φ\varphi convessa, φ(E[X])E[φ(X)]\varphi(E[X]) \leq E[\varphi(X)]. Applica con φ(t)=t2\varphi(t) = t^2 per ottenere una disuguaglianza tra xˉ2\bar{x}^2 e x2\overline{x^2}. Cosa implica questo sulla varianza?

Fonti

  • OpenIntro Statistics (4ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA 4.0 · §1.6 (misure descrittive base, scelta di misura, asimmetria) e §2.1 (caratterizzazione variazionale, robustezza). Fonte primaria di questa lezione.
  • Introductory Statistics 2e (OpenStax) — Illowsky, Dean et al. · CC-BY 4.0 · §2.5 (calcolo della media per dati raggruppati, esempi estesi con tabelle di frequenza).
  • Estatística (Wikilivros) — collaborativo · CC-BY-SA 4.0 · Sezioni: Média, Mediana, Moda, Medidas de tendência central (riferimento in PT-BR; formula di Czuber per la moda in dati raggruppati).
  • Prêmio Nobel de Economia 2000 — Heckman e McFadden — metodi microeconometrici basati su stima robusta di locazione centrale.

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.