Lição 71 — Medidas de tendência central: média, mediana, moda
Resumir um conjunto de dados com um único número: média, mediana, moda. Quando usar cada uma e o que a escolha revela sobre a distribuição.
Used in: 2.º ano do EM (16-17 anos) · Stochastik LK alemão · H2 Math Statistics singapurense · Math B japonês
Rigorous notation, full derivation, hypotheses
Definizioni e proprietà
Statistica descrittiva: il problema del riassunto
Dato un insieme di osservazioni , vogliamo un singolo numero che rappresenti il "centro" della distribuzione. Non c'è risposta unica — ci sono tre domande diverse, tre risposte diverse.
"La media campionaria può essere calcolata per qualsiasi variabile quantitativa. Per una distribuzione discreta, la media è la somma di ogni valore moltiplicato per la sua probabilità; per una distribuzione continua, l'integrale corrispondente." — OpenIntro Statistics, §1.6
Proprietà algebriche della media
"La media minimizza la somma dei quadrati degli scarti (errore ). La mediana minimizza la somma dei valori assoluti degli scarti (errore ). Questa distinzione ha conseguenze profonde in regressione e machine learning." — OpenIntro Statistics, §2.1
Relazione tra le tre misure e asimmetria
Relazione tra moda, mediana e media secondo l'asimmetria della distribuzione. Nell'asimmetria a destra (coda lunga positiva): moda minore di mediana minore di media.
| Forma della distribuzione | Relazione |
|---|---|
| Simmetrica unimodale | Moda Mediana Media |
| Asimmetria a destra (coda positiva) | Moda Mediana Media |
| Asimmetria a sinistra (coda negativa) | Media Mediana Moda |
Esempi risolti
Exercise list
42 exercises · 10 with worked solution (25%)
- Ex. 71.1Application
Dati: 5, 6, 7, 7, 7, 8, 9. Calcola la media, la mediana e la moda.
- Ex. 71.2Application
Voti di 8 alunni: 4, 5, 6, 6, 7, 8, 9, 10. Calcola la media, la mediana e la moda.
- Ex. 71.3Application
Stipendi mensili (R$ mila): 2, 2, 3, 4, 5, 50. Confronta media e mediana. Quale rappresenta meglio lo stipendio tipico?
- Ex. 71.4Application
Età di 7 partecipanti: 18, 19, 20, 21, 22, 23, 24. Calcola la media, mediana e moda.
- Ex. 71.5ApplicationAnswer key
Tempi di caricamento (s): 0,5; 0,7; 0,8; 0,9; 1,1; 1,5; 7,0. Calcola la media e la mediana. La mediana è più informativa della media in questo caso?
- Ex. 71.6Application
Colori di auto in un parcheggio: 12 bianche, 8 nere, 5 grigie, 5 rosse. Quale misura di tendenza centrale è appropriata?
- Ex. 71.7ApplicationAnswer key
Dati: 1, 1, 2, 3, 5, 5, 7. Determina la(e) moda(e). Come si classifica questa distribuzione?
- Ex. 71.8Application
Tabella di frequenze: = 4, 5, 6, 7, 8 con frequenze = 2, 3, 5, 3, 2. Calcola la media aritmetica.
- Ex. 71.9Application
Dati raggruppati: intervalli , , con frequenze 5, 12, 3. Calcola la media usando punti medi.
- Ex. 71.10Application
Una classe ha media di età anni. Un nuovo alunno di 20 anni entra e la nuova media passa a anni. Quanti alunni c'erano originalmente?
- Ex. 71.11ApplicationAnswer key
Calcola media, mediana e moda per: 3, 3, 4, 5, 6, 6, 6, 9.
- Ex. 71.12ApplicationAnswer key
Calcola media, mediana e moda(e) per: 10, 10, 11, 12, 13, 14, 14, 15, 19.
- Ex. 71.13UnderstandingAnswer key
Perché l'IBGE preferisce usare la mediana (e non la media) per descrivere il reddito domiciliare pro capite del Brasile?
- Ex. 71.14Understanding
Tempo di attesa in un pronto soccorso: la maggior parte è assistita in 1 a 2 ore, ma alcuni casi gravi aspettano più di 10 ore. Quale misura usare per descrivere il tempo di attesa tipico? Giustifica.
- Ex. 71.15Understanding
Un produttore vuole dichiarare la vita utile tipica delle sue lampadine LED. Suggerisci quale misura di tendenza centrale usare e giustifica.
- Ex. 71.16Understanding
Un sondaggio elettorale chiede a 1.000 elettori quale partito intendono votare. Quale misura di tendenza centrale identificherà il partito preferito?
- Ex. 71.17Understanding
Per una distribuzione unimodale con asimmetria a destra (coda lunga positiva), quale è l'ordine tipico tra moda, mediana e media? Spiega intuitivamente.
- Ex. 71.18UnderstandingAnswer key
Distribuzione uniforme in . Determina la media, la mediana e discuti la moda. Cosa dice questo su distribuzioni simmetriche?
- Ex. 71.19Understanding
I voti dell'ENEM hanno distribuzione prossima al normale. Media o mediana è più adeguata per descrivere il rendimento tipico? Giustifica.
- Ex. 71.20Understanding
Un investitore vuole sapere il numero di stanze più comune negli appartamenti di un quartiere. Quale misura usare?
- Ex. 71.21UnderstandingAnswer key
Tempo di caricamento della pagina: 95% delle richieste rispondono in meno di 300 ms, ma 1% impiega più di 5 s. Perché gli ingegneri di affidabilità preferiscono mediana (P50) e percentili (P95, P99) invece della media?
- Ex. 71.22Understanding
Perché per una distribuzione continua simmetrica unimodale, le tre misure di tendenza centrale sono uguali? Spiega geometricamente.
- Ex. 71.23Modeling
A/B testing: tempo di checkout del sito A ha media 12 s e mediana 9 s. Sito B ha media 10 s e mediana 10 s. Quale sito ha migliore esperienza per l'utente tipico? Giustifica.
- Ex. 71.24Modeling
Azienda A riporta solo stipendio medio di R$ 10 mila. Azienda B riporta media di R$ 8 mila e mediana di R$ 7 mila. Cosa l'assenza della mediana in A può stare nascondendo?
- Ex. 71.25Modeling
In K-means, il centroide di un cluster è la media. Quale l'effetto di un outlier sul centroide? Come K-medoids (che usa il punto mediano) mitiga questo problema?
- Ex. 71.26Modeling
Controllo di qualità: pezzi con diametro medio mm e distribuzione approssimativamente simmetrica. A che valore ti aspetteresti che la mediana sia prossima? Perché?
- Ex. 71.27Modeling
Nell'apprendimento automatico, MSE come funzione di perdita implica che il modello apprenda a stimare la media condizionale. MAE implica che il modello stima la mediana condizionale. Spiega perché questo consegue dalla caratterizzazione variazionale delle misure centrali.
- Ex. 71.28Modeling
Una meta-analisi con 50 studi riporta la mediana del size di effetto invece della media. Perché la mediana è preferita in meta-analisi?
- Ex. 71.29Modeling
Perché il boxplot usa la mediana come linea centrale (e l'IQR come larghezza della scatola) invece di usare media e deviazione standard?
- Ex. 71.30Modeling
Nel federated learning, perché sostituire la media dei gradienti con la mediana aumenta la resistenza a client malevolenti (attacchi Byzantine)?
- Ex. 71.31Modeling
Per la distribuzione log-normale (): moda , mediana , media . Verifica l'ordinazione moda minore di mediana minore di media per .
- Ex. 71.32ModelingAnswer key
Stipendi (R$ mila): 4, 4, 5, 5, 6, 7, 7, 8 (8 dipendenti). Un AD con stipendio di R$ 60 mila è aggiunto (senza rimuovere nessuno). Calcola la media e mediana prima e dopo. Quale misura è cambiata più?
- Ex. 71.33Modeling
Voti di 30 alunni in una prova, raggruppati: : 3 alunni; : 8 alunni; : 12 alunni; : 7 alunni. Calcola la media stimata dai punti medi.
- Ex. 71.34Proof
Mostra che .
- Ex. 71.35Proof
Mostra che è minimizzato in per qualsiasi sequenza .
- Ex. 71.36Proof
Mostra che è minimizzato in . (Suggerimento: analizza cosa succede spostando da un lato o dall'altro della mediana, contando quanti rimangono sopra e sotto.)
- Ex. 71.37Proof
Mostra che se (trasformazione lineare), allora .
- Ex. 71.38Challenge
La media soddisfa in generale? E la mediana? Investiga con e i dati .
- Ex. 71.39Challenge
Distribuzione di Cauchy: . Calcola la mediana. Mostra che la media non esiste (l'integrale diverge).
- Ex. 71.40Challenge
Mostra che se sostituiamo il valore più grande di un insieme di dati con un valore ancora più grande, la mediana non cambia, ma la media aumenta.
- Ex. 71.41ChallengeAnswer key
Due gruppi hanno medie e con tagli e . Deriva la formula della media combinata dei due gruppi.
- Ex. 71.42ChallengeAnswer key
La disuguaglianza di Jensen afferma che per convessa, . Applica con per ottenere una disuguaglianza tra e . Cosa implica questo sulla varianza?
Fonti
- OpenIntro Statistics (4ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA 4.0 · §1.6 (misure descrittive base, scelta di misura, asimmetria) e §2.1 (caratterizzazione variazionale, robustezza). Fonte primaria di questa lezione.
- Introductory Statistics 2e (OpenStax) — Illowsky, Dean et al. · CC-BY 4.0 · §2.5 (calcolo della media per dati raggruppati, esempi estesi con tabelle di frequenza).
- Estatística (Wikilivros) — collaborativo · CC-BY-SA 4.0 · Sezioni: Média, Mediana, Moda, Medidas de tendência central (riferimento in PT-BR; formula di Czuber per la moda in dati raggruppati).
- Prêmio Nobel de Economia 2000 — Heckman e McFadden — metodi microeconometrici basati su stima robusta di locazione centrale.