Lição 73 — Quartili, percentili e boxplot
Riepilogo di 5 numeri: min, Q1, mediana, Q3, max. IQR, boxplot e regola 1,5 IQR per rilevare outlier. Misure robuste in dati asimmetrici.
Used in: Stochastik — Leistungskurs alemão · H2 Math Statistics — Singapura · AP Statistics — EUA · Math B — Japão
Rigorous notation, full derivation, hypotheses
Definizione rigorosa
Statistiche di ordine e percentili
"The first quartile, , is the value such that 25% of the data fall below it, and the third quartile, , is such that 75% of the data fall below it." — OpenIntro Statistics §2.1
Anatomia del boxplot: scatola (Q1 a Q3), linea di mediana, baffi fino all'estremo non-outlier, punti isolati per outlier.
Esempi risolti
Exercise list
40 exercises · 10 with worked solution (25%)
- Ex. 73.1ApplicationAnswer key
Dati: 1, 3, 5, 7, 9. Calcola mediana, e .
- Ex. 73.2Application
Dati: 2, 4, 6, 8, 10, 12. Calcola il riepilogo di 5 numeri.
- Ex. 73.3ApplicationAnswer key
Voti: 4, 5, 6, 6, 7, 7, 8, 8, 9, 10. Calcola , , .
- Ex. 73.4Application
Calcola l' dei dati: 12, 14, 18, 22, 25, 28, 32.
- Ex. 73.5ApplicationAnswer key
Età: 18, 20, 21, 22, 23, 24, 25, 27, 30, 35, 60. Applica la regola 1,5 IQR. C'è un outlier?
- Ex. 73.6Application
Stipendi (RIQR$.
- Ex. 73.7ApplicationAnswer key
Per dati ordinati, qual è la posizione di secondo il metodo di interpolazione lineare?
- Ex. 73.8Application
Tempi (s): 10, 11, 11, 12, 13, 13, 14, 14, 15, 100. Calcola i limiti di Tukey e identifica l'outlier/gli outlier.
- Ex. 73.9Application
Pesi (kg): 60, 62, 64, 65, 65, 67, 70, 72, 75, 80. Descrivi tutti gli elementi del boxplot.
- Ex. 73.10Application
Per ,
- Ex. 73.11Application
Dati con . Usando lo stimatore robusto , calcola .
- Ex. 73.12Application
Quanti punti al di sopra di ci aspettiamo in un campione di 1000 osservazioni normali?
- Ex. 73.13Application
Boxplot A: scatola stretta, mediana centrata. Boxplot B: scatola larga, mediana vicina a . Confronta dispersione e asimmetria dei due insiemi.
- Ex. 73.14Application
Distribuzione con coda lunga a destra. La media è in quale posizione in relazione alla mediana?
- Ex. 73.15Application
L'insieme A ha , l'insieme B ha . In quale c'è più dispersione nei dati centrali?
- Ex. 73.16Application
Mediana di . di , di . Quale dei due ha distribuzione più asimmetrica a destra?
- Ex. 73.17Application
dei stipendi dell'azienda = R$ 30 migliaia. Interpreta questa informazione.
- Ex. 73.18Application
Uno studente è nel dell'ENEM. Cosa significa?
- Ex. 73.19Application
Se , cosa si può concludere sui dati?
- Ex. 73.20Understanding
L'affermazione "la regola 1,5 IQR segnala il 5% dei dati come outlier" è corretta per dati normali?
- Ex. 73.21ApplicationAnswer key
Età (anni): 40, 52, 55, 58, 62, 66, 72. Calcola il riepilogo di 5 numeri e verifica se ci sono outlier.
- Ex. 73.22ApplicationAnswer key
Voti di 10 studenti: 3, 5, 6, 7, 7, 8, 8, 9, 10, 10. Boxplot completo (con verifica degli outlier).
- Ex. 73.23Modeling
Classe di 100 studenti: , . Uno studente ha preso 9,5 — è nel top 25%?
- Ex. 73.24Modeling
Perché l'IBGE divulga la mediana del reddito, e non solo la media, nei rapporti sulla disuguaglianza in Brasile?
- Ex. 73.25Modeling
Pezzi prodotti con diametro: mm, mm. Specifica: mm. Il processo è centrato? C'è rischio di rifiuto significativo?
- Ex. 73.26Modeling
Test A/B di sito: variante A ha mediana 1,2 s e ; variante B ha mediana 1,1 s e . Quale preferisci lanciare in produzione? Giustifica usando le statistiche di dispersione.
- Ex. 73.27ModelingAnswer key
Rilevi un outlier nelle transazioni finanziarie che sembra essere una frode. Devi rimuoverlo prima di analizzare i dati? Giustifica con argomenti statistici.
- Ex. 73.28Modeling
Tempi di risposta (ms): 120, 130, 135, 140, 142, 145, 148, 150, 155, 380. Calcola il riepilogo di 5 numeri e valuta se il sistema rispetta l'SLA di 200 ms basandoti sui quartili.
- Ex. 73.29Modeling
Ospedale con 4 reparti. Tempi di degenza (giorni): Reparto A: 5, 8, 9, 10, 12; Reparto B: 3, 4, 4, 5, 20; Reparto C: 7, 8, 8, 9, 10; Reparto D: 2, 3, 15, 18, 25. Costruisci i riepiloghi di 5 numeri e identifica quale reparto è più prevedibile nella gestione dei posti letto.
- Ex. 73.30Modeling
Voti dell'ENEM per scuola. Scuola A: mediana 650, . Scuola B: mediana 620, . Quale scuola ha prestazioni più uniformi? Cosa ogni modello suggerisce per la politica pedagogica?
- Ex. 73.31Modeling
Precipitazione mensile media a San Paolo (mm): 234, 181, 130, 83, 68, 52, 44, 47, 82, 122, 145, 201. Calcola il riepilogo di 5 numeri e interpreta la stagionalità.
- Ex. 73.32Modeling
Prezzi immobiliari in un quartiere (R$ migliaia): 250, 280, 310, 320, 340, 350, 380, 390, 420, 1800. Calcola mediana e media. Perché un acquirente dovrebbe usare la mediana come riferimento del prezzo tipico?
- Ex. 73.33Understanding
Spiega, con parole tue, perché la mediana e l'IQR sono "robusti" mentre la media e la deviazione standard non lo sono. Usa un esempio concreto.
- Ex. 73.34UnderstandingAnswer key
Un boxplot può nascondere una distribuzione bimodale? Costruisci un esempio concreto di distribuzione bimodale che ha lo stesso boxplot di una distribuzione unimodale.
- Ex. 73.35UnderstandingAnswer key
Per , l' è:
- Ex. 73.36Challenge
Calcola analiticamente l' di . Esprimi in funzione di .
- Ex. 73.37Challenge
Argomenta perché il punto di rottura dell' è 25%, quello della mediana è 50% e quello della media è 0%.
- Ex. 73.38ProofAnswer key
Dimostra: se è v.a. continua con densità simmetrica attorno a , allora è la mediana di .
- Ex. 73.39Proof
Mostra che per e campioni iid da Uniforme(0,1), lo stimatore campionario di converge a 0,25. Usa proprietà delle statistiche di ordine.
- Ex. 73.40Proof
Dimostra che la mediana minimizza su tutti i valori .
Fonti
- OpenIntro Statistics (4ª ed) — Diez, Çetinkaya-Rundel, Barr · 2019 · EN · CC-BY-SA. Fonte primaria — §2.1 (quartili, percentili) e §2.2 (boxplot, outlier).
- Statistics (OpenStax) — Illowsky, Dean · 2022 · EN · CC-BY. §2.3 (percentili per interpolazione) e §2.4 (boxplot e regola 1,5 IQR).
- Introduction to Probability (Grinstead-Snell) — Grinstead, Snell · 1997 · EN · GNU FDL. §5.1 — quartili di distribuzioni continue, statistiche di ordine.