Lição 73 — Quartis, percentis e boxplot
Resumo de 5 números: mín, Q1, mediana, Q3, máx. IQR, boxplot e regra 1,5 IQR para detectar outliers. Medidas robustas em dados assimétricos.
Used in: Stochastik — Leistungskurs alemão · H2 Math Statistics — Singapura · AP Statistics — EUA · Math B — Japão
Rigorous notation, full derivation, hypotheses
Definicja rygorystyczna
Statystyki porządkowe i percentyle
"Pierwszy kwartyl, , to wartość taka, że 25% danych znajduje się poniżej niej, a trzeci kwartyl, , to taka, że 75% danych znajduje się poniżej niej." — OpenIntro Statistics §2.1
Anatomia boxplotu: pudełko (Q1 do Q3), linia mediany, wąsy do skrajnego obserwacji, punkty dla wartości odstających.
Przykłady rozwiązane
Exercise list
40 exercises · 10 with worked solution (25%)
- Ex. 73.1ApplicationAnswer key
Dane: 1, 3, 5, 7, 9. Oblicz medianę, i .
- Ex. 73.2Application
Dane: 2, 4, 6, 8, 10, 12. Oblicz streszczenie pięcioliczbowe.
- Ex. 73.3ApplicationAnswer key
Oceny: 4, 5, 6, 6, 7, 7, 8, 8, 9, 10. Oblicz , , .
- Ex. 73.4Application
Oblicz danych: 12, 14, 18, 22, 25, 28, 32.
- Ex. 73.5ApplicationAnswer key
Wiek: 18, 20, 21, 22, 23, 24, 25, 27, 30, 35, 60. Zastosuj regułę 1,5 IQR. Czy jest wartość odstająca?
- Ex. 73.6Application
Pensje (tys.): 2, 3, 3, 4, 4, 5, 5, 6, 8, 50. Oblicz medianę i .
- Ex. 73.7ApplicationAnswer key
Dla danych posortowanych, jaka jest pozycja metodą interpolacji liniowej?
- Ex. 73.8Application
Czasy (s): 10, 11, 11, 12, 13, 13, 14, 14, 15, 100. Oblicz limity Tukey'a i zidentyfikuj wartość(i) odstającą.
- Ex. 73.9Application
Masy (kg): 60, 62, 64, 65, 65, 67, 70, 72, 75, 80. Opisz wszystkie elementy boxplotu.
- Ex. 73.10Application
Dla ,
- Ex. 73.11Application
Dane z . Używając odpornego estymatora , oblicz .
- Ex. 73.12Application
Ile punktów powyżej oczekiwalibyśmy w próbce 1000 obserwacji normalnych?
- Ex. 73.13Application
Boxplot A: wąskie pudełko, mediana wyśrodkowana. Boxplot B: szerokie pudełko, mediana blisko . Porównaj rozproszenie i skośność dwóch zbiorów.
- Ex. 73.14Application
Rozkład z długim ogonem w prawo. Średnia jest w jakiej pozycji względem mediany?
- Ex. 73.15Application
Zbiór A ma , zbiór B ma . W którym jest więcej rozproszenia w danych centralnych?
- Ex. 73.16Application
Mediana . A to 55, B to 80. Który z dwóch ma rozkład bardziej skośny w prawo?
- Ex. 73.17Application
pensji firmy = 30 tys. Interpretuj tę informację.
- Ex. 73.18Application
Uczeń jest na matury. Co to oznacza?
- Ex. 73.19Application
Jeśli , co można zaključyć o danych?
- Ex. 73.20Understanding
Stwierdzenie "reguła 1,5 IQR flaguje 5% danych jako wartości odstające" jest poprawne dla danych normalnych?
- Ex. 73.21ApplicationAnswer key
Wiek (lata): 40, 52, 55, 58, 62, 66, 72. Oblicz streszczenie pięcioliczbowe i sprawdź czy są wartości odstające.
- Ex. 73.22ApplicationAnswer key
Oceny 10 uczniów: 3, 5, 6, 7, 7, 8, 8, 9, 10, 10. Pełny boxplot (z weryfikacją wartości odstających).
- Ex. 73.23Modeling
Klasa 100 uczniów: , . Uczeń zdobył 9,5 — czy jest w top 25%?
- Ex. 73.24Modeling
Dlaczego GUS publikuje medianę dochodów, a nie tylko średnią, w raportach o nierówności w Polsce?
- Ex. 73.25Modeling
Części produkowane z średnicą: mm, mm. Specyfikacja: mm. Czy proces jest wyśrodkowany? Czy grozi znaczące odrzucenie?
- Ex. 73.26Modeling
Test A/B strony: wariant A ma medianę 1,2 s i ; wariant B ma medianę 1,1 s i . Który byś wybrał do uruchomienia w produkcji? Uzasadnij za pomocą statystyk rozproszenia.
- Ex. 73.27ModelingAnswer key
Wykrywasz wartość odstającą w transakcjach finansowych, która wygląda na oszustwo. Czy powinieneś ją usunąć przed analizą danych? Uzasadnij argumentami statystycznymi.
- Ex. 73.28Modeling
Czasy odpowiedzi (ms): 120, 130, 135, 140, 142, 145, 148, 150, 155, 380. Oblicz streszczenie pięcioliczbowe i oceń czy system spełnia SLA 200 ms w oparciu o kwartyle.
- Ex. 73.29Modeling
Szpital z 4 oddziałami. Czasy hospitalizacji (dni): Oddział A: 5, 8, 9, 10, 12; B: 3, 4, 4, 5, 20; C: 7, 8, 8, 9, 10; D: 2, 3, 15, 18, 25. Zbuduj streszczenia pięcioliczbowe i zidentyfikuj który oddział jest bardziej przewidywalny w zarządzaniu łóżkami.
- Ex. 73.30Modeling
Oceny matury na szkołę. Szkoła A: mediana 650, . Szkoła B: mediana 620, . Która szkoła ma bardziej jednolite wyniki? Co każdy wzorzec sugeruje dla polityki pedagogicznej?
- Ex. 73.31Modeling
Średnie opady miesięczne w Warszawie (mm): 234, 181, 130, 83, 68, 52, 44, 47, 82, 122, 145, 201. Oblicz streszczenie pięcioliczbowe i interpretuj sezonowość.
- Ex. 73.32Modeling
Ceny nieruchomości w dzielnicy (tys.): 250, 280, 310, 320, 340, 350, 380, 390, 420, 1800. Oblicz medianę i średnią. Dlaczego kupujący powinien używać mediany jako odniesienia ceny typowej?
- Ex. 73.33Understanding
Wyjaśnij, na swoimi słowami, dlaczego mediana i IQR są "odporne" podczas gdy średnia i odchylenie standardowe nie są. Użyj konkretnego przykładu.
- Ex. 73.34UnderstandingAnswer key
Czy boxplot może ukryć rozkład bimodalny? Zbuduj konkretny przykład rozkładu bimodalnego, który ma ten sam boxplot co rozkład unimodalny.
- Ex. 73.35UnderstandingAnswer key
Dla , wynosi:
- Ex. 73.36Challenge
Oblicz analitycznie zmiennej . Wyraź w funkcji .
- Ex. 73.37Challenge
Argumentuj dlaczego punkt przegięcia wynosi 25%, mediany 50%, a średniej 0%.
- Ex. 73.38ProofAnswer key
Udowodnij: jeśli jest zmienną losową ciągłą z gęstością symetryczną wokół , wtedy jest medianą .
- Ex. 73.39Proof
Pokaż że dla i próbek iid z Uniform(0,1), estymator próbkowy zbiega do 0,25. Użyj właściwości statystyk porządkowych.
- Ex. 73.40Proof
Udowodnij że mediana minimalizuje dla wszystkich wartości .
Źródła
- OpenIntro Statistics (4. wyd) — Diez, Çetinkaya-Rundel, Barr · 2019 · EN · CC-BY-SA. Źródło primarne — §2.1 (kwartyle, percentyle) i §2.2 (boxplot, wartości odstające).
- Statistics (OpenStax) — Illowsky, Dean · 2022 · EN · CC-BY. §2.3 (percentyle przez interpolację) i §2.4 (boxplot i reguła 1,5 IQR).
- Introduction to Probability (Grinstead-Snell) — Grinstead, Snell · 1997 · EN · GNU FDL. §5.1 — kwartyle rozkładów ciągłych, statystyki porządkowe.