Math ClubMath Club
v1 · padrão canônico

Lição 73 — Quartis, percentis e boxplot

Resumo de 5 números: mín, Q1, mediana, Q3, máx. IQR, boxplot e regra 1,5 IQR para detectar outliers. Medidas robustas em dados assimétricos.

Used in: Stochastik — Leistungskurs alemão · H2 Math Statistics — Singapura · AP Statistics — EUA · Math B — Japão

IQR=Q3Q1,outlier se x<Q11,5IQR lub x>Q3+1,5IQRIQR = Q_3 - Q_1, \quad \text{outlier se } x < Q_1 - 1{,}5\,IQR \text{ lub } x > Q_3 + 1{,}5\,IQR
Choose your door

Rigorous notation, full derivation, hypotheses

Definicja rygorystyczna

Statystyki porządkowe i percentyle

"Pierwszy kwartyl, Q1Q_1, to wartość taka, że 25% danych znajduje się poniżej niej, a trzeci kwartyl, Q3Q_3, to taka, że 75% danych znajduje się poniżej niej." — OpenIntro Statistics §2.1

minQ₁Q₂Q₃maxoutlieroutlierIQR

Anatomia boxplotu: pudełko (Q1 do Q3), linia mediany, wąsy do skrajnego obserwacji, punkty dla wartości odstających.

Przykłady rozwiązane

Exercise list

40 exercises · 10 with worked solution (25%)

Application 21Understanding 4Modeling 10Challenge 2Proof 3
  1. Ex. 73.1ApplicationAnswer key

    Dane: 1, 3, 5, 7, 9. Oblicz medianę, Q1Q_1 i Q3Q_3.

  2. Ex. 73.2Application

    Dane: 2, 4, 6, 8, 10, 12. Oblicz streszczenie pięcioliczbowe.

  3. Ex. 73.3ApplicationAnswer key

    Oceny: 4, 5, 6, 6, 7, 7, 8, 8, 9, 10. Oblicz Q1Q_1, Q2Q_2, Q3Q_3.

  4. Ex. 73.4Application

    Oblicz IQRIQR danych: 12, 14, 18, 22, 25, 28, 32.

  5. Ex. 73.5ApplicationAnswer key

    Wiek: 18, 20, 21, 22, 23, 24, 25, 27, 30, 35, 60. Zastosuj regułę 1,5 IQR. Czy jest wartość odstająca?

  6. Ex. 73.6Application

    Pensje (tys.): 2, 3, 3, 4, 4, 5, 5, 6, 8, 50. Oblicz medianę i IQRIQR.

  7. Ex. 73.7ApplicationAnswer key

    Dla n=100n = 100 danych posortowanych, jaka jest pozycja Q3Q_3 metodą interpolacji liniowej?

  8. Ex. 73.8Application

    Czasy (s): 10, 11, 11, 12, 13, 13, 14, 14, 15, 100. Oblicz limity Tukey'a i zidentyfikuj wartość(i) odstającą.

  9. Ex. 73.9Application

    Masy (kg): 60, 62, 64, 65, 65, 67, 70, 72, 75, 80. Opisz wszystkie elementy boxplotu.

  10. Ex. 73.10Application

    Dla ZN(0,1)Z \sim \mathcal N(0,1), Q3Q1=?Q_3 - Q_1 = ?

  11. Ex. 73.11Application

    Dane z IQR=6,7IQR = 6{,}7. Używając odpornego estymatora σ^=IQR/1,349\hat\sigma = IQR/1{,}349, oblicz σ^\hat\sigma.

  12. Ex. 73.12Application

    Ile punktów powyżej Q3+3IQRQ_3 + 3 \cdot IQR oczekiwalibyśmy w próbce 1000 obserwacji normalnych?

  13. Ex. 73.13Application

    Boxplot A: wąskie pudełko, mediana wyśrodkowana. Boxplot B: szerokie pudełko, mediana blisko Q1Q_1. Porównaj rozproszenie i skośność dwóch zbiorów.

  14. Ex. 73.14Application

    Rozkład z długim ogonem w prawo. Średnia jest w jakiej pozycji względem mediany?

  15. Ex. 73.15Application

    Zbiór A ma IQR=5IQR = 5, zbiór B ma IQR=20IQR = 20. W którym jest więcej rozproszenia w danych centralnych?

  16. Ex. 73.16Application

    Mediana A=B=50A = B = 50. Q3Q_3 A to 55, B to 80. Który z dwóch ma rozkład bardziej skośny w prawo?

  17. Ex. 73.17Application

    P90P_{90} pensji firmy = 30 tys. Interpretuj tę informację.

  18. Ex. 73.18Application

    Uczeń jest na P85P_{85} matury. Co to oznacza?

  19. Ex. 73.19Application

    Jeśli Q1=Q2=Q3Q_1 = Q_2 = Q_3, co można zaključyć o danych?

  20. Ex. 73.20Understanding

    Stwierdzenie "reguła 1,5 IQR flaguje 5% danych jako wartości odstające" jest poprawne dla danych normalnych?

  21. Ex. 73.21ApplicationAnswer key

    Wiek (lata): 40, 52, 55, 58, 62, 66, 72. Oblicz streszczenie pięcioliczbowe i sprawdź czy są wartości odstające.

  22. Ex. 73.22ApplicationAnswer key

    Oceny 10 uczniów: 3, 5, 6, 7, 7, 8, 8, 9, 10, 10. Pełny boxplot (z weryfikacją wartości odstających).

  23. Ex. 73.23Modeling

    Klasa 100 uczniów: Q1=5Q_1 = 5, Q3=8Q_3 = 8. Uczeń zdobył 9,5 — czy jest w top 25%?

  24. Ex. 73.24Modeling

    Dlaczego GUS publikuje medianę dochodów, a nie tylko średnią, w raportach o nierówności w Polsce?

  25. Ex. 73.25Modeling

    Części produkowane z średnicą: Q1=9,98Q_1 = 9{,}98 mm, Q3=10,02Q_3 = 10{,}02 mm. Specyfikacja: 10,00±0,0510{,}00 \pm 0{,}05 mm. Czy proces jest wyśrodkowany? Czy grozi znaczące odrzucenie?

  26. Ex. 73.26Modeling

    Test A/B strony: wariant A ma medianę 1,2 s i IQR=0,3IQR = 0{,}3; wariant B ma medianę 1,1 s i IQR=1,5IQR = 1{,}5. Który byś wybrał do uruchomienia w produkcji? Uzasadnij za pomocą statystyk rozproszenia.

  27. Ex. 73.27ModelingAnswer key

    Wykrywasz wartość odstającą w transakcjach finansowych, która wygląda na oszustwo. Czy powinieneś ją usunąć przed analizą danych? Uzasadnij argumentami statystycznymi.

  28. Ex. 73.28Modeling

    Czasy odpowiedzi (ms): 120, 130, 135, 140, 142, 145, 148, 150, 155, 380. Oblicz streszczenie pięcioliczbowe i oceń czy system spełnia SLA 200 ms w oparciu o kwartyle.

  29. Ex. 73.29Modeling

    Szpital z 4 oddziałami. Czasy hospitalizacji (dni): Oddział A: 5, 8, 9, 10, 12; B: 3, 4, 4, 5, 20; C: 7, 8, 8, 9, 10; D: 2, 3, 15, 18, 25. Zbuduj streszczenia pięcioliczbowe i zidentyfikuj który oddział jest bardziej przewidywalny w zarządzaniu łóżkami.

  30. Ex. 73.30Modeling

    Oceny matury na szkołę. Szkoła A: mediana 650, IQR=80IQR = 80. Szkoła B: mediana 620, IQR=200IQR = 200. Która szkoła ma bardziej jednolite wyniki? Co każdy wzorzec sugeruje dla polityki pedagogicznej?

  31. Ex. 73.31Modeling

    Średnie opady miesięczne w Warszawie (mm): 234, 181, 130, 83, 68, 52, 44, 47, 82, 122, 145, 201. Oblicz streszczenie pięcioliczbowe i interpretuj sezonowość.

  32. Ex. 73.32Modeling

    Ceny nieruchomości w dzielnicy (tys.): 250, 280, 310, 320, 340, 350, 380, 390, 420, 1800. Oblicz medianę i średnią. Dlaczego kupujący powinien używać mediany jako odniesienia ceny typowej?

  33. Ex. 73.33Understanding

    Wyjaśnij, na swoimi słowami, dlaczego mediana i IQR są "odporne" podczas gdy średnia i odchylenie standardowe nie są. Użyj konkretnego przykładu.

  34. Ex. 73.34UnderstandingAnswer key

    Czy boxplot może ukryć rozkład bimodalny? Zbuduj konkretny przykład rozkładu bimodalnego, który ma ten sam boxplot co rozkład unimodalny.

  35. Ex. 73.35UnderstandingAnswer key

    Dla XUniform(0,1)X \sim \text{Uniform}(0, 1), IQRIQR wynosi:

  36. Ex. 73.36Challenge

    Oblicz analitycznie IQRIQR zmiennej XExponential(λ)X \sim \text{Exponential}(\lambda). Wyraź w funkcji λ\lambda.

  37. Ex. 73.37Challenge

    Argumentuj dlaczego punkt przegięcia IQRIQR wynosi 25%, mediany 50%, a średniej 0%.

  38. Ex. 73.38ProofAnswer key

    Udowodnij: jeśli XX jest zmienną losową ciągłą z gęstością symetryczną wokół μ\mu, wtedy μ\mu jest medianą XX.

  39. Ex. 73.39Proof

    Pokaż że dla nn \to \infty i próbek iid z Uniform(0,1), estymator próbkowy Q1Q_1 zbiega do 0,25. Użyj właściwości statystyk porządkowych.

  40. Ex. 73.40Proof

    Udowodnij że mediana minimalizuje E[Xc]E[|X - c|] dla wszystkich wartości cRc \in \mathbb{R}.

Źródła

  • OpenIntro Statistics (4. wyd) — Diez, Çetinkaya-Rundel, Barr · 2019 · EN · CC-BY-SA. Źródło primarne — §2.1 (kwartyle, percentyle) i §2.2 (boxplot, wartości odstające).
  • Statistics (OpenStax) — Illowsky, Dean · 2022 · EN · CC-BY. §2.3 (percentyle przez interpolację) i §2.4 (boxplot i reguła 1,5 IQR).
  • Introduction to Probability (Grinstead-Snell) — Grinstead, Snell · 1997 · EN · GNU FDL. §5.1 — kwartyle rozkładów ciągłych, statystyki porządkowe.

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.