Math ClubMath Club
v1 · padrão canônico

Lição 73 — Quartis, percentis e boxplot

Resumo de 5 números: mín, Q1, mediana, Q3, máx. IQR, boxplot e regra 1,5 IQR para detectar outliers. Medidas robustas em dados assimétricos.

Used in: Stochastik — Leistungskurs alemão · H2 Math Statistics — Singapura · AP Statistics — EUA · Math B — Japão

IQR=Q3Q1,outlier se x<Q11,5IQR ou x>Q3+1,5IQRIQR = Q_3 - Q_1, \quad \text{outlier se } x < Q_1 - 1{,}5\,IQR \text{ ou } x > Q_3 + 1{,}5\,IQR
Choose your door

Rigorous notation, full derivation, hypotheses

厳密な定義

順序統計量とパーセンタイル

"The first quartile, Q1Q_1, is the value such that 25% of the data fall below it, and the third quartile, Q3Q_3, is such that 75% of the data fall below it." — OpenIntro Statistics §2.1

最小Q₁Q₂Q₃最大外れ値外れ値IQR

箱ひげ図の構造:箱(Q1 から Q3)、中央値線、外れ値でない最後の値までのひげ、外れ値の個別プロット。

解いた例

Exercise list

40 exercises · 10 with worked solution (25%)

Application 21Understanding 4Modeling 10Challenge 2Proof 3
  1. Ex. 73.1ApplicationAnswer key

    データ:1, 3, 5, 7, 9。中央値、Q1Q_1Q3Q_3 を計算してください。

  2. Ex. 73.2Application

    データ:2, 4, 6, 8, 10, 12。5 数要約を計算してください。

  3. Ex. 73.3ApplicationAnswer key

    成績:4, 5, 6, 6, 7, 7, 8, 8, 9, 10。Q1Q_1Q2Q_2Q3Q_3 を計算してください。

  4. Ex. 73.4Application

    データの IQR を計算してください:12, 14, 18, 22, 25, 28, 32。

  5. Ex. 73.5ApplicationAnswer key

    年齢:18, 20, 21, 22, 23, 24, 25, 27, 30, 35, 60。1.5 IQR 規則を適用してください。外れ値はありますか?

  6. Ex. 73.6Application

    給与(ブラジル・レアル千):2, 3, 3, 4, 4, 5, 5, 6, 8, 50。中央値と IQR を計算してください。

  7. Ex. 73.7ApplicationAnswer key

    n=100n = 100 の並べたデータについて、線形補間法で Q3Q_3 の位置は何ですか?

  8. Ex. 73.8Application

    時間(秒):10, 11, 11, 12, 13, 13, 14, 14, 15, 100。Tukey の限界を計算し、外れ値を特定してください。

  9. Ex. 73.9Application

    重量(kg):60, 62, 64, 65, 65, 67, 70, 72, 75, 80。箱ひげ図の全要素を記述してください。

  10. Ex. 73.10Application

    ZN(0,1)Z \sim \mathcal N(0,1) について、Q3Q1=?Q_3 - Q_1 = ?

  11. Ex. 73.11Application

    IQR=6,7IQR = 6{,}7 のデータ。堅牢推定量 σ^=IQR/1,349\hat\sigma = IQR/1{,}349 を使って σ^\hat\sigma を計算してください。

  12. Ex. 73.12Application

    1000 の正規観測値のサンプルで Q3+3IQRQ_3 + 3 \cdot IQR より上にいくつポイントを期待しますか?

  13. Ex. 73.13Application

    箱ひげ図 A:狭い箱、中央値が中央。箱ひげ図 B:広い箱、中央値が Q1Q_1 に近い。2 つのセットの分散と非対称性を比較してください。

  14. Ex. 73.14Application

    右に長い尾を持つ分布。平均は中央値に対してどこにありますか?

  15. Ex. 73.15Application

    セット A の IQR=5IQR = 5、セット B の IQR=20IQR = 20。どちらが中央データで分散が多いですか?

  16. Ex. 73.16Application

    A=B=50A = B = 50 の中央値。AAQ3=55Q_3 = 55BBQ3=80Q_3 = 80。どちらが右に非対称分布ですか?

  17. Ex. 73.17Application

    企業の給与の P90P_{90} = 30 ブラジル・レアル千。この情報を解釈してください。

  18. Ex. 73.18Application

    学生が ENEM の P85P_{85} にいます。何を意味しますか?

  19. Ex. 73.19Application

    Q1=Q2=Q3Q_1 = Q_2 = Q_3 の場合、データについて何が言えますか?

  20. Ex. 73.20Understanding

    「1.5 IQR 規則は正規データで 5% をたるべて外れ値として標識する」は正確ですか?

  21. Ex. 73.21ApplicationAnswer key

    年齢(年):40, 52, 55, 58, 62, 66, 72。5 数要約を計算し、外れ値を確認してください。

  22. Ex. 73.22ApplicationAnswer key

    10 人の生徒の成績:3, 5, 6, 7, 7, 8, 8, 9, 10, 10。完全な箱ひげ図(外れ値確認付き)。

  23. Ex. 73.23Modeling

    100 人のクラス:Q1=5Q_1 = 5Q3=8Q_3 = 8。生徒が 9.5 を取得 — 上位 25% ですか?

  24. Ex. 73.24Modeling

    IBGE がブラジルの不平等報告でなぜ中央値のみでなく平均ではなく、中央値を公表するのですか?

  25. Ex. 73.25Modeling

    製造部品の直径:Q1=9,98Q_1 = 9{,}98 mm、Q3=10,02Q_3 = 10{,}02 mm。仕様:10,00±0,0510{,}00 \pm 0{,}05 mm。プロセスは中央化されていますか?顕著な拒否リスクはありますか?

  26. Ex. 73.26Modeling

    サイトの A/B テスト:バリアント A は中央値 1.2 s、IQR=0,3IQR = 0{,}3;バリアント B は中央値 1.1 s、IQR=1,5IQR = 1{,}5。本番環境で起動するのはどちらを推奨しますか?分散統計を使って正当化してください。

  27. Ex. 73.27ModelingAnswer key

    金融取引で詐欺に見える外れ値を検出しています。データを分析する前に削除すべきですか?統計議論で正当化してください。

  28. Ex. 73.28Modeling

    応答時間(ms):120, 130, 135, 140, 142, 145, 148, 150, 155, 380。5 数要約を計算し、四分位数に基づき、SLA 200 ms を満たすシステムを評価してください。

  29. Ex. 73.29Modeling

    4 つの病棟がある病院。入院時間(日):A:5, 8, 9, 10, 12;B:3, 4, 4, 5, 20;C:7, 8, 8, 9, 10;D:2, 3, 15, 18, 25。5 数要約を構築し、どの病棟がベッド管理で最も予測可能か特定してください。

  30. Ex. 73.30Modeling

    学校別 ENEM 成績。学校 A:中央値 650、IQR=80IQR = 80。学校 B:中央値 620、IQR=200IQR = 200。どちらが均一パフォーマンス?各パターンはどんな教育政策を示唆?

  31. Ex. 73.31Modeling

    サンパウロの月降水平均(mm):234, 181, 130, 83, 68, 52, 44, 47, 82, 122, 145, 201。5 数要約を計算し、季節性を解釈してください。

  32. Ex. 73.32Modeling

    近所の不動産価格(ブラジル・レアル千):250, 280, 310, 320, 340, 350, 380, 390, 420, 1800。中央値と平均を計算してください。なぜ購入者は中央値を一般的価格の参照として使うべきですか?

  33. Ex. 73.33Understanding

    自分の言葉で、なぜ中央値と IQR は「堅牢」で、平均と標準偏差は堅牢でないかを説明してください。具体例を使ってください。

  34. Ex. 73.34UnderstandingAnswer key

    箱ひげ図が二峰分布を隠すことができますか?一峰分布と同じ箱ひげ図を持つ二峰分布の具体例を構築してください。

  35. Ex. 73.35UnderstandingAnswer key

    XUniform(0,1)X \sim \text{Uniform}(0, 1) の場合、IQRIQR は:

  36. Ex. 73.36Challenge

    解析的に XExponential(λ)X \sim \text{Exponential}(\lambda) の IQR を計算してください。λ\lambda の関数として表現してください。

  37. Ex. 73.37Challenge

    IQR の崩壊点が 25%、中央値が 50%、平均が 0% である理由を議論してください。

  38. Ex. 73.38ProofAnswer key

    証明:XXμ\mu を中心に対称な密度を持つ連続確率変数なら、μ\muXX の中央値です。

  39. Ex. 73.39Proof

    nn \to \infty と Uniform(0,1) の iid サンプルについて、Q1Q_1 の標本推定量が 0.25 に収束することを示してください。順序統計量のプロパティを使ってください。

  40. Ex. 73.40Proof

    中央値が E[Xc]E[|X - c|] をすべての cRc \in \mathbb{R} で最小化することを証明してください。

参考文献

  • OpenIntro Statistics (第 4 版) — Diez, Çetinkaya-Rundel, Barr · 2019 · EN · CC-BY-SA. 第一次参考 — §2.1(四分位数、パーセンタイル)と §2.2(箱ひげ図、外れ値)。
  • Statistics (OpenStax) — Illowsky, Dean · 2022 · EN · CC-BY. §2.3(補間によるパーセンタイル)と §2.4(箱ひげ図と 1.5 IQR 規則)。
  • Introduction to Probability (Grinstead-Snell) — Grinstead, Snell · 1997 · EN · GNU FDL. §5.1 — 連続分布の四分位数、順序統計量。

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.