Lição 73 — Quartis, percentis e boxplot
Resumo de 5 números: mín, Q1, mediana, Q3, máx. IQR, boxplot e regra 1,5 IQR para detectar outliers. Medidas robustas em dados assimétricos.
Used in: Stochastik — Leistungskurs alemão · H2 Math Statistics — Singapura · AP Statistics — EUA · Math B — Japão
Rigorous notation, full derivation, hypotheses
Rigorose Definition
Ordnungsstatistiken und Perzentile
"The first quartile, , is the value such that 25% of the data fall below it, and the third quartile, , is such that 75% of the data fall below it." — OpenIntro Statistics §2.1
Anatomie des Boxplots: Box (Q1 bis Q3), Medianlinie, Whisker bis zum äußersten Nicht-Ausreißer, isolierte Punkte für Ausreißer.
Gelöste Beispiele
Exercise list
40 exercises · 10 with worked solution (25%)
- Ex. 73.1ApplicationAnswer key
Daten: 1, 3, 5, 7, 9. Berechnen Sie Median, und .
- Ex. 73.2Application
Daten: 2, 4, 6, 8, 10, 12. Berechnen Sie die Fünf-Zahlen-Zusammenfassung.
- Ex. 73.3ApplicationAnswer key
Noten: 4, 5, 6, 6, 7, 7, 8, 8, 9, 10. Berechnen Sie , , .
- Ex. 73.4Application
Berechnen Sie den der Daten: 12, 14, 18, 22, 25, 28, 32.
- Ex. 73.5ApplicationAnswer key
Alter: 18, 20, 21, 22, 23, 24, 25, 27, 30, 35, 60. Wenden Sie die Regel 1,5 IQR an. Gibt es einen Ausreißer?
- Ex. 73.6Application
Gehälter (RIQR$.
- Ex. 73.7ApplicationAnswer key
Für geordnete Daten, welche ist die Position von nach linearer Interpolationsmethode?
- Ex. 73.8Application
Zeiten (s): 10, 11, 11, 12, 13, 13, 14, 14, 15, 100. Berechnen Sie Tukey-Grenzen und identifizieren Sie den/die Ausreißer.
- Ex. 73.9Application
Gewichte (kg): 60, 62, 64, 65, 65, 67, 70, 72, 75, 80. Beschreiben Sie alle Elemente des Boxplots.
- Ex. 73.10Application
Für ,
- Ex. 73.11Application
Daten mit . Mit robustem Schätzer berechnen Sie .
- Ex. 73.12Application
Wie viele Punkte über würden Sie in einer Stichprobe von 1000 Normalverteilungen erwarten?
- Ex. 73.13Application
Boxplot A: schmale Box, zentrierter Median. Boxplot B: breite Box, Median nahe . Vergleichen Sie Streuung und Schiefe der beiden Datensätze.
- Ex. 73.14Application
Verteilung mit langem rechtem Schwanz. Der Mittelwert liegt an welcher Position relativ zum Median?
- Ex. 73.15Application
Datensatz A hat , Datensatz B hat . In welchem ist die Streuung der mittleren Daten größer?
- Ex. 73.16Application
Median von . von , von . Welche der beiden Verteilungen ist asymmetrischer nach rechts?
- Ex. 73.17Application
der Unternehmensgehälter = R$ 30 Tausend. Interpretieren Sie diese Information.
- Ex. 73.18Application
Ein Schüler liegt im des ENEM. Was bedeutet das?
- Ex. 73.19Application
Wenn , was kann über die Daten gesagt werden?
- Ex. 73.20Understanding
Ist die Aussage "die Regel 1,5 IQR markiert 5% der Daten als Ausreißer" korrekt für normalverteilte Daten?
- Ex. 73.21ApplicationAnswer key
Alter (Jahre): 40, 52, 55, 58, 62, 66, 72. Berechnen Sie die Fünf-Zahlen-Zusammenfassung und überprüfen Sie auf Ausreißer.
- Ex. 73.22ApplicationAnswer key
Noten von 10 Schülern: 3, 5, 6, 7, 7, 8, 8, 9, 10, 10. Vollständiger Boxplot (mit Ausreißer-Überprüfung).
- Ex. 73.23Modeling
Klasse mit 100 Schülern: , . Ein Schüler hat 9,5 erreicht — liegt er in den top 25%?
- Ex. 73.24Modeling
Warum veröffentlicht der IBGE den Medianeinkommen statt nur des Durchschnitts in Berichten über Ungleichheit in Brasilien?
- Ex. 73.25Modeling
Produzierte Teile mit Durchmesser: mm, mm. Spezifikation: mm. Ist der Prozess zentriert? Gibt es signifikantes Ablehnungsrisiko?
- Ex. 73.26Modeling
A/B-Test der Website: Variante A Median 1,2 s und ; Variante B Median 1,1 s und . Welche würden Sie produktiv setzen? Begründen Sie mit Streuungsstatistiken.
- Ex. 73.27ModelingAnswer key
Sie entdecken einen Ausreißer in Finanztransaktionen, der verdächtig nach Betrug aussieht. Sollten Sie ihn vor der Analyse entfernen? Begründen Sie statistisch.
- Ex. 73.28Modeling
Antwortzeiten (ms): 120, 130, 135, 140, 142, 145, 148, 150, 155, 380. Berechnen Sie die Fünf-Zahlen-Zusammenfassung und bewerten Sie, ob das System SLA von 200 ms basierend auf Quartilen erfüllt.
- Ex. 73.29Modeling
Krankenhaus mit 4 Stationen. Verweildauern (Tage): Station A: 5, 8, 9, 10, 12; Station B: 3, 4, 4, 5, 20; Station C: 7, 8, 8, 9, 10; Station D: 2, 3, 15, 18, 25. Konstruieren Sie Fünf-Zahlen-Zusammenfassungen und identifizieren Sie, welche Station bei der Bettenverwaltung vorhersagbarer ist.
- Ex. 73.30Modeling
ENEM-Noten nach Schule. Schule A: Median 650, . Schule B: Median 620, . Welche Schule hat einheitlichere Leistung? Was deutet jedes Muster für die Pädagogikrichtlinie an?
- Ex. 73.31Modeling
Durchschnittliche monatliche Niederschläge in São Paulo (mm): 234, 181, 130, 83, 68, 52, 44, 47, 82, 122, 145, 201. Berechnen Sie die Fünf-Zahlen-Zusammenfassung und interpretieren Sie die Saisonalität.
- Ex. 73.32Modeling
Immobilienpreise in einem Stadtteil (R$ Tausend): 250, 280, 310, 320, 340, 350, 380, 390, 420, 1800. Berechnen Sie Median und Mittelwert. Warum sollte ein Käufer den Median als Referenz für typischen Preis verwenden?
- Ex. 73.33Understanding
Erklären Sie in Ihren eigenen Worten, warum Median und IQR "robust" sind, während Mittelwert und Standardabweichung nicht robust sind. Verwenden Sie ein konkretes Beispiel.
- Ex. 73.34UnderstandingAnswer key
Kann ein Boxplot eine bimodale Verteilung verbergen? Konstruieren Sie ein konkretes Beispiel einer bimodalen Verteilung, die denselben Boxplot wie eine unimodale Verteilung hat.
- Ex. 73.35UnderstandingAnswer key
Für ist der :
- Ex. 73.36Challenge
Berechnen Sie analytisch den von . Drücken Sie als Funktion von aus.
- Ex. 73.37Challenge
Argumentieren Sie, warum der Durchbruchpunkt des 25%, der Median 50% und der Mittelwert 0% ist.
- Ex. 73.38ProofAnswer key
Beweisen Sie: wenn eine stetige Zufallsvariable mit um symmetrischer Dichte ist, dann ist der Median von .
- Ex. 73.39Proof
Zeigen Sie, dass für und iid Stichproben von Uniform(0,1) der empirische Schätzer von gegen 0,25 konvergiert. Verwenden Sie Eigenschaften von Ordnungsstatistiken.
- Ex. 73.40Proof
Beweisen Sie, dass der Median über alle Werte minimiert.
Quellen
- OpenIntro Statistics (4. Aufl.) — Diez, Çetinkaya-Rundel, Barr · 2019 · EN · CC-BY-SA. Primäre Quelle — §2.1 (Quartile, Perzentile) und §2.2 (Boxplot, Ausreißer).
- Statistics (OpenStax) — Illowsky, Dean · 2022 · EN · CC-BY. §2.3 (Perzentile durch Interpolation) und §2.4 (Boxplot und Regel 1,5 IQR).
- Introduction to Probability (Grinstead-Snell) — Grinstead, Snell · 1997 · EN · GNU FDL. §5.1 — Quartile stetiger Verteilungen, Ordnungsstatistiken.