Lição 71 — Medidas de tendência central: média, mediana, moda
Resumir um conjunto de dados com um único número: média, mediana, moda. Quando usar cada uma e o que a escolha revela sobre a distribuição.
Used in: 2.º ano do EM (16-17 anos) · Stochastik LK alemão · H2 Math Statistics singapurense · Math B japonês
Rigorous notation, full derivation, hypotheses
Definitionen und Eigenschaften
Deskriptive Statistik: das Zusammenfassungsproblem
Gegeben sind Beobachtungen . Wir suchen eine einzelne Zahl, die die „Mitte" der Verteilung darstellt. Es gibt keine einzige Antwort — es gibt drei verschiedene Fragen, drei verschiedene Antworten.
"Der Stichprobenmittelwert kann für jede quantitative Variable berechnet werden. Für eine diskrete Verteilung ist der Mittelwert die Summe jedes Wertes multipliziert mit seiner Wahrscheinlichkeit; für eine stetige Verteilung das entsprechende Integral." — OpenIntro Statistics, §1.6
Algebraische Eigenschaften des Mittelwerts
"Der Mittelwert minimiert die Summe der quadrierten Abweichungen (Fehler ). Der Median minimiert die Summe der absoluten Abweichungen (Fehler ). Diese Unterscheidung hat tiefe Konsequenzen in der Regression und beim maschinellen Lernen." — OpenIntro Statistics, §2.1
Zusammenhang zwischen den drei Maßen und Schiefe
Zusammenhang zwischen Modus, Median und Mittelwert je nach Schiefe der Verteilung. Bei Rechtsschiefe (lange positive Schwanzkante): Modus kleiner als Median kleiner als Mittelwert.
| Form der Verteilung | Beziehung |
|---|---|
| Symmetrisch unimodal | Modus Median Mittelwert |
| Rechtsschiefe (positive Schwanzkante) | Modus Median Mittelwert |
| Linksschiefe (negative Schwanzkante) | Mittelwert Median Modus |
Gelöste Beispiele
Exercise list
42 exercises · 10 with worked solution (25%)
- Ex. 71.1Application
Daten: 5, 6, 7, 7, 7, 8, 9. Berechne Mittelwert, Median und Modus.
- Ex. 71.2Application
Noten von 8 Schülern: 4, 5, 6, 6, 7, 8, 9, 10. Berechne Mittelwert, Median und Modus.
- Ex. 71.3Application
Monatliche Gehälter (R$ Tausend): 2, 2, 3, 4, 5, 50. Vergleiche Mittelwert und Median. Welcher repräsentiert besser das typische Gehalt?
- Ex. 71.4Application
Alter von 7 Teilnehmern: 18, 19, 20, 21, 22, 23, 24. Berechne Mittelwert, Median und Modus.
- Ex. 71.5ApplicationAnswer key
Ladezeiten (s): 0,5; 0,7; 0,8; 0,9; 1,1; 1,5; 7,0. Berechne Mittelwert und Median. Ist der Median informativer als der Mittelwert in diesem Fall?
- Ex. 71.6Application
Autofarben auf einem Parkplatz: 12 Weiße, 8 Schwarze, 5 Graue, 5 Rote. Welches Maß der zentralen Tendenz ist angemessen?
- Ex. 71.7ApplicationAnswer key
Daten: 1, 1, 2, 3, 5, 5, 7. Bestimme die Modus/Modi. Wie wird diese Verteilung klassifiziert?
- Ex. 71.8Application
Häufigkeitstabelle: = 4, 5, 6, 7, 8 mit Häufigkeiten = 2, 3, 5, 3, 2. Berechne den arithmetischen Mittelwert.
- Ex. 71.9Application
Gruppierte Daten: Intervalle , , mit Häufigkeiten 5, 12, 3. Berechne den Mittelwert mit Mittenpunkten.
- Ex. 71.10Application
Eine Klasse hat Durchschnittsalter Jahre. Ein neuer 20-jähriger Schüler tritt bei und der neue Mittelwert ist Jahre. Wie viele Schüler waren ursprünglich da?
- Ex. 71.11ApplicationAnswer key
Berechne Mittelwert, Median und Modus für: 3, 3, 4, 5, 6, 6, 6, 9.
- Ex. 71.12ApplicationAnswer key
Berechne Mittelwert, Median und Modus/Modi für: 10, 10, 11, 12, 13, 14, 14, 15, 19.
- Ex. 71.13UnderstandingAnswer key
Warum bevorzugt das IBGE den Median (und nicht den Mittelwert) zur Beschreibung des Pro-Kopf-Haushaltseinkommens Brasiliens?
- Ex. 71.14Understanding
Wartezeit in einer Notaufnahme: die Mehrheit wird in 1 bis 2 Stunden behandelt, aber einige schwere Fälle warten länger als 10 Stunden. Welches Maß würdest du zur Beschreibung der typischen Wartezeit nutzen? Begründe.
- Ex. 71.15Understanding
Ein Hersteller möchte die typische Lebensdauer seiner LED-Lampen angeben. Schlag vor, welches Maß der zentralen Tendenz man nutzen sollte und begründe.
- Ex. 71.16Understanding
Eine Wahlumfrage befragt 1.000 Wähler, welche Partei sie wählen werden. Welches Maß der zentralen Tendenz identifiziert die bevorzugte Partei?
- Ex. 71.17Understanding
Für eine unimodale Verteilung mit Rechtsschiefe (lange positive Schwanzkante), wie ist die typische Ordnung zwischen Modus, Median und Mittelwert? Erkläre intuitiv.
- Ex. 71.18UnderstandingAnswer key
Gleichverteilung auf . Bestimme Mittelwert, Median und diskutiere die Modus. Was sagt dies über symmetrische Verteilungen?
- Ex. 71.19Understanding
ENEM-Noten folgen ungefähr einer Normalverteilung. Ist Mittelwert oder Median angemessener um die typische Leistung zu beschreiben? Begründe.
- Ex. 71.20Understanding
Ein Investor möchte die häufigste Zimmerzahl in Wohnungen eines Stadtteils wissen. Welches Maß sollte man nutzen?
- Ex. 71.21UnderstandingAnswer key
Seitenladezeit: 95% der Anfragen antworten in unter 300 ms, aber 1% braucht länger als 5 s. Warum bevorzugen Zuverlässigkeitsingenieure Median (P50) und Perzentile (P95, P99) statt des Mittelwerts?
- Ex. 71.22Understanding
Warum sind für eine symmetrische unimodale stetige Verteilung die drei Maße der zentralen Tendenz gleich? Erkläre geometrisch.
- Ex. 71.23Modeling
A/B-Test: Checkout-Zeit von Website A hat Mittelwert 12 s und Median 9 s. Website B hat Mittelwert 10 s und Median 10 s. Welche Website hat bessere Erfahrung für den typischen Benutzer? Begründe.
- Ex. 71.24Modeling
Firma A berichtet nur Durchschnittsgehalt von R 8.000 und Median von R$ 7.000. Was könnte die Abwesenheit der Mediana in A verbergen?
- Ex. 71.25Modeling
In K-means ist der Cluster-Schwerpunkt der Mittelwert. Welche Auswirkung hat ein Ausreißer auf den Schwerpunkt? Wie mindert K-medoids (das den Median-Punkt nutzt) dieses Problem?
- Ex. 71.26Modeling
Qualitätskontrolle: Teile mit Durchschnittsdurchmesser mm und ungefähr symmetrischer Verteilung. Welchem Wert würdest du erwarten, dass die Mediana nahe kommt? Warum?
- Ex. 71.27Modeling
Beim maschinellen Lernen impliziert MSE als Verlustfunktion, dass das Modell die bedingte Mediana lernt. Erkläre warum dies aus der variationellen Charakterisierung der zentralen Maße folgt.
- Ex. 71.28Modeling
Eine Meta-Analyse mit 50 Studien berichtet die Mediana der Effektgröße statt des Mittelwerts. Warum wird die Mediana in Meta-Analysen bevorzugt?
- Ex. 71.29Modeling
Warum nutzt das Boxplot den Mediana als mittlere Linie (und die IQR als Kastenbreite) statt Mittelwert und Standardabweichung?
- Ex. 71.30Modeling
Beim föderiertem Lernen, warum erhöht das Ersetzen des Mittelwerts von Gradienten durch den Mediana die Widerstandsfähigkeit gegen böswillige Clients (Byzantine-Angriffe)?
- Ex. 71.31Modeling
Für die Log-Normal-Verteilung (): Modus , Mediana , Mittelwert . Verifiziere die Ordnung Modus kleiner als Mediana kleiner als Mittelwert für .
- Ex. 71.32ModelingAnswer key
Gehälter (R 60.000 wird hinzugefügt (ohne jemanden zu entfernen). Berechne Mittelwert und Mediana vor und nach. Welches Maß änderte sich mehr?
- Ex. 71.33Modeling
Noten von 30 Schülern in einer Prüfung, gruppiert: : 3 Schüler; : 8 Schüler; : 12 Schüler; : 7 Schüler. Berechne den geschätzten Mittelwert durch Mittenpunkte.
- Ex. 71.34Proof
Zeige, dass .
- Ex. 71.35Proof
Zeige, dass in für jede Sequenz minimiert wird.
- Ex. 71.36Proof
Zeige, dass in minimiert wird. (Hinweis: analysiere was geschieht wenn man auf die eine oder andere Seite des Medians verschiebt, zähle wie viele oben und unten liegen.)
- Ex. 71.37Proof
Zeige, dass wenn (lineare Transformation), dann .
- Ex. 71.38Challenge
Erfüllt der Mittelwert allgemein? Und der Mediana? Untersuche mit und den Daten .
- Ex. 71.39Challenge
Cauchy-Verteilung: . Berechne den Mediana. Zeige, dass der Mittelwert nicht existiert (das Integral divergiert).
- Ex. 71.40Challenge
Zeige, dass wenn wir den größten Wert eines Datensatzes durch einen noch größeren Wert ersetzen, der Mediana nicht ändert, aber der Mittelwert erhöht.
- Ex. 71.41ChallengeAnswer key
Zwei Gruppen haben Mittelwerte und mit Größen und . Leite die Formel des kombinierten Mittelwerts der zwei Gruppen her.
- Ex. 71.42ChallengeAnswer key
Jensens Ungleichung besagt, dass für konvex, . Wende mit an um eine Ungleichung zwischen und zu erhalten. Was bedeutet das für die Varianz?
Quellen
- OpenIntro Statistics (4. Aufl.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA 4.0 · §1.6 (grundlegende deskriptive Maße, Wahl der Maßnahme, Schiefe) und §2.1 (variationelle Charakterisierung, Robustheit). Primärquelle dieser Lektion.
- Introductory Statistics 2e (OpenStax) — Illowsky, Dean et al. · CC-BY 4.0 · §2.5 (Berechnung des Mittelwerts für gruppierte Daten, umfangreiche Beispiele mit Häufigkeitstabellen).
- Estatística (Wikilivros) — gemeinschaftlich · CC-BY-SA 4.0 · Abschnitte: Mittelwert, Mediana, Modus, Maße der zentralen Tendenz (Referenz auf PT-BR; Czuber-Formel für Modus bei gruppierten Daten).
- Nobelpreis für Wirtschaft 2000 — Heckman und McFadden — mikroökonometrische Methoden basierend auf robuster Schätzung der zentralen Lage.