Math ClubMath Club
v1 · padrão canônico

Lição 71 — Medidas de tendência central: média, mediana, moda

Resumir um conjunto de dados com um único número: média, mediana, moda. Quando usar cada uma e o que a escolha revela sobre a distribuição.

Used in: 2.º ano do EM (16-17 anos) · Stochastik LK alemão · H2 Math Statistics singapurense · Math B japonês

xˉ=1ni=1nxi\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i
Choose your door

Rigorous notation, full derivation, hypotheses

Definitionen und Eigenschaften

Deskriptive Statistik: das Zusammenfassungsproblem

Gegeben sind nn Beobachtungen x1,x2,,xnx_1, x_2, \ldots, x_n. Wir suchen eine einzelne Zahl, die die „Mitte" der Verteilung darstellt. Es gibt keine einzige Antwort — es gibt drei verschiedene Fragen, drei verschiedene Antworten.

"Der Stichprobenmittelwert kann für jede quantitative Variable berechnet werden. Für eine diskrete Verteilung ist der Mittelwert die Summe jedes Wertes multipliziert mit seiner Wahrscheinlichkeit; für eine stetige Verteilung das entsprechende Integral." — OpenIntro Statistics, §1.6

Algebraische Eigenschaften des Mittelwerts

"Der Mittelwert minimiert die Summe der quadrierten Abweichungen (Fehler L2L^2). Der Median minimiert die Summe der absoluten Abweichungen (Fehler L1L^1). Diese Unterscheidung hat tiefe Konsequenzen in der Regression und beim maschinellen Lernen." — OpenIntro Statistics, §2.1

Zusammenhang zwischen den drei Maßen und Schiefe

Symmetrisch unimodalModus=Med=MittelwertRechtsschiefeModusMedMittelwertLinksschiefeModusMedMittelwert

Zusammenhang zwischen Modus, Median und Mittelwert je nach Schiefe der Verteilung. Bei Rechtsschiefe (lange positive Schwanzkante): Modus kleiner als Median kleiner als Mittelwert.

Form der VerteilungBeziehung
Symmetrisch unimodalModus == Median == Mittelwert
Rechtsschiefe (positive Schwanzkante)Modus << Median << Mittelwert
Linksschiefe (negative Schwanzkante)Mittelwert << Median << Modus

Gelöste Beispiele

Exercise list

42 exercises · 10 with worked solution (25%)

Application 12Understanding 10Modeling 11Challenge 5Proof 4
  1. Ex. 71.1Application

    Daten: 5, 6, 7, 7, 7, 8, 9. Berechne Mittelwert, Median und Modus.

  2. Ex. 71.2Application

    Noten von 8 Schülern: 4, 5, 6, 6, 7, 8, 9, 10. Berechne Mittelwert, Median und Modus.

  3. Ex. 71.3Application

    Monatliche Gehälter (R$ Tausend): 2, 2, 3, 4, 5, 50. Vergleiche Mittelwert und Median. Welcher repräsentiert besser das typische Gehalt?

  4. Ex. 71.4Application

    Alter von 7 Teilnehmern: 18, 19, 20, 21, 22, 23, 24. Berechne Mittelwert, Median und Modus.

  5. Ex. 71.5ApplicationAnswer key

    Ladezeiten (s): 0,5; 0,7; 0,8; 0,9; 1,1; 1,5; 7,0. Berechne Mittelwert und Median. Ist der Median informativer als der Mittelwert in diesem Fall?

  6. Ex. 71.6Application

    Autofarben auf einem Parkplatz: 12 Weiße, 8 Schwarze, 5 Graue, 5 Rote. Welches Maß der zentralen Tendenz ist angemessen?

  7. Ex. 71.7ApplicationAnswer key

    Daten: 1, 1, 2, 3, 5, 5, 7. Bestimme die Modus/Modi. Wie wird diese Verteilung klassifiziert?

  8. Ex. 71.8Application

    Häufigkeitstabelle: xx = 4, 5, 6, 7, 8 mit Häufigkeiten ff = 2, 3, 5, 3, 2. Berechne den arithmetischen Mittelwert.

  9. Ex. 71.9Application

    Gruppierte Daten: Intervalle [0,10)[0,10), [10,20)[10,20), [20,30)[20,30) mit Häufigkeiten 5, 12, 3. Berechne den Mittelwert mit Mittenpunkten.

  10. Ex. 71.10Application

    Eine Klasse hat Durchschnittsalter xˉ=17,5\bar{x} = 17{,}5 Jahre. Ein neuer 20-jähriger Schüler tritt bei und der neue Mittelwert ist 17,7517{,}75 Jahre. Wie viele Schüler waren ursprünglich da?

  11. Ex. 71.11ApplicationAnswer key

    Berechne Mittelwert, Median und Modus für: 3, 3, 4, 5, 6, 6, 6, 9.

  12. Ex. 71.12ApplicationAnswer key

    Berechne Mittelwert, Median und Modus/Modi für: 10, 10, 11, 12, 13, 14, 14, 15, 19.

  13. Ex. 71.13UnderstandingAnswer key

    Warum bevorzugt das IBGE den Median (und nicht den Mittelwert) zur Beschreibung des Pro-Kopf-Haushaltseinkommens Brasiliens?

  14. Ex. 71.14Understanding

    Wartezeit in einer Notaufnahme: die Mehrheit wird in 1 bis 2 Stunden behandelt, aber einige schwere Fälle warten länger als 10 Stunden. Welches Maß würdest du zur Beschreibung der typischen Wartezeit nutzen? Begründe.

  15. Ex. 71.15Understanding

    Ein Hersteller möchte die typische Lebensdauer seiner LED-Lampen angeben. Schlag vor, welches Maß der zentralen Tendenz man nutzen sollte und begründe.

  16. Ex. 71.16Understanding

    Eine Wahlumfrage befragt 1.000 Wähler, welche Partei sie wählen werden. Welches Maß der zentralen Tendenz identifiziert die bevorzugte Partei?

  17. Ex. 71.17Understanding

    Für eine unimodale Verteilung mit Rechtsschiefe (lange positive Schwanzkante), wie ist die typische Ordnung zwischen Modus, Median und Mittelwert? Erkläre intuitiv.

  18. Ex. 71.18UnderstandingAnswer key

    Gleichverteilung auf [0,10][0, 10]. Bestimme Mittelwert, Median und diskutiere die Modus. Was sagt dies über symmetrische Verteilungen?

  19. Ex. 71.19Understanding

    ENEM-Noten folgen ungefähr einer Normalverteilung. Ist Mittelwert oder Median angemessener um die typische Leistung zu beschreiben? Begründe.

  20. Ex. 71.20Understanding

    Ein Investor möchte die häufigste Zimmerzahl in Wohnungen eines Stadtteils wissen. Welches Maß sollte man nutzen?

  21. Ex. 71.21UnderstandingAnswer key

    Seitenladezeit: 95% der Anfragen antworten in unter 300 ms, aber 1% braucht länger als 5 s. Warum bevorzugen Zuverlässigkeitsingenieure Median (P50) und Perzentile (P95, P99) statt des Mittelwerts?

  22. Ex. 71.22Understanding

    Warum sind für eine symmetrische unimodale stetige Verteilung die drei Maße der zentralen Tendenz gleich? Erkläre geometrisch.

  23. Ex. 71.23Modeling

    A/B-Test: Checkout-Zeit von Website A hat Mittelwert 12 s und Median 9 s. Website B hat Mittelwert 10 s und Median 10 s. Welche Website hat bessere Erfahrung für den typischen Benutzer? Begründe.

  24. Ex. 71.24Modeling

    Firma A berichtet nur Durchschnittsgehalt von R10.000.FirmaBberichtetMittelwertvonR 10.000. Firma B berichtet Mittelwert von R 8.000 und Median von R$ 7.000. Was könnte die Abwesenheit der Mediana in A verbergen?

  25. Ex. 71.25Modeling

    In K-means ist der Cluster-Schwerpunkt der Mittelwert. Welche Auswirkung hat ein Ausreißer auf den Schwerpunkt? Wie mindert K-medoids (das den Median-Punkt nutzt) dieses Problem?

  26. Ex. 71.26Modeling

    Qualitätskontrolle: Teile mit Durchschnittsdurchmesser dˉ=10,05\bar{d} = 10{,}05 mm und ungefähr symmetrischer Verteilung. Welchem Wert würdest du erwarten, dass die Mediana nahe kommt? Warum?

  27. Ex. 71.27Modeling

    Beim maschinellen Lernen impliziert MSE als Verlustfunktion, dass das Modell die bedingte Mediana lernt. Erkläre warum dies aus der variationellen Charakterisierung der zentralen Maße folgt.

  28. Ex. 71.28Modeling

    Eine Meta-Analyse mit 50 Studien berichtet die Mediana der Effektgröße statt des Mittelwerts. Warum wird die Mediana in Meta-Analysen bevorzugt?

  29. Ex. 71.29Modeling

    Warum nutzt das Boxplot den Mediana als mittlere Linie (und die IQR als Kastenbreite) statt Mittelwert und Standardabweichung?

  30. Ex. 71.30Modeling

    Beim föderiertem Lernen, warum erhöht das Ersetzen des Mittelwerts von Gradienten durch den Mediana die Widerstandsfähigkeit gegen böswillige Clients (Byzantine-Angriffe)?

  31. Ex. 71.31Modeling

    Für die Log-Normal-Verteilung (lnXN(μ,σ2)\ln X \sim N(\mu, \sigma^2)): Modus =eμσ2= e^{\mu-\sigma^2}, Mediana =eμ= e^\mu, Mittelwert =eμ+σ2/2= e^{\mu+\sigma^2/2}. Verifiziere die Ordnung Modus kleiner als Mediana kleiner als Mittelwert für σ>0\sigma > 0.

  32. Ex. 71.32ModelingAnswer key

    Gehälter (RTausend):4,4,5,5,6,7,7,8(8Mitarbeiter).EinCEOmitGehaltvonR Tausend): 4, 4, 5, 5, 6, 7, 7, 8 (8 Mitarbeiter). Ein CEO mit Gehalt von R 60.000 wird hinzugefügt (ohne jemanden zu entfernen). Berechne Mittelwert und Mediana vor und nach. Welches Maß änderte sich mehr?

  33. Ex. 71.33Modeling

    Noten von 30 Schülern in einer Prüfung, gruppiert: [60,70)[60,70): 3 Schüler; [70,80)[70,80): 8 Schüler; [80,90)[80,90): 12 Schüler; [90,100][90,100]: 7 Schüler. Berechne den geschätzten Mittelwert durch Mittenpunkte.

  34. Ex. 71.34Proof

    Zeige, dass i=1n(xixˉ)=0\sum_{i=1}^{n}(x_i - \bar{x}) = 0.

  35. Ex. 71.35Proof

    Zeige, dass i=1n(xic)2\sum_{i=1}^{n}(x_i - c)^2 in c=xˉc = \bar{x} für jede Sequenz x1,,xnRx_1, \ldots, x_n \in \mathbb{R} minimiert wird.

  36. Ex. 71.36Proof

    Zeige, dass i=1nxic\sum_{i=1}^{n}|x_i - c| in c=Medianac = \text{Mediana} minimiert wird. (Hinweis: analysiere was geschieht wenn man cc auf die eine oder andere Seite des Medians verschiebt, zähle wie viele xix_i oben und unten liegen.)

  37. Ex. 71.37Proof

    Zeige, dass wenn yi=axi+by_i = ax_i + b (lineare Transformation), dann yˉ=axˉ+b\bar{y} = a\bar{x} + b.

  38. Ex. 71.38Challenge

    Erfüllt der Mittelwert f(xi)=f(xˉ)\overline{f(x_i)} = f(\bar{x}) allgemein? Und der Mediana? Untersuche mit f(t)=t2f(t) = t^2 und den Daten x={1,2,3}x = \{1, 2, 3\}.

  39. Ex. 71.39Challenge

    Cauchy-Verteilung: f(x)=1/[π(1+x2)]f(x) = 1/[\pi(1+x^2)]. Berechne den Mediana. Zeige, dass der Mittelwert nicht existiert (das Integral +xf(x)dx\int_{-\infty}^{+\infty} x f(x)\,dx divergiert).

  40. Ex. 71.40Challenge

    Zeige, dass wenn wir den größten Wert eines Datensatzes durch einen noch größeren Wert ersetzen, der Mediana nicht ändert, aber der Mittelwert erhöht.

  41. Ex. 71.41ChallengeAnswer key

    Zwei Gruppen haben Mittelwerte xˉ1\bar{x}_1 und xˉ2\bar{x}_2 mit Größen n1n_1 und n2n_2. Leite die Formel des kombinierten Mittelwerts der zwei Gruppen her.

  42. Ex. 71.42ChallengeAnswer key

    Jensens Ungleichung besagt, dass für φ\varphi konvex, φ(E[X])E[φ(X)]\varphi(E[X]) \leq E[\varphi(X)]. Wende mit φ(t)=t2\varphi(t) = t^2 an um eine Ungleichung zwischen xˉ2\bar{x}^2 und x2\overline{x^2} zu erhalten. Was bedeutet das für die Varianz?

Quellen

  • OpenIntro Statistics (4. Aufl.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA 4.0 · §1.6 (grundlegende deskriptive Maße, Wahl der Maßnahme, Schiefe) und §2.1 (variationelle Charakterisierung, Robustheit). Primärquelle dieser Lektion.
  • Introductory Statistics 2e (OpenStax) — Illowsky, Dean et al. · CC-BY 4.0 · §2.5 (Berechnung des Mittelwerts für gruppierte Daten, umfangreiche Beispiele mit Häufigkeitstabellen).
  • Estatística (Wikilivros) — gemeinschaftlich · CC-BY-SA 4.0 · Abschnitte: Mittelwert, Mediana, Modus, Maße der zentralen Tendenz (Referenz auf PT-BR; Czuber-Formel für Modus bei gruppierten Daten).
  • Nobelpreis für Wirtschaft 2000 — Heckman und McFadden — mikroökonometrische Methoden basierend auf robuster Schätzung der zentralen Lage.

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.