Math ClubMath Club
v1 · padrão canônico

Lição 71 — Medidas de tendência central: média, mediana, moda

Resumir um conjunto de dados com um único número: média, mediana, moda. Quando usar cada uma e o que a escolha revela sobre a distribuição.

Used in: 2.º ano do EM (16-17 anos) · Stochastik LK alemão · H2 Math Statistics singapurense · Math B japonês

xˉ=1ni=1nxi\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i
Choose your door

Rigorous notation, full derivation, hypotheses

Définitions et propriétés

Statistique descriptive : le problème du résumé

Soit un ensemble de nn observations x1,x2,,xnx_1, x_2, \ldots, x_n. Nous cherchons un seul nombre qui représente le "centre" de la distribution. Il n'y a pas de réponse unique — il y a trois questions différentes, trois réponses différentes.

"La moyenne d'échantillon peut être calculée pour toute variable quantitative. Pour une distribution discrète, la moyenne est la somme de chaque valeur multipliée par sa probabilité ; pour une distribution continue, l'intégrale correspondante." — OpenIntro Statistics, §1.6

Propriétés algébriques de la moyenne

"La moyenne minimise la somme des carrés des écarts (erreur L2L^2). La médiane minimise la somme des valeurs absolues des écarts (erreur L1L^1). Cette distinction a des conséquences profondes en régression et apprentissage automatique." — OpenIntro Statistics, §2.1

Relation entre les trois mesures et asymétrie

Symétrique unimodaleMode=Méd=MoyAsymétrie à droiteModeMédMoyAsymétrie à gaucheModeMédMoy

Relation entre mode, médiane et moyenne selon l'asymétrie de la distribution. Dans l'asymétrie à droite (queue longue positive) : mode inférieure à médiane inférieure à moyenne.

Forme de la distributionRelation
Symétrique unimodaleMode == Médiane == Moyenne
Asymétrie à droite (queue positive)Mode << Médiane << Moyenne
Asymétrie à gauche (queue négative)Moyenne << Médiane << Mode

Exemplos resolvidos

Exercise list

42 exercises · 10 with worked solution (25%)

Application 12Understanding 10Modeling 11Challenge 5Proof 4
  1. Ex. 71.1Application

    Données : 5, 6, 7, 7, 7, 8, 9. Calculez la moyenne, la médiane et la mode.

  2. Ex. 71.2Application

    Notes de 8 élèves : 4, 5, 6, 6, 7, 8, 9, 10. Calculez la moyenne, la médiane et la mode.

  3. Ex. 71.3Application

    Salaires mensuels (mille reais) : 2, 2, 3, 4, 5, 50. Comparez moyenne et médiane. Laquelle représente mieux le salaire typique ?

  4. Ex. 71.4Application

    Âges de 7 participants : 18, 19, 20, 21, 22, 23, 24. Calculez la moyenne, médiane et mode.

  5. Ex. 71.5ApplicationAnswer key

    Temps de chargement (s) : 0,5 ; 0,7 ; 0,8 ; 0,9 ; 1,1 ; 1,5 ; 7,0. Calculez la moyenne et la médiane. La médiane est-elle plus informative que la moyenne dans ce cas ?

  6. Ex. 71.6Application

    Couleurs de voitures dans un parking : 12 blanches, 8 noires, 5 grises, 5 rouges. Quelle mesure de tendance centrale est appropriée ?

  7. Ex. 71.7ApplicationAnswer key

    Données : 1, 1, 2, 3, 5, 5, 7. Déterminez la (les) mode(s). Comment se classe cette distribution ?

  8. Ex. 71.8Application

    Tableau de fréquences : xx = 4, 5, 6, 7, 8 avec fréquences ff = 2, 3, 5, 3, 2. Calculez la moyenne arithmétique.

  9. Ex. 71.9Application

    Données groupées : intervalles [0,10)[0,10), [10,20)[10,20), [20,30)[20,30) avec fréquences 5, 12, 3. Calculez la moyenne en utilisant les points médians.

  10. Ex. 71.10Application

    Une classe a un âge moyen xˉ=17,5\bar{x} = 17{,}5 ans. Un nouvel élève de 20 ans entre et la nouvelle moyenne passe à 17,7517{,}75 ans. Combien d'élèves y avait-il originalement ?

  11. Ex. 71.11ApplicationAnswer key

    Calculez moyenne, médiane et mode pour : 3, 3, 4, 5, 6, 6, 6, 9.

  12. Ex. 71.12ApplicationAnswer key

    Calculez moyenne, médiane et mode(s) pour : 10, 10, 11, 12, 13, 14, 14, 15, 19.

  13. Ex. 71.13UnderstandingAnswer key

    Pourquoi l'IBGE préfère-t-il utiliser la médiane (et non la moyenne) pour décrire le revenu par habitant du Brésil ?

  14. Ex. 71.14Understanding

    Temps d'attente aux urgences : la plupart sont vus en 1 à 2 heures, mais certains cas graves attendent plus de 10 heures. Quelle mesure utiliser pour décrire le temps d'attente typique ? Justifiez.

  15. Ex. 71.15Understanding

    Un fabricant veut déclarer la durée de vie typique de ses ampoules LED. Suggérez quelle mesure de tendance centrale utiliser et justifiez.

  16. Ex. 71.16Understanding

    Un sondage électoral demande à 1 000 électeurs quel parti ils ont l'intention de voter. Quelle mesure de tendance centrale identifiera le parti préféré ?

  17. Ex. 71.17Understanding

    Pour une distribution unimodale avec asymétrie à droite (queue longue positive), quel est l'ordre typique entre mode, médiane et moyenne ? Expliquez intuitivement.

  18. Ex. 71.18UnderstandingAnswer key

    Distribution uniforme sur [0,10][0, 10]. Déterminez la moyenne, la médiane et discutez la mode. Que cela dit-il sur les distributions symétriques ?

  19. Ex. 71.19Understanding

    Les notes d'ENEM ont une distribution proche de la normale. Moyenne ou médiane est plus appropriée pour décrire le désempen typique ? Justifiez.

  20. Ex. 71.20Understanding

    Un investisseur veut savoir le nombre de chambres le plus courant dans les appartements d'un quartier. Quelle mesure utiliser ?

  21. Ex. 71.21UnderstandingAnswer key

    Temps de chargement de page : 95 % des requêtes répondent en moins de 300 ms, mais 1 % prend plus de 5 s. Pourquoi les ingénieurs de fiabilité préfèrent-ils la médiane (P50) et les percentiles (P95, P99) à la moyenne ?

  22. Ex. 71.22Understanding

    Pourquoi pour une distribution continue symétrique unimodale, les trois mesures de tendance centrale sont-elles égales ? Expliquez géométriquement.

  23. Ex. 71.23Modeling

    Test A/B : le temps de paiement du site A a moyenne 12 s et médiane 9 s. Le site B a moyenne 10 s et médiane 10 s. Quel site a la meilleure expérience pour l'utilisateur typique ? Justifiez.

  24. Ex. 71.24Modeling

    L'entreprise A rapporte seulement un salaire moyen de 10 mille reais. L'entreprise B rapporte une moyenne de 8 mille et une médiane de 7 mille reais. Qu'est-ce que l'absence de médiane en A peut cacher ?

  25. Ex. 71.25Modeling

    En K-means, le centroïde d'un cluster est la moyenne. Quel est l'effet d'une valeur aberrante sur le centroïde ? Comment K-medoids (qui utilise le point médian) atténue ce problème ?

  26. Ex. 71.26Modeling

    Contrôle de qualité : pièces avec diamètre moyen dˉ=10,05\bar{d} = 10{,}05 mm et distribution approximativement symétrique. À quelle valeur attendriez-vous que la médiane soit proche ? Pourquoi ?

  27. Ex. 71.27Modeling

    En apprentissage automatique, MSE comme fonction de perte implique que le modèle apprenne à estimer la moyenne conditionnelle. MAE implique que le modèle estime la médiane conditionnelle. Expliquez pourquoi cela découle de la caractérisation variationnelle des mesures centrales.

  28. Ex. 71.28Modeling

    Une méta-analyse avec 50 études rapporte la médiane de la taille d'effet au lieu de la moyenne. Pourquoi la médiane est-elle préférée en méta-analyse ?

  29. Ex. 71.29Modeling

    Pourquoi le diagramme à boîtes utilise-t-il la médiane comme ligne centrale (et l'IQR comme largeur de la boîte) au lieu d'utiliser la moyenne et l'écart-type ?

  30. Ex. 71.30Modeling

    En apprentissage fédéré, pourquoi remplacer la moyenne des gradients par la médiane augmente la résistance aux clients malveillants (attaques Byzantine) ?

  31. Ex. 71.31Modeling

    Pour la distribution log-normale (lnXN(μ,σ2)\ln X \sim N(\mu, \sigma^2)) : mode =eμσ2= e^{\mu-\sigma^2}, médiane =eμ= e^\mu, moyenne =eμ+σ2/2= e^{\mu+\sigma^2/2}. Vérifiez l'ordonnancement mode inférieure à médiane inférieure à moyenne pour σ>0\sigma > 0.

  32. Ex. 71.32ModelingAnswer key

    Salaires (mille reais) : 4, 4, 5, 5, 6, 7, 7, 8 (8 employés). Un PDG avec salaire de 60 mille reais est ajouté (sans en supprimer aucun). Calculez la moyenne et la médiane avant et après. Quelle mesure a changé plus ?

  33. Ex. 71.33Modeling

    Notes de 30 élèves à un examen, groupées : [60,70)[60,70) : 3 élèves ; [70,80)[70,80) : 8 élèves ; [80,90)[80,90) : 12 élèves ; [90,100][90,100] : 7 élèves. Calculez la moyenne estimée par les points médians.

  34. Ex. 71.34Proof

    Montrez que i=1n(xixˉ)=0\sum_{i=1}^{n}(x_i - \bar{x}) = 0.

  35. Ex. 71.35Proof

    Montrez que i=1n(xic)2\sum_{i=1}^{n}(x_i - c)^2 est minimisé en c=xˉc = \bar{x} pour toute séquence x1,,xnRx_1, \ldots, x_n \in \mathbb{R}.

  36. Ex. 71.36Proof

    Montrez que i=1nxic\sum_{i=1}^{n}|x_i - c| est minimisé en c=meˊdianec = \text{médiane}. (Suggestion : analysez ce qui se passe en déplaçant cc d'un côté ou de l'autre de la médiane, en comptant combien de xix_i se situent au-dessus et au-dessous.)

  37. Ex. 71.37Proof

    Montrez que si yi=axi+by_i = ax_i + b (transformation linéaire), alors yˉ=axˉ+b\bar{y} = a\bar{x} + b.

  38. Ex. 71.38Challenge

    La moyenne satisfait f(xi)=f(xˉ)\overline{f(x_i)} = f(\bar{x}) en général ? Et la médiane ? Investiguez avec f(t)=t2f(t) = t^2 et les données x={1,2,3}x = \{1, 2, 3\}.

  39. Ex. 71.39Challenge

    Distribution de Cauchy : f(x)=1/[π(1+x2)]f(x) = 1/[\pi(1+x^2)]. Calculez la médiane. Montrez que la moyenne n'existe pas (l'intégrale +xf(x)dx\int_{-\infty}^{+\infty} x f(x)\,dx diverge).

  40. Ex. 71.40Challenge

    Montrez que si nous remplaçons la plus grande valeur d'un ensemble de données par une valeur encore plus grande, la médiane ne change pas, mais la moyenne augmente.

  41. Ex. 71.41ChallengeAnswer key

    Deux groupes ont des moyennes xˉ1\bar{x}_1 et xˉ2\bar{x}_2 avec tailles n1n_1 et n2n_2. Dérivez la formule de la moyenne combinée des deux groupes.

  42. Ex. 71.42ChallengeAnswer key

    L'inégalité de Jensen affirme que pour φ\varphi convexe, φ(E[X])E[φ(X)]\varphi(E[X]) \leq E[\varphi(X)]. Appliquez avec φ(t)=t2\varphi(t) = t^2 pour obtenir une inégalité entre xˉ2\bar{x}^2 et x2\overline{x^2}. Que cela implique-t-il sur la variance ?

Fontes

  • OpenIntro Statistics (4ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA 4.0 · §1.6 (medidas descritivas básicas, escolha de medida, skewness) e §2.1 (caracterização variacional, robustez). Fonte primária desta lição.
  • Introductory Statistics 2e (OpenStax) — Illowsky, Dean et al. · CC-BY 4.0 · §2.5 (cálculo de média para dados agrupados, exemplos extensos com tabelas de frequência).
  • Estatística (Wikilivros) — colaborativo · CC-BY-SA 4.0 · Seções: Média, Mediana, Moda, Medidas de tendência central (referência em PT-BR; fórmula de Czuber para moda em dados agrupados).
  • Prêmio Nobel de Economia 2000 — Heckman e McFadden — métodos microeconométricos baseados em estimação robusta de locação central.

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.