Lição 71 — Medidas de tendência central: média, mediana, moda
Resumir um conjunto de dados com um único número: média, mediana, moda. Quando usar cada uma e o que a escolha revela sobre a distribuição.
Used in: 2.º ano do EM (16-17 anos) · Stochastik LK alemão · H2 Math Statistics singapurense · Math B japonês
Rigorous notation, full derivation, hypotheses
Définitions et propriétés
Statistique descriptive : le problème du résumé
Soit un ensemble de observations . Nous cherchons un seul nombre qui représente le "centre" de la distribution. Il n'y a pas de réponse unique — il y a trois questions différentes, trois réponses différentes.
"La moyenne d'échantillon peut être calculée pour toute variable quantitative. Pour une distribution discrète, la moyenne est la somme de chaque valeur multipliée par sa probabilité ; pour une distribution continue, l'intégrale correspondante." — OpenIntro Statistics, §1.6
Propriétés algébriques de la moyenne
"La moyenne minimise la somme des carrés des écarts (erreur ). La médiane minimise la somme des valeurs absolues des écarts (erreur ). Cette distinction a des conséquences profondes en régression et apprentissage automatique." — OpenIntro Statistics, §2.1
Relation entre les trois mesures et asymétrie
Relation entre mode, médiane et moyenne selon l'asymétrie de la distribution. Dans l'asymétrie à droite (queue longue positive) : mode inférieure à médiane inférieure à moyenne.
| Forme de la distribution | Relation |
|---|---|
| Symétrique unimodale | Mode Médiane Moyenne |
| Asymétrie à droite (queue positive) | Mode Médiane Moyenne |
| Asymétrie à gauche (queue négative) | Moyenne Médiane Mode |
Exemplos resolvidos
Exercise list
42 exercises · 10 with worked solution (25%)
- Ex. 71.1Application
Données : 5, 6, 7, 7, 7, 8, 9. Calculez la moyenne, la médiane et la mode.
- Ex. 71.2Application
Notes de 8 élèves : 4, 5, 6, 6, 7, 8, 9, 10. Calculez la moyenne, la médiane et la mode.
- Ex. 71.3Application
Salaires mensuels (mille reais) : 2, 2, 3, 4, 5, 50. Comparez moyenne et médiane. Laquelle représente mieux le salaire typique ?
- Ex. 71.4Application
Âges de 7 participants : 18, 19, 20, 21, 22, 23, 24. Calculez la moyenne, médiane et mode.
- Ex. 71.5ApplicationAnswer key
Temps de chargement (s) : 0,5 ; 0,7 ; 0,8 ; 0,9 ; 1,1 ; 1,5 ; 7,0. Calculez la moyenne et la médiane. La médiane est-elle plus informative que la moyenne dans ce cas ?
- Ex. 71.6Application
Couleurs de voitures dans un parking : 12 blanches, 8 noires, 5 grises, 5 rouges. Quelle mesure de tendance centrale est appropriée ?
- Ex. 71.7ApplicationAnswer key
Données : 1, 1, 2, 3, 5, 5, 7. Déterminez la (les) mode(s). Comment se classe cette distribution ?
- Ex. 71.8Application
Tableau de fréquences : = 4, 5, 6, 7, 8 avec fréquences = 2, 3, 5, 3, 2. Calculez la moyenne arithmétique.
- Ex. 71.9Application
Données groupées : intervalles , , avec fréquences 5, 12, 3. Calculez la moyenne en utilisant les points médians.
- Ex. 71.10Application
Une classe a un âge moyen ans. Un nouvel élève de 20 ans entre et la nouvelle moyenne passe à ans. Combien d'élèves y avait-il originalement ?
- Ex. 71.11ApplicationAnswer key
Calculez moyenne, médiane et mode pour : 3, 3, 4, 5, 6, 6, 6, 9.
- Ex. 71.12ApplicationAnswer key
Calculez moyenne, médiane et mode(s) pour : 10, 10, 11, 12, 13, 14, 14, 15, 19.
- Ex. 71.13UnderstandingAnswer key
Pourquoi l'IBGE préfère-t-il utiliser la médiane (et non la moyenne) pour décrire le revenu par habitant du Brésil ?
- Ex. 71.14Understanding
Temps d'attente aux urgences : la plupart sont vus en 1 à 2 heures, mais certains cas graves attendent plus de 10 heures. Quelle mesure utiliser pour décrire le temps d'attente typique ? Justifiez.
- Ex. 71.15Understanding
Un fabricant veut déclarer la durée de vie typique de ses ampoules LED. Suggérez quelle mesure de tendance centrale utiliser et justifiez.
- Ex. 71.16Understanding
Un sondage électoral demande à 1 000 électeurs quel parti ils ont l'intention de voter. Quelle mesure de tendance centrale identifiera le parti préféré ?
- Ex. 71.17Understanding
Pour une distribution unimodale avec asymétrie à droite (queue longue positive), quel est l'ordre typique entre mode, médiane et moyenne ? Expliquez intuitivement.
- Ex. 71.18UnderstandingAnswer key
Distribution uniforme sur . Déterminez la moyenne, la médiane et discutez la mode. Que cela dit-il sur les distributions symétriques ?
- Ex. 71.19Understanding
Les notes d'ENEM ont une distribution proche de la normale. Moyenne ou médiane est plus appropriée pour décrire le désempen typique ? Justifiez.
- Ex. 71.20Understanding
Un investisseur veut savoir le nombre de chambres le plus courant dans les appartements d'un quartier. Quelle mesure utiliser ?
- Ex. 71.21UnderstandingAnswer key
Temps de chargement de page : 95 % des requêtes répondent en moins de 300 ms, mais 1 % prend plus de 5 s. Pourquoi les ingénieurs de fiabilité préfèrent-ils la médiane (P50) et les percentiles (P95, P99) à la moyenne ?
- Ex. 71.22Understanding
Pourquoi pour une distribution continue symétrique unimodale, les trois mesures de tendance centrale sont-elles égales ? Expliquez géométriquement.
- Ex. 71.23Modeling
Test A/B : le temps de paiement du site A a moyenne 12 s et médiane 9 s. Le site B a moyenne 10 s et médiane 10 s. Quel site a la meilleure expérience pour l'utilisateur typique ? Justifiez.
- Ex. 71.24Modeling
L'entreprise A rapporte seulement un salaire moyen de 10 mille reais. L'entreprise B rapporte une moyenne de 8 mille et une médiane de 7 mille reais. Qu'est-ce que l'absence de médiane en A peut cacher ?
- Ex. 71.25Modeling
En K-means, le centroïde d'un cluster est la moyenne. Quel est l'effet d'une valeur aberrante sur le centroïde ? Comment K-medoids (qui utilise le point médian) atténue ce problème ?
- Ex. 71.26Modeling
Contrôle de qualité : pièces avec diamètre moyen mm et distribution approximativement symétrique. À quelle valeur attendriez-vous que la médiane soit proche ? Pourquoi ?
- Ex. 71.27Modeling
En apprentissage automatique, MSE comme fonction de perte implique que le modèle apprenne à estimer la moyenne conditionnelle. MAE implique que le modèle estime la médiane conditionnelle. Expliquez pourquoi cela découle de la caractérisation variationnelle des mesures centrales.
- Ex. 71.28Modeling
Une méta-analyse avec 50 études rapporte la médiane de la taille d'effet au lieu de la moyenne. Pourquoi la médiane est-elle préférée en méta-analyse ?
- Ex. 71.29Modeling
Pourquoi le diagramme à boîtes utilise-t-il la médiane comme ligne centrale (et l'IQR comme largeur de la boîte) au lieu d'utiliser la moyenne et l'écart-type ?
- Ex. 71.30Modeling
En apprentissage fédéré, pourquoi remplacer la moyenne des gradients par la médiane augmente la résistance aux clients malveillants (attaques Byzantine) ?
- Ex. 71.31Modeling
Pour la distribution log-normale () : mode , médiane , moyenne . Vérifiez l'ordonnancement mode inférieure à médiane inférieure à moyenne pour .
- Ex. 71.32ModelingAnswer key
Salaires (mille reais) : 4, 4, 5, 5, 6, 7, 7, 8 (8 employés). Un PDG avec salaire de 60 mille reais est ajouté (sans en supprimer aucun). Calculez la moyenne et la médiane avant et après. Quelle mesure a changé plus ?
- Ex. 71.33Modeling
Notes de 30 élèves à un examen, groupées : : 3 élèves ; : 8 élèves ; : 12 élèves ; : 7 élèves. Calculez la moyenne estimée par les points médians.
- Ex. 71.34Proof
Montrez que .
- Ex. 71.35Proof
Montrez que est minimisé en pour toute séquence .
- Ex. 71.36Proof
Montrez que est minimisé en . (Suggestion : analysez ce qui se passe en déplaçant d'un côté ou de l'autre de la médiane, en comptant combien de se situent au-dessus et au-dessous.)
- Ex. 71.37Proof
Montrez que si (transformation linéaire), alors .
- Ex. 71.38Challenge
La moyenne satisfait en général ? Et la médiane ? Investiguez avec et les données .
- Ex. 71.39Challenge
Distribution de Cauchy : . Calculez la médiane. Montrez que la moyenne n'existe pas (l'intégrale diverge).
- Ex. 71.40Challenge
Montrez que si nous remplaçons la plus grande valeur d'un ensemble de données par une valeur encore plus grande, la médiane ne change pas, mais la moyenne augmente.
- Ex. 71.41ChallengeAnswer key
Deux groupes ont des moyennes et avec tailles et . Dérivez la formule de la moyenne combinée des deux groupes.
- Ex. 71.42ChallengeAnswer key
L'inégalité de Jensen affirme que pour convexe, . Appliquez avec pour obtenir une inégalité entre et . Que cela implique-t-il sur la variance ?
Fontes
- OpenIntro Statistics (4ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA 4.0 · §1.6 (medidas descritivas básicas, escolha de medida, skewness) e §2.1 (caracterização variacional, robustez). Fonte primária desta lição.
- Introductory Statistics 2e (OpenStax) — Illowsky, Dean et al. · CC-BY 4.0 · §2.5 (cálculo de média para dados agrupados, exemplos extensos com tabelas de frequência).
- Estatística (Wikilivros) — colaborativo · CC-BY-SA 4.0 · Seções: Média, Mediana, Moda, Medidas de tendência central (referência em PT-BR; fórmula de Czuber para moda em dados agrupados).
- Prêmio Nobel de Economia 2000 — Heckman e McFadden — métodos microeconométricos baseados em estimação robusta de locação central.