Lição 71 — Medidas de tendência central: média, mediana, moda
Resumir um conjunto de dados com um único número: média, mediana, moda. Quando usar cada uma e o que a escolha revela sobre a distribuição.
Used in: 2.º ano do EM (16-17 anos) · Stochastik LK alemão · H2 Math Statistics singapurense · Math B japonês
Rigorous notation, full derivation, hypotheses
Definições e propriedades
Estatística descritiva: o problema de resumo
Dado um conjunto de observações , queremos um único número que represente o "centro" da distribuição. Não há resposta única — há três perguntas diferentes, três respostas diferentes.
"A média amostral pode ser calculada para qualquer variável quantitativa. Para uma distribuição discreta, a média é a soma de cada valor multiplicado por sua probabilidade; para uma distribuição contínua, a integral correspondente." — OpenIntro Statistics, §1.6
Propriedades algébricas da média
"A media minimiza a soma dos quadrados dos desvios (erro ). A mediana minimiza a soma dos valores absolutos dos desvios (erro ). Esta distinção tem consequências profundas em regressão e aprendizado de máquina." — OpenIntro Statistics, §2.1
Relação entre as três medidas e assimetria
Relação entre moda, mediana e média segundo a assimetria da distribuição. Na assimetria à direita (cauda longa positiva): moda menor que mediana menor que média.
| Forma da distribuição | Relação |
|---|---|
| Simétrica unimodal | Moda Mediana Média |
| Assimetria à direita (cauda positiva) | Moda Mediana Média |
| Assimetria à esquerda (cauda negativa) | Média Mediana Moda |
Exemplos resolvidos
Exercise list
42 exercises · 10 with worked solution (25%)
- Ex. 71.1Application
Dados: 5, 6, 7, 7, 7, 8, 9. Calcule a média, a mediana e a moda.
- Ex. 71.2Application
Notas de 8 alunos: 4, 5, 6, 6, 7, 8, 9, 10. Calcule a média, a mediana e a moda.
- Ex. 71.3Application
Salários mensais (R$ mil): 2, 2, 3, 4, 5, 50. Compare média e mediana. Qual representa melhor o salário típico?
- Ex. 71.4Application
Idades de 7 participantes: 18, 19, 20, 21, 22, 23, 24. Calcule a média, mediana e moda.
- Ex. 71.5ApplicationAnswer key
Tempos de carregamento (s): 0,5; 0,7; 0,8; 0,9; 1,1; 1,5; 7,0. Calcule a média e a mediana. A mediana é mais informativa que a média neste caso?
- Ex. 71.6Application
Cores de carros num estacionamento: 12 brancos, 8 pretos, 5 cinzas, 5 vermelhos. Qual medida de tendência central é apropriada?
- Ex. 71.7ApplicationAnswer key
Dados: 1, 1, 2, 3, 5, 5, 7. Determine a(s) moda(s). Como se classifica esta distribuição?
- Ex. 71.8Application
Tabela de frequências: = 4, 5, 6, 7, 8 com frequências = 2, 3, 5, 3, 2. Calcule a média aritmética.
- Ex. 71.9Application
Dados agrupados: intervalos , , com frequências 5, 12, 3. Calcule a média usando pontos médios.
- Ex. 71.10Application
Uma turma tem média de idade anos. Um novo aluno de 20 anos entra e a nova média passa a anos. Quantos alunos havia originalmente?
- Ex. 71.11ApplicationAnswer key
Calcule média, mediana e moda para: 3, 3, 4, 5, 6, 6, 6, 9.
- Ex. 71.12ApplicationAnswer key
Calcule média, mediana e moda(s) para: 10, 10, 11, 12, 13, 14, 14, 15, 19.
- Ex. 71.13UnderstandingAnswer key
Por que o IBGE prefere usar a mediana (e não a média) para descrever a renda domiciliar per capita do Brasil?
- Ex. 71.14Understanding
Tempo de espera num pronto-socorro: a maioria é atendida em 1 a 2 horas, mas alguns casos graves esperam mais de 10 horas. Qual medida usar para descrever o tempo de espera típico? Justifique.
- Ex. 71.15Understanding
Um fabricante quer declarar a vida útil típica de suas lâmpadas LED. Sugira qual medida de tendência central usar e justifique.
- Ex. 71.16Understanding
Uma pesquisa eleitoral pergunta a 1.000 eleitores qual partido pretendem votar. Qual medida de tendência central identificará o partido preferido?
- Ex. 71.17Understanding
Para uma distribuição unimodal com assimetria à direita (cauda longa positiva), qual é a ordem típica entre moda, mediana e média? Explique intuitivamente.
- Ex. 71.18UnderstandingAnswer key
Distribuição uniforme em . Determine a média, a mediana e discuta a moda. O que isso diz sobre distribuições simétricas?
- Ex. 71.19Understanding
As notas do ENEM têm distribuição próxima do normal. Média ou mediana é mais adequada para descrever o desempenho típico? Justifique.
- Ex. 71.20Understanding
Um investidor quer saber o número de quartos mais comum nos apartamentos de um bairro. Qual medida usar?
- Ex. 71.21UnderstandingAnswer key
Tempo de carregamento de página: 95% das requisições respondem em menos de 300 ms, mas 1% demora mais de 5 s. Por que engenheiros de confiabilidade preferem mediana (P50) e percentis (P95, P99) em vez da média?
- Ex. 71.22Understanding
Por que para uma distribuição contínua simétrica unimodal, as três medidas de tendência central são iguais? Explique geometricamente.
- Ex. 71.23Modeling
A/B testing: tempo de checkout do site A tem média 12 s e mediana 9 s. Site B tem média 10 s e mediana 10 s. Qual site tem melhor experiência para o usuário típico? Justifique.
- Ex. 71.24Modeling
Empresa A reporta apenas salário médio de R$ 10 mil. Empresa B reporta média de R$ 8 mil e mediana de R$ 7 mil. O que a ausência da mediana em A pode estar escondendo?
- Ex. 71.25Modeling
Em K-means, o centroide de um cluster é a média. Qual o efeito de um outlier sobre o centroide? Como K-medoids (que usa o ponto mediano) mitiga este problema?
- Ex. 71.26Modeling
Controle de qualidade: peças com diâmetro médio mm e distribuição aproximadamente simétrica. A que valor você esperaria que a mediana seja próxima? Por quê?
- Ex. 71.27Modeling
Em aprendizado de máquina, MSE como função de perda implica que o modelo aprende a estimar a média condicional. MAE implica que o modelo estima a mediana condicional. Explique por que isso decorre da caracterização variacional das medidas centrais.
- Ex. 71.28Modeling
Uma meta-análise com 50 estudos reporta a mediana do tamanho de efeito em vez da média. Por que a mediana é preferida em meta-análise?
- Ex. 71.29Modeling
Por que o boxplot usa a mediana como linha central (e o IQR como largura da caixa) em vez de usar média e desvio padrão?
- Ex. 71.30Modeling
Em federated learning, por que substituir a média dos gradientes pela mediana aumenta a resistência a clientes maliciosos (ataques Byzantine)?
- Ex. 71.31Modeling
Para a distribuição log-normal (): moda , mediana , média . Verifique a ordenação moda menor que mediana menor que média para .
- Ex. 71.32ModelingAnswer key
Salários (R$ mil): 4, 4, 5, 5, 6, 7, 7, 8 (8 funcionários). Um CEO com salário de R$ 60 mil é adicionado (sem remover nenhum). Calcule a média e mediana antes e depois. Qual medida mudou mais?
- Ex. 71.33Modeling
Notas de 30 alunos numa prova, agrupadas: : 3 alunos; : 8 alunos; : 12 alunos; : 7 alunos. Calcule a média estimada pelos pontos médios.
- Ex. 71.34Proof
Mostre que .
- Ex. 71.35Proof
Mostre que é minimizado em para qualquer sequência .
- Ex. 71.36Proof
Mostre que é minimizado em . (Sugestão: analise o que acontece ao deslocar para um lado ou outro da mediana, contando quantos ficam acima e abaixo.)
- Ex. 71.37Proof
Mostre que se (transformação linear), então .
- Ex. 71.38Challenge
A média satisfaz em geral? E a mediana? Investigue com e os dados .
- Ex. 71.39Challenge
Distribuição de Cauchy: . Calcule a mediana. Mostre que a média não existe (a integral diverge).
- Ex. 71.40Challenge
Mostre que se trocarmos o maior valor de um conjunto de dados por um valor ainda maior, a mediana não muda, mas a média aumenta.
- Ex. 71.41ChallengeAnswer key
Dois grupos têm médias e com tamanhos e . Derive a fórmula da média combinada dos dois grupos.
- Ex. 71.42ChallengeAnswer key
A desigualdade de Jensen afirma que para convexa, . Aplique com para obter uma desigualdade entre e . O que isso implica sobre a variância?
Fontes
- OpenIntro Statistics (4ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA 4.0 · §1.6 (medidas descritivas básicas, escolha de medida, skewness) e §2.1 (caracterização variacional, robustez). Fonte primária desta lição.
- Introductory Statistics 2e (OpenStax) — Illowsky, Dean et al. · CC-BY 4.0 · §2.5 (cálculo de média para dados agrupados, exemplos extensos com tabelas de frequência).
- Estatística (Wikilivros) — colaborativo · CC-BY-SA 4.0 · Seções: Média, Mediana, Moda, Medidas de tendência central (referência em PT-BR; fórmula de Czuber para moda em dados agrupados).
- Prêmio Nobel de Economia 2000 — Heckman e McFadden — métodos microeconométricos baseados em estimação robusta de locação central.