Math ClubMath Club
v1 · padrão canônico

Lição 71 — Medidas de tendência central: média, mediana, moda

Resumir um conjunto de dados com um único número: média, mediana, moda. Quando usar cada uma e o que a escolha revela sobre a distribuição.

Used in: 2.º ano do EM (16-17 anos) · Stochastik LK alemão · H2 Math Statistics singapurense · Math B japonês

xˉ=1ni=1nxi\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i

A média aritmética de nn valores: soma todos e divide por nn. Ao lado dela vivem a mediana (o valor do meio quando os dados estão ordenados) e a moda (o valor mais frequente). As três são medidas de tendência central — cada uma responde a uma pergunta diferente sobre onde os dados se concentram.

Choose your door

Rigorous notation, full derivation, hypotheses

Definições e propriedades

Estatística descritiva: o problema de resumo

Dado um conjunto de nn observações x1,x2,,xnx_1, x_2, \ldots, x_n, queremos um único número que represente o "centro" da distribuição. Não há resposta única — há três perguntas diferentes, três respostas diferentes.

"A média amostral pode ser calculada para qualquer variável quantitativa. Para uma distribuição discreta, a média é a soma de cada valor multiplicado por sua probabilidade; para uma distribuição contínua, a integral correspondente." — OpenIntro Statistics, §1.6

Propriedades algébricas da média

"A media minimiza a soma dos quadrados dos desvios (erro L2L^2). A mediana minimiza a soma dos valores absolutos dos desvios (erro L1L^1). Esta distinção tem consequências profundas em regressão e aprendizado de máquina." — OpenIntro Statistics, §2.1

Relação entre as três medidas e assimetria

Simétrica unimodalModa=Med=MédiaAssimetria à direitaModaMedMédiaAssimetria à esquerdaModaMedMédia

Relação entre moda, mediana e média segundo a assimetria da distribuição. Na assimetria à direita (cauda longa positiva): moda menor que mediana menor que média.

Forma da distribuiçãoRelação
Simétrica unimodalModa == Mediana == Média
Assimetria à direita (cauda positiva)Moda << Mediana << Média
Assimetria à esquerda (cauda negativa)Média << Mediana << Moda

Exemplos resolvidos

Exercise list

42 exercises · 10 with worked solution (25%)

Application 12Understanding 10Modeling 11Challenge 5Proof 4
  1. Ex. 71.1Application

    Dados: 5, 6, 7, 7, 7, 8, 9. Calcule a média, a mediana e a moda.

    Show solution
    Dados ordenados: 5, 6, 7, 7, 7, 8, 9. Soma = 49, n=7n = 7. Média = 49/7=749/7 = 7. Mediana: posição central = 4.º valor = 7. Moda: 7 (aparece 3 vezes). As três medidas coincidem em 7 — distribuição aproximadamente simétrica.
  2. Ex. 71.2Application

    Notas de 8 alunos: 4, 5, 6, 6, 7, 8, 9, 10. Calcule a média, a mediana e a moda.

    Show solution
    Dados ordenados: 4, 5, 6, 6, 7, 8, 9, 10. Soma = 55, n=8n = 8. Média = 55/8=6,87555/8 = 6{,}875. Mediana (nn par): média do 4.º e 5.º valores = (6+7)/2=6,5(6 + 7)/2 = 6{,}5. Moda = 6 (aparece 2 vezes).
    Show step-by-step (with the why)
    1. Ordene os dados: 4, 5, 6, 6, 7, 8, 9, 10. Confirme que são 8 valores.
    2. Média: some todos — 4+5+6+6+7+8+9+10=554+5+6+6+7+8+9+10 = 55 — e divida por 8: 55/8=6,87555/8 = 6{,}875.
    3. Mediana com n=8n = 8 par: posições centrais são a 4.ª e a 5.ª. Na lista ordenada: 4.ª = 6, 5.ª = 7. Mediana = (6+7)/2=6,5(6+7)/2 = 6{,}5.
    4. Moda: o 6 aparece 2 vezes, todos os outros 1 vez. Moda = 6.
    5. Macete: em nn par, a mediana cai no espaço entre dois valores e pode não ser um dado real — aqui 6,5 não está na lista original.
  3. Ex. 71.3Application

    Salários mensais (R$ mil): 2, 2, 3, 4, 5, 50. Compare média e mediana. Qual representa melhor o salário típico?

    Show solution
    Dados: 2, 2, 3, 4, 5, 50. Soma = 66, n=6n = 6. Média = 66/6=1166/6 = 11. Mediana: posições 3.ª e 4.ª = 3 e 4; mediana = (3+4)/2=3,5(3+4)/2 = 3{,}5. A média (11) está muito acima da mediana (3,5) porque o outlier 50 puxa a média. A mediana representa melhor o trabalhador típico.
  4. Ex. 71.4Application

    Idades de 7 participantes: 18, 19, 20, 21, 22, 23, 24. Calcule a média, mediana e moda.

    Show solution
    Idades: 18, 19, 20, 21, 22, 23, 24. Soma = 147, n=7n = 7. Média = 21. Mediana: 4.º valor na lista ordenada = 21. Moda: todos aparecem uma vez — distribuição amodal. Distribuição uniforme discreta: as três medidas centrais coincidem (exceto moda, indefinida).
  5. Ex. 71.5ApplicationAnswer key

    Tempos de carregamento (s): 0,5; 0,7; 0,8; 0,9; 1,1; 1,5; 7,0. Calcule a média e a mediana. A mediana é mais informativa que a média neste caso?

    Show solution
    Dados ordenados: 0,5; 0,7; 0,8; 0,9; 1,1; 1,5; 7,0. Média = (0,5+0,7+0,8+0,9+1,1+1,5+7,0)/7=12,5/71,79(0{,}5 + 0{,}7 + 0{,}8 + 0{,}9 + 1{,}1 + 1{,}5 + 7{,}0)/7 = 12{,}5/7 \approx 1{,}79 s. Mediana = 4.º valor = 0,9 s. Sim: a mediana (0,9 s) é mais informativa, pois 6 dos 7 tempos estão abaixo de 1,6 s. O valor 7,0 s é um outlier que distorce a média para 1,79 s — acima de todos os valores "normais".
  6. Ex. 71.6Application

    Cores de carros num estacionamento: 12 brancos, 8 pretos, 5 cinzas, 5 vermelhos. Qual medida de tendência central é apropriada?

    Select the correct option
    Select an option first
    Show solution
    Cor de carro é uma variável categórica nominal — as categorias (branco, preto, cinza, vermelho) não têm ordem nem valor numérico. Não é possível calcular média ou mediana de categorias. A única medida de tendência central aplicável é a moda: o valor mais frequente. Aqui, a moda é branco (12 carros).
  7. Ex. 71.7ApplicationAnswer key

    Dados: 1, 1, 2, 3, 5, 5, 7. Determine a(s) moda(s). Como se classifica esta distribuição?

    Show solution
    Dados: 1, 1, 2, 3, 5, 5, 7. Frequências: 1 aparece 2 vezes, 5 aparece 2 vezes, os demais 1 vez. Como dois valores têm frequência máxima igual, a distribuição é bimodal: modas = 1 e 5.
  8. Ex. 71.8Application

    Tabela de frequências: xx = 4, 5, 6, 7, 8 com frequências ff = 2, 3, 5, 3, 2. Calcule a média aritmética.

    Show solution
    Valores: xx = 4, 5, 6, 7, 8 com frequências ff = 2, 3, 5, 3, 2. Total N=2+3+5+3+2=15N = 2+3+5+3+2 = 15. Média ponderada: xˉ=(42+53+65+73+82)/15=(8+15+30+21+16)/15=90/15=6\bar{x} = (4 \cdot 2 + 5 \cdot 3 + 6 \cdot 5 + 7 \cdot 3 + 8 \cdot 2)/15 = (8+15+30+21+16)/15 = 90/15 = 6.
  9. Ex. 71.9Application

    Dados agrupados: intervalos [0,10)[0,10), [10,20)[10,20), [20,30)[20,30) com frequências 5, 12, 3. Calcule a média usando pontos médios.

    Show solution
    Intervalos: [0,10)[0,10) com f=5f=5, [10,20)[10,20) com f=12f=12, [20,30)[20,30) com f=3f=3. Pontos médios: 5, 15, 25. Total N=20N = 20. Média = (55+1215+325)/20=(25+180+75)/20=280/20=14(5 \cdot 5 + 12 \cdot 15 + 3 \cdot 25)/20 = (25+180+75)/20 = 280/20 = 14.
    Show step-by-step (with the why)
    1. Identifique o ponto médio de cada intervalo: metade de [0,10) é 5; de [10,20) é 15; de [20,30) é 25.
    2. Some as frequências para obter o total: N=5+12+3=20N = 5 + 12 + 3 = 20.
    3. Calcule fixi=55+1215+325=25+180+75=280\sum f_i x_i^* = 5 \cdot 5 + 12 \cdot 15 + 3 \cdot 25 = 25 + 180 + 75 = 280.
    4. Divida pelo total: xˉ=280/20=14\bar{x} = 280 / 20 = 14.
    5. Observação: o uso do ponto médio é uma aproximação — supõe que os dados se distribuem uniformemente dentro de cada intervalo. A média exata (com dados brutos) seria diferente.
  10. Ex. 71.10Application

    Uma turma tem média de idade xˉ=17,5\bar{x} = 17{,}5 anos. Um novo aluno de 20 anos entra e a nova média passa a 17,7517{,}75 anos. Quantos alunos havia originalmente?

    Show solution
    Seja nn o número original de alunos. A soma original era 17,5n17{,}5 n. Após adicionar um aluno com 20 anos: soma = 17,5n+2017{,}5n + 20, total = n+1n + 1, nova média = 17,75. Então: (17,5n+20)/(n+1)=17,75(17{,}5n + 20)/(n+1) = 17{,}75. Resolvendo: 17,5n+20=17,75n+17,7517{,}5n + 20 = 17{,}75n + 17{,}75, portanto 2,25=0,25n2{,}25 = 0{,}25n, logo n=9n = 9. Havia 9 alunos originalmente (10 após a adição).
  11. Ex. 71.11ApplicationAnswer key

    Calcule média, mediana e moda para: 3, 3, 4, 5, 6, 6, 6, 9.

    Show solution
    Média: soma dos valores e divide por nn. Mediana: ordena e pega o do meio. Moda: valor mais frequente. Para os dados 3, 3, 4, 5, 6, 6, 6, 9: soma = 42, n=8n = 8; média = 5,25. Mediana: (5+6)/2=5,5(5 + 6)/2 = 5{,}5. Moda = 6.
  12. Ex. 71.12ApplicationAnswer key

    Calcule média, mediana e moda(s) para: 10, 10, 11, 12, 13, 14, 14, 15, 19.

    Show solution
    Dados: 10, 10, 11, 12, 13, 14, 14, 15, 19. Soma = 118, n=9n = 9. Média = 118/913,1118/9 \approx 13{,}1. Mediana: 5.º valor = 13. Modas: 10 e 14 (ambos aparecem 2 vezes) — distribuição bimodal.
  13. Ex. 71.13UnderstandingAnswer key

    Por que o IBGE prefere usar a mediana (e não a média) para descrever a renda domiciliar per capita do Brasil?

    Select the correct option
    Select an option first
    Show solution
    A renda familiar no Brasil tem assimetria forte à direita: a maioria das famílias tem renda baixa, mas existe uma minoria com renda muito alta (centenas de vezes a mediana). Essa minoria puxa a média para cima, de modo que a média fica bem acima da experiência da família típica. O IBGE e todos os organismos internacionais usam a mediana para descrever renda.
  14. Ex. 71.14Understanding

    Tempo de espera num pronto-socorro: a maioria é atendida em 1 a 2 horas, mas alguns casos graves esperam mais de 10 horas. Qual medida usar para descrever o tempo de espera típico? Justifique.

    Show solution
    Tempo de espera tem cauda pesada à direita: a maioria dos atendimentos ocorre em menos de 2 horas, mas casos críticos podem esperar 8 a 12 horas, distorcendo a média. A mediana é mais adequada. Em gestão hospitalar, usa-se ainda o percentil 90 (P90) — 90% dos pacientes esperaram menos que X minutos — que é ainda mais informativo para avaliar o serviço nos dias ruins.
  15. Ex. 71.15Understanding

    Um fabricante quer declarar a vida útil típica de suas lâmpadas LED. Sugira qual medida de tendência central usar e justifique.

    Show solution
    Vida útil de equipamentos geralmente segue distribuição exponencial ou Weibull, com cauda à direita (alguns equipamentos duram muito mais que o típico). A mediana (ou o percentil 50) é mais adequada para especificação de garantia — metade das lâmpadas dura menos e metade mais do que o valor declarado. A média é puxada pelos equipamentos de vida muito longa. Fabricantes costumam declarar "vida útil de 10.000 horas" referindo-se a L50 (mediana).
  16. Ex. 71.16Understanding

    Uma pesquisa eleitoral pergunta a 1.000 eleitores qual partido pretendem votar. Qual medida de tendência central identificará o partido preferido?

    Select the correct option
    Select an option first
    Show solution
    Partido político é variável categórica nominal: não existe ordem entre PT, PL, MDB, etc. Não há sentido em calcular "média de partidos". A única medida de tendência central aplicável é a moda — o partido com maior número de intenções de voto (ou maior porcentagem). Em pesquisas eleitorais, fala-se em "candidato mais citado" ou "partido mais votado", que é exatamente a moda.
  17. Ex. 71.17Understanding

    Para uma distribuição unimodal com assimetria à direita (cauda longa positiva), qual é a ordem típica entre moda, mediana e média? Explique intuitivamente.

    Show solution
    Em distribuição assimétrica à direita (cauda positiva, ex.: renda, preço de imóveis, tempo de carregamento de páginas web), a ordenação é: moda menor que mediana menor que média. Intuição: a cauda positiva (valores muito altos) puxa a média para cima, deixando-a acima da mediana; a moda fica no pico da distribuição, que está à esquerda do centro. Esta é a "regra empírica" da assimetria — rigorosa para distribuições unimodais típicas, mas não um teorema geral.
  18. Ex. 71.18UnderstandingAnswer key

    Distribuição uniforme em [0,10][0, 10]. Determine a média, a mediana e discuta a moda. O que isso diz sobre distribuições simétricas?

    Show solution
    Distribuição uniforme em [0,10]: todos os valores são igualmente prováveis. Média = (0+10)/2=5(0 + 10)/2 = 5. Mediana = 5 (metade da área abaixo de 5). Moda: todos os valores têm mesma densidade — a distribuição é amodal (sem moda definida, ou qualquer valor é moda). Para distribuições contínuas uniformes, a moda não é bem definida. Uma distribuição simétrica unimodal teria as três medidas iguais; aqui a moda é um caso especial.
  19. Ex. 71.19Understanding

    As notas do ENEM têm distribuição próxima do normal. Média ou mediana é mais adequada para descrever o desempenho típico? Justifique.

    Show solution
    Notas de exame costumam ter distribuição próxima do normal (assimetria fraca). Quando a distribuição é aproximadamente simétrica e sem outliers extremos, a média é preferível — usa toda a informação e tem propriedades estatísticas superiores (menor variância do estimador). Se houver alunos com notas muito baixas por ausência ou falta de estudo (outliers inferiores), a mediana pode ser mais representativa. Na prática, relatórios oficiais do INEP (ENEM) reportam a média, enquanto comparações de desigualdade usam a mediana.
  20. Ex. 71.20Understanding

    Um investidor quer saber o número de quartos mais comum nos apartamentos de um bairro. Qual medida usar?

    Select the correct option
    Select an option first
    Show solution
    Número de quartos é uma variável discreta com poucos valores possíveis (1, 2, 3, 4). A moda identifica o tipo de apartamento mais comum — informação diretamente útil para um investidor imobiliário que quer saber qual produto tem maior demanda. A média poderia dar 2,3 quartos (sem correspondência real); a mediana pode coincidir com a moda, mas não transmite a noção de "mais comum".
  21. Ex. 71.21UnderstandingAnswer key

    Tempo de carregamento de página: 95% das requisições respondem em menos de 300 ms, mas 1% demora mais de 5 s. Por que engenheiros de confiabilidade preferem mediana (P50) e percentis (P95, P99) em vez da média?

    Show solution
    Tempo de carregamento de página tem cauda pesada à direita: a maioria das requisições é rápida (menores que 200 ms), mas uma pequena fração encontra lentidão extrema (2–10 s) por congestionamento de rede, CDN miss, etc. A média é distorcida por esses outliers. O padrão da indústria (SRE/DevOps) é reportar a mediana (P50) para o usuário típico e os percentis 95 e 99 (P95, P99) para garantir qualidade nos piores casos — esses valores definem os SLAs de serviços em nuvem.
  22. Ex. 71.22Understanding

    Por que para uma distribuição contínua simétrica unimodal, as três medidas de tendência central são iguais? Explique geometricamente.

    Show solution
    Para qualquer distribuição contínua unimodal simétrica ff, o eixo de simetria é simultaneamente: (a) o pico de ff (moda), (b) o ponto que divide a área ao meio (mediana), (c) o ponto que minimiza a soma dos quadrados dos desvios (média). Portanto moda = mediana = média = eixo de simetria. Exemplos: distribuição normal, uniforme, triangular simétrica.
  23. Ex. 71.23Modeling

    A/B testing: tempo de checkout do site A tem média 12 s e mediana 9 s. Site B tem média 10 s e mediana 10 s. Qual site tem melhor experiência para o usuário típico? Justifique.

    Show solution
    Site A: média 12 s, mediana 9 s — distribuição com cauda longa à direita; usuário típico espera 9 s. Site B: média 10 s, mediana 10 s — distribuição simétrica; usuário típico espera 10 s. Para usuários típicos, o Site A é melhor (mediana 9 s contra 10 s no Site B). A média do Site B é menor, mas isso pode refletir apenas menos variação, não melhor experiência mediana. Em A/B testing, a mediana de tempo é a métrica padrão de UX.
  24. Ex. 71.24Modeling

    Empresa A reporta apenas salário médio de R$ 10 mil. Empresa B reporta média de R$ 8 mil e mediana de R$ 7 mil. O que a ausência da mediana em A pode estar escondendo?

    Show solution
    Empresa A reporta apenas média de 10 mil reais: isso pode esconder grande assimetria salarial — o CEO pode ganhar 100 mil reais enquanto os demais ganham 5 mil, e a média seria aproximadamente 10 mil reais. A ausência da mediana é um sinal de alerta. Empresa B reporta média de 8 mil e mediana de 7 mil reais: a pequena diferença (1 mil reais) indica distribuição levemente assimétrica, mas com pouca concentração no topo — o trabalhador típico recebe próximo à mediana. Conclusão: reportar apenas a média sem a mediana pode ser enganoso quando há assimetria salarial.
  25. Ex. 71.25Modeling

    Em K-means, o centroide de um cluster é a média. Qual o efeito de um outlier sobre o centroide? Como K-medoids (que usa o ponto mediano) mitiga este problema?

    Show solution
    Em K-means, o centroide de cada cluster é a **média** dos pontos do cluster — minimiza a soma dos quadrados das distâncias (critério L2L^2). Um outlier num cluster puxa o centroide em sua direção, distorcendo a representação do cluster. Em K-medoids, o centroide é substituído pelo medoide — o ponto real do cluster que minimiza a soma das distâncias (critério L1L^1). O medoide é mais robusto: um outlier extremo não o desloca tanto, pois a distância absoluta cresce mais lentamente que o quadrado.
  26. Ex. 71.26Modeling

    Controle de qualidade: peças com diâmetro médio dˉ=10,05\bar{d} = 10{,}05 mm e distribuição aproximadamente simétrica. A que valor você esperaria que a mediana seja próxima? Por quê?

    Show solution
    Controle de qualidade: diâmetros de peças com distribuição aproximadamente normal (μ=10,05\mu = 10{,}05 mm, σ=0,03\sigma = 0{,}03 mm). Para distribuição normal, a média e a mediana coincidem. Portanto a mediana esperada é aproximadamente 10,05 mm (igual à média). Este é um caso em que as duas medidas são igualmente adequadas, e a média é preferida por suas propriedades algébricas na análise de processo (cartas de controle XBar-R usam médias).
  27. Ex. 71.27Modeling

    Em aprendizado de máquina, MSE como função de perda implica que o modelo aprende a estimar a média condicional. MAE implica que o modelo estima a mediana condicional. Explique por que isso decorre da caracterização variacional das medidas centrais.

    Show solution
    MAE (Mean Absolute Error) = 1nyiy^i\frac{1}{n}\sum |y_i - \hat{y}_i|. Minimizar MAE sobre uma constante cc equivale a minimizar xic\sum |x_i - c|, que tem solução c=c = mediana. MSE (Mean Squared Error) = 1n(yiy^i)2\frac{1}{n}\sum (y_i - \hat{y}_i)^2. Minimizar MSE sobre cc tem solução c=c = média. Portanto: modelos que usam MSE como loss buscam o estimador da média condicional E[YX]E[Y|X]; modelos que usam MAE buscam a mediana condicional. MAE é mais robusto a outliers nos rótulos.
  28. Ex. 71.28Modeling

    Uma meta-análise com 50 estudos reporta a mediana do tamanho de efeito em vez da média. Por que a mediana é preferida em meta-análise?

    Show solution
    Pesquisa científica com muitos estudos pequenos: os tamanhos de efeito individuais têm alta variabilidade amostral e podem incluir outliers (estudos com amostras não representativas ou erros metodológicos). A mediana da distribuição de tamanhos de efeito é mais robusta do que a média — um estudo com resultado extremo (positivo ou negativo) não distorce a estimativa central. Além disso, a mediana é resistente ao viés de publicação parcial (estudos positivos são mais publicados).
  29. Ex. 71.29Modeling

    Por que o boxplot usa a mediana como linha central (e o IQR como largura da caixa) em vez de usar média e desvio padrão?

    Show solution
    Boxplot: a linha central é a mediana porque o boxplot foi projetado para estatística exploratória robusta (Tukey, 1977). A caixa vai do Q1 ao Q3 (IQR), e os whiskers se estendem até 1,5×IQR1{,}5 \times \text{IQR}. Toda a estrutura é baseada em quantis (estatísticas de ordem), não em momentos. A mediana e o IQR são resistentes a outliers por definição — ao contrário da média e do desvio padrão. Usar a média como linha central tornaria o boxplot não-robusto ao mesmo problema que ele foi criado para expor.
  30. Ex. 71.30Modeling

    Em federated learning, por que substituir a média dos gradientes pela mediana aumenta a resistência a clientes maliciosos (ataques Byzantine)?

    Show solution
    Em federated learning, cada cliente treina localmente e envia seu gradiente ao servidor central. Se a agregação for pela média, um cliente malicioso pode enviar um gradiente com norma arbitrariamente grande (ataque Byzantine), puxando a atualização global na direção do ataque. A mediana coordenada (mediana de cada coordenada do gradiente separadamente) tem breakdown point de 50%: até metade dos clientes pode ser maliciosa sem contaminar o resultado. A média tem breakdown point de 1/n01/n \to 0.
  31. Ex. 71.31Modeling

    Para a distribuição log-normal (lnXN(μ,σ2)\ln X \sim N(\mu, \sigma^2)): moda =eμσ2= e^{\mu-\sigma^2}, mediana =eμ= e^\mu, média =eμ+σ2/2= e^{\mu+\sigma^2/2}. Verifique a ordenação moda menor que mediana menor que média para σ>0\sigma > 0.

    Show solution
    Log-normal: se lnXN(μ,σ2)\ln X \sim N(\mu, \sigma^2), então: moda = eμσ2e^{\mu - \sigma^2}; mediana = eμe^\mu (pois P(Xeμ)=P(lnXμ)=0,5P(X \leq e^\mu) = P(\ln X \leq \mu) = 0{,}5); média = eμ+σ2/2e^{\mu + \sigma^2/2}. Para σ>0\sigma > 0: moda menor que mediana menor que média, pois μσ2<μ<μ+σ2/2\mu - \sigma^2 < \mu < \mu + \sigma^2/2. A distribuição log-normal modela renda, preços de ativos financeiros, tamanho de empresas — todas com assimetria à direita característica.
  32. Ex. 71.32ModelingAnswer key

    Salários (R$ mil): 4, 4, 5, 5, 6, 7, 7, 8 (8 funcionários). Um CEO com salário de R$ 60 mil é adicionado (sem remover nenhum). Calcule a média e mediana antes e depois. Qual medida mudou mais?

    Show solution
    Considere os dados sem o CEO: 4, 4, 5, 5, 6, 7, 7, 8 (obtidos substituindo o CEO por alguém com salário de 7 mil reais). Média sem CEO = (4+4+5+5+6+7+7+8)/8=46/8=5,75(4+4+5+5+6+7+7+8)/8 = 46/8 = 5{,}75 mil. Mediana = (5+6)/2=5,5(5+6)/2 = 5{,}5 mil. Com CEO (60 mil reais): média = (467+60)/8=99/8=12,375(46 - 7 + 60)/8 = 99/8 = 12{,}375 mil; mediana = (5+6)/2=5,5(5+6)/2 = 5{,}5 mil. A média mudou de 5,75 para 12,375 (+115%). A mediana permaneceu 5,5 mil. Isso demonstra empiricamente o breakdown point zero da média e o breakdown point 1/8 = 12,5% que foi ainda mantido pela mediana.
  33. Ex. 71.33Modeling

    Notas de 30 alunos numa prova, agrupadas: [60,70)[60,70): 3 alunos; [70,80)[70,80): 8 alunos; [80,90)[80,90): 12 alunos; [90,100][90,100]: 7 alunos. Calcule a média estimada pelos pontos médios.

    Show solution
    Para dados agrupados em intervalos de classe, use os pontos médios para estimar a média. Intervalos e frequências: [60,70) → 3 alunos, ponto médio 65; [70,80) → 8 alunos, ponto médio 75; [80,90) → 12 alunos, ponto médio 85; [90,100] → 7 alunos, ponto médio 95. Total = 30 alunos. Média = (365+875+1285+795)/30=(195+600+1020+665)/30=2480/3082,7(3 \cdot 65 + 8 \cdot 75 + 12 \cdot 85 + 7 \cdot 95)/30 = (195 + 600 + 1020 + 665)/30 = 2480/30 \approx 82{,}7 pontos.
    Show step-by-step (with the why)
    1. Identifique os pontos médios: 65, 75, 85, 95.
    2. Confirme o total: 3+8+12+7=303 + 8 + 12 + 7 = 30 alunos.
    3. Calcule fixi=3(65)+8(75)+12(85)+7(95)=195+600+1020+665=2480\sum f_i x_i^* = 3(65) + 8(75) + 12(85) + 7(95) = 195 + 600 + 1020 + 665 = 2480.
    4. Divida: xˉ=2480/3082,7\bar{x} = 2480/30 \approx 82{,}7 pontos.
    5. Macete: a nota de referência útil é o ponto médio do intervalo modal (80–90), que tem 12 alunos. A média estar em 82,7 — dentro desse intervalo — faz sentido pois ele domina a distribuição.
  34. Ex. 71.34Proof

    Mostre que i=1n(xixˉ)=0\sum_{i=1}^{n}(x_i - \bar{x}) = 0.

    Show solution
    Seja xˉ=1ni=1nxi\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i. Então i=1n(xixˉ)=i=1nxii=1nxˉ=nxˉnxˉ=0\sum_{i=1}^n (x_i - \bar{x}) = \sum_{i=1}^n x_i - \sum_{i=1}^n \bar{x} = n\bar{x} - n\bar{x} = 0. \square
  35. Ex. 71.35Proof

    Mostre que i=1n(xic)2\sum_{i=1}^{n}(x_i - c)^2 é minimizado em c=xˉc = \bar{x} para qualquer sequência x1,,xnRx_1, \ldots, x_n \in \mathbb{R}.

    Show solution
    Mostre que f(c)=(xic)2f(c) = \sum(x_i - c)^2 tem mínimo em c=xˉc = \bar{x}. Escreva xic=(xixˉ)+(xˉc)x_i - c = (x_i - \bar{x}) + (\bar{x} - c). Expanda: f(c)=(xixˉ)2+2(xˉc)(xixˉ)+n(xˉc)2f(c) = \sum(x_i-\bar{x})^2 + 2(\bar{x}-c)\sum(x_i-\bar{x}) + n(\bar{x}-c)^2. Como (xixˉ)=0\sum(x_i-\bar{x}) = 0, o termo do meio é zero. Logo f(c)=(xixˉ)2+n(xˉc)2(xixˉ)2=f(xˉ)f(c) = \sum(x_i-\bar{x})^2 + n(\bar{x}-c)^2 \geq \sum(x_i-\bar{x})^2 = f(\bar{x}), com igualdade sse c=xˉc = \bar{x}. \square
  36. Ex. 71.36Proof

    Mostre que i=1nxic\sum_{i=1}^{n}|x_i - c| é minimizado em c=medianac = \text{mediana}. (Sugestão: analise o que acontece ao deslocar cc para um lado ou outro da mediana, contando quantos xix_i ficam acima e abaixo.)

    Show solution
    Seja mm a mediana (com nn ímpar, para simplificar: m=x((n+1)/2)m = x_{((n+1)/2)}). Para qualquer cmc \neq m, considere o efeito de mover de mm para cc em xic\sum |x_i - c|. Para cada valor xi<mx_i < m: mover para c>mc > m aumenta xic|x_i - c|. Para cada valor xi>mx_i > m: mover para c<mc < m aumenta xic|x_i - c|. Em c=mc = m, exatamente metade dos valores está acima e metade abaixo (definição de mediana), então qualquer deslocamento de cc aumenta mais do que diminui a soma. Argumento formal: a função g(c)=xicg(c) = \sum |x_i - c| é convexa e sua subderivada em c=mc = m contém 0. \square
  37. Ex. 71.37Proof

    Mostre que se yi=axi+by_i = ax_i + b (transformação linear), então yˉ=axˉ+b\bar{y} = a\bar{x} + b.

    Show solution
    Propriedade de linearidade da média. Se yi=axi+by_i = ax_i + b para cada ii, então: yˉ=1n(axi+b)=anxi+nbn=axˉ+b\bar{y} = \frac{1}{n}\sum(ax_i + b) = \frac{a}{n}\sum x_i + \frac{nb}{n} = a\bar{x} + b. Interpretação: transformar dados por escala aa e deslocamento bb transforma a média da mesma forma — como esperado de um "centro". A mediana também satisfaz esta propriedade (para a>0a > 0): Med(aX+b)=aMed(X)+b\text{Med}(aX + b) = a\,\text{Med}(X) + b.
  38. Ex. 71.38Challenge

    A média satisfaz f(xi)=f(xˉ)\overline{f(x_i)} = f(\bar{x}) em geral? E a mediana? Investigue com f(t)=t2f(t) = t^2 e os dados x={1,2,3}x = \{1, 2, 3\}.

    Show solution
    A mediana não é linear em geral. Exemplo: x={1,2,3}x = \{1, 2, 3\} e y={1,4,9}y = \{1, 4, 9\} (com yi=xi2y_i = x_i^2). Mediana de xx = 2. Mediana de yy = 4. Mas (Med(x))2=4(\text{Med}(x))^2 = 4 — coincidência neste caso! Tente x={1,2,10}x = \{1, 2, 10\}: mediana de xx = 2, mediana de y={1,4,100}y = \{1, 4, 100\} = 4 = (Med(x))2(\text{Med}(x))^2. De fato, para a função estritamente crescente ff, vale Med(f(xi))=f(Med(xi))\text{Med}(f(x_i)) = f(\text{Med}(x_i)) (equivariância por transformação monótona). Mas a média não tem esta propriedade: Jensen's inequality diz E[f(X)]f(E[X])E[f(X)] \geq f(E[X]) para ff convexa.
  39. Ex. 71.39Challenge

    Distribuição de Cauchy: f(x)=1/[π(1+x2)]f(x) = 1/[\pi(1+x^2)]. Calcule a mediana. Mostre que a média não existe (a integral +xf(x)dx\int_{-\infty}^{+\infty} x f(x)\,dx diverge).

    Show solution
    Distribuição de Cauchy: f(x)=1/[π(1+x2)]f(x) = 1/[\pi(1+x^2)]. Mediana: mf(x)dx=1/2\int_{-\infty}^{m} f(x)\,dx = 1/2. Por simetria de ff em torno de 0: mediana = 0. Média: E[X]=+x/[π(1+x2)]dxE[X] = \int_{-\infty}^{+\infty} x/[\pi(1+x^2)]\,dx. Esta integral diverge (a primitiva ln(1+x2)/(2π)\ln(1+x^2)/(2\pi) não converge). A média de Cauchy é indefinida — a distribuição de Cauchy não tem primeiro momento finito. Isso mostra que a média pode não existir para distribuições com caudas muito pesadas.
  40. Ex. 71.40Challenge

    Mostre que se trocarmos o maior valor de um conjunto de dados por um valor ainda maior, a mediana não muda, mas a média aumenta.

    Show solution
    Se trocarmos o maior valor x(n)x_{(n)} por M>x(n)M > x_{(n)}, a nova lista ordenada é a mesma exceto pelo último elemento. A mediana depende apenas dos valores centrais (posições (n+1)/2(n+1)/2 ou média de n/2n/2 e n/2+1n/2+1). Como MM continua sendo o maior, o elemento central não muda. Logo a mediana não muda. A média, por outro lado, muda: nova média = xˉ+(Mx(n))/n\bar{x} + (M - x_{(n)})/n. Como M>x(n)M > x_{(n)}, a nova média é estritamente maior.
  41. Ex. 71.41ChallengeAnswer key

    Dois grupos têm médias xˉ1\bar{x}_1 e xˉ2\bar{x}_2 com tamanhos n1n_1 e n2n_2. Derive a fórmula da média combinada dos dois grupos.

    Show solution
    Seja xˉ1,n1\bar{x}_1, n_1 e xˉ2,n2\bar{x}_2, n_2 as médias e tamanhos dos dois grupos. A média combinada é: xˉ=n1xˉ1+n2xˉ2n1+n2\bar{x} = \frac{n_1 \bar{x}_1 + n_2 \bar{x}_2}{n_1 + n_2}. Isso porque a soma total dos valores é n1xˉ1+n2xˉ2n_1 \bar{x}_1 + n_2 \bar{x}_2 e o número total é n1+n2n_1 + n_2. Atenção: a média de grupos não é a média das médias, a menos que n1=n2n_1 = n_2.
  42. Ex. 71.42ChallengeAnswer key

    A desigualdade de Jensen afirma que para φ\varphi convexa, φ(E[X])E[φ(X)]\varphi(E[X]) \leq E[\varphi(X)]. Aplique com φ(t)=t2\varphi(t) = t^2 para obter uma desigualdade entre xˉ2\bar{x}^2 e x2\overline{x^2}. O que isso implica sobre a variância?

    Show solution
    A desigualdade de Jensen diz que para função convexa φ\varphi e variável aleatória XX com E[X]E[X] finito: φ(E[X])E[φ(X)]\varphi(E[X]) \leq E[\varphi(X)]. Aplicando com φ(t)=t2\varphi(t) = t^2 (convexa): (E[X])2E[X2](E[X])^2 \leq E[X^2], ou seja xˉ2x2\bar{x}^2 \leq \overline{x^2}. Isso implica que a variância Var(X)=E[X2](E[X])20\text{Var}(X) = E[X^2] - (E[X])^2 \geq 0 — o que é trivial mas Jensen justifica o porquê. Para função côncava (ex.: ln\ln): ln(E[X])E[lnX]\ln(E[X]) \geq E[\ln X] — desigualdade AM-GM.

Fontes

  • OpenIntro Statistics (4ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA 4.0 · §1.6 (medidas descritivas básicas, escolha de medida, skewness) e §2.1 (caracterização variacional, robustez). Fonte primária desta lição.
  • Introductory Statistics 2e (OpenStax) — Illowsky, Dean et al. · CC-BY 4.0 · §2.5 (cálculo de média para dados agrupados, exemplos extensos com tabelas de frequência).
  • Estatística (Wikilivros) — colaborativo · CC-BY-SA 4.0 · Seções: Média, Mediana, Moda, Medidas de tendência central (referência em PT-BR; fórmula de Czuber para moda em dados agrupados).
  • Prêmio Nobel de Economia 2000 — Heckman e McFadden — métodos microeconométricos baseados em estimação robusta de locação central.

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.