Math ClubMath Club
v1 · padrão canônico

Lição 73 — Quartis, percentis e boxplot

Resumo de 5 números: mín, Q1, mediana, Q3, máx. IQR, boxplot e regra 1,5 IQR para detectar outliers. Medidas robustas em dados assimétricos.

Used in: Stochastik — Leistungskurs alemão · H2 Math Statistics — Singapura · AP Statistics — EUA · Math B — Japão

IQR=Q3Q1,outlier se x<Q11,5IQR ou x>Q3+1,5IQRIQR = Q_3 - Q_1, \quad \text{outlier se } x < Q_1 - 1{,}5\,IQR \text{ ou } x > Q_3 + 1{,}5\,IQR

O intervalo interquartil IQR=Q3Q1IQR = Q_3 - Q_1 cobre os 50% centrais dos dados. A regra de Tukey (1977) sinaliza como outlier qualquer ponto além de 1,5×IQR1{,}5 \times IQR de cada quartil — critério robusto, pois não depende de média nem de desvio padrão.

Choose your door

Rigorous notation, full derivation, hypotheses

Definição rigorosa

Estatísticas de ordem e percentis

"The first quartile, Q1Q_1, is the value such that 25% of the data fall below it, and the third quartile, Q3Q_3, is such that 75% of the data fall below it." — OpenIntro Statistics §2.1

mínQ₁Q₂Q₃máxoutlieroutlierIQR

Anatomia do boxplot: caixa (Q1 a Q3), linha de mediana, bigodes até o extremo não-outlier, pontos isolados para outliers.

Exemplos resolvidos

Exercise list

40 exercises · 10 with worked solution (25%)

Application 21Understanding 4Modeling 10Challenge 2Proof 3
  1. Ex. 73.1ApplicationAnswer key

    Dados: 1, 3, 5, 7, 9. Calcule mediana, Q1Q_1 e Q3Q_3.

    Show solution
    Ordenados: 1, 3, 5, 7, 9 (n=5n = 5). Mediana: posição 3 = 5. Q1Q_1: mediana de (1, 3) = 2. Q3Q_3: mediana de (7, 9) = 8. Resumo de 5: (1, 2, 5, 8, 9).
    Show step-by-step (with the why)
    1. Ordene: 1, 3, 5, 7, 9. Com n=5n = 5 ímpar, a mediana é o 3.º valor: 5.
    2. Q1Q_1 = mediana da metade inferior (1, 3) = média de 1 e 3 = 2.
    3. Q3Q_3 = mediana da metade superior (7, 9) = média de 7 e 9 = 8.
    Macete: para nn ímpar, exclua a mediana antes de dividir as metades.
  2. Ex. 73.2Application

    Dados: 2, 4, 6, 8, 10, 12. Calcule o resumo de 5 números.

    Show solution
    Ordenados: 2, 4, 6, 8, 10, 12 (n=6n = 6). Mediana: (6+8)/2=7(6+8)/2 = 7. Q1Q_1: mediana de (2, 4, 6) = 4. Q3Q_3: mediana de (8, 10, 12) = 10. Resumo: (2, 4, 7, 10, 12).
  3. Ex. 73.3ApplicationAnswer key

    Notas: 4, 5, 6, 6, 7, 7, 8, 8, 9, 10. Calcule Q1Q_1, Q2Q_2, Q3Q_3.

    Show solution
    Ordenados: 4, 5, 6, 6, 7, 7, 8, 8, 9, 10 (n=10n = 10). Q2=(7+7)/2=7Q_2 = (7+7)/2 = 7. Q1Q_1: mediana de (4, 5, 6, 6, 7) = 6. Q3Q_3: mediana de (7, 8, 8, 9, 10) = 8.
  4. Ex. 73.4Application

    Calcule o IQRIQR dos dados: 12, 14, 18, 22, 25, 28, 32.

    Show solution
    Ordenados: 12, 14, 18, 22, 25, 28, 32 (n=7n = 7). Q1Q_1 = 14 (2.º valor). Q3Q_3 = 28 (6.º valor). IQR=2814=14IQR = 28 - 14 = 14.
  5. Ex. 73.5ApplicationAnswer key

    Idades: 18, 20, 21, 22, 23, 24, 25, 27, 30, 35, 60. Aplique a regra 1,5 IQR. Há outlier?

    Show solution
    Dados ordenados: 18, 20, 21, 22, 23, 24, 25, 27, 30, 35, 60 (n=11n = 11). Q1=21Q_1 = 21, Q3=30Q_3 = 30, IQR=9IQR = 9. Limite superior: 30+13,5=43,530 + 13{,}5 = 43{,}5. Valor 60 está além: outlier.
    Show step-by-step (with the why)
    1. Ordene e localize: Q1=21Q_1 = 21 (3.ª posição), mediana = 24, Q3=30Q_3 = 30 (9.ª posição).
    2. IQR=3021=9IQR = 30 - 21 = 9.
    3. Limite superior: Q3+1,5×IQR=30+13,5=43,5Q_3 + 1{,}5 \times IQR = 30 + 13{,}5 = 43{,}5.
    4. O valor 60 é maior que 43,5 — classificado como outlier pela regra de Tukey.
    Observação: Limite inferior = 2113,5=7,521 - 13{,}5 = 7{,}5; todos os outros valores são maiores que 7,5, então nenhum outlier inferior.
  6. Ex. 73.6Application

    Salários (Rmil):2,3,3,4,4,5,5,6,8,50.Calculemedianaemil): 2, 3, 3, 4, 4, 5, 5, 6, 8, 50. Calcule mediana eIQR$.

    Show solution
    Dados: 2, 3, 3, 4, 4, 5, 5, 6, 8, 50 (n=10n = 10). Mediana = (4+5)/2=4,5(4+5)/2 = 4{,}5. Q1Q_1 = mediana de (2, 3, 3, 4, 4) = 3. Q3Q_3 = mediana de (5, 5, 6, 8, 50) = 6. IQR=3IQR = 3.
  7. Ex. 73.7ApplicationAnswer key

    Para n=100n = 100 dados ordenados, qual é a posição de Q3Q_3 pelo método de interpolação linear?

    Show solution
    Usando fórmula L=1+(p/100)(n1)L = 1 + (p/100)(n-1) com p=75p = 75, n=100n = 100: L=1+0,75×99=1+74,25=75,25L = 1 + 0{,}75 \times 99 = 1 + 74{,}25 = 75{,}25. Interpola entre posições 75 e 76.
  8. Ex. 73.8Application

    Tempos (s): 10, 11, 11, 12, 13, 13, 14, 14, 15, 100. Calcule limites de Tukey e identifique o(s) outlier(s).

    Show solution
    Dados: 10, 11, 11, 12, 13, 13, 14, 14, 15, 100 (n=10n = 10). Q1=11Q_1 = 11, Q3=14Q_3 = 14, IQR=3IQR = 3. Limite superior: 14+4,5=18,514 + 4{,}5 = 18{,}5. Valor 100 é outlier.
  9. Ex. 73.9Application

    Pesos (kg): 60, 62, 64, 65, 65, 67, 70, 72, 75, 80. Descreva todos os elementos do boxplot.

    Show solution
    Pesos ordenados: 60, 62, 64, 65, 65, 67, 70, 72, 75, 80. Q1=64,5Q_1 = 64{,}5, mediana = 66, Q3=71Q_3 = 71. Caixa de 64,5 a 71, linha em 66. Bigodes de 60 a 80 (nenhum outlier). Distribuição levemente assimétrica à direita.
    Show step-by-step (with the why)
    1. Ordenar: 60, 62, 64, 65, 65, 67, 70, 72, 75, 80 (n=10n = 10).
    2. Mediana: média das posições 5 e 6 = (65+67)/2=66(65+67)/2 = 66.
    3. Q1Q_1: mediana de (60, 62, 64, 65, 65) = 64; Q3Q_3: mediana de (67, 70, 72, 75, 80) = 72. Atenção: alguns livros excluem mediana central — verifique seu método.
    4. IQR=7264=8IQR = 72 - 64 = 8. Limites: 6412=5264 - 12 = 52 e 72+12=8472 + 12 = 84. Todos os pesos estão dentro.
    Curiosidade: a posição da mediana dentro da caixa indica assimetria: se próxima de Q1Q_1, cauda longa à direita.
  10. Ex. 73.10Application

    Para ZN(0,1)Z \sim \mathcal N(0,1), Q3Q1=?Q_3 - Q_1 = ?

    Show solution
    Para ZN(0,1)Z \sim \mathcal N(0,1): Q1=Φ1(0,25)0,674Q_1 = \Phi^{-1}(0{,}25) \approx -0{,}674 e Q3=Φ1(0,75)0,674Q_3 = \Phi^{-1}(0{,}75) \approx 0{,}674. Por simetria IQR=2×0,674=1,3481,349IQR = 2 \times 0{,}674 = 1{,}348 \approx 1{,}349.
  11. Ex. 73.11Application

    Dados com IQR=6,7IQR = 6{,}7. Usando o estimador robusto σ^=IQR/1,349\hat\sigma = IQR/1{,}349, calcule σ^\hat\sigma.

    Show solution
    Estimador robusto: σ^=IQR/1,349=6,7/1,3494,97\hat\sigma = IQR / 1{,}349 = 6{,}7 / 1{,}349 \approx 4{,}97. Útil quando suspeita de outliers contamina o desvio padrão clássico.
  12. Ex. 73.12Application

    Quantos pontos acima de Q3+3IQRQ_3 + 3 \cdot IQR esperaríamos numa amostra de 1000 observações normais?

    Show solution
    A regra Q3+3IQRQ_3 + 3 \cdot IQR equivale a Q3+3×1,349σ=μ+0,674σ+4,047σ=μ+4,721σ\approx Q_3 + 3 \times 1{,}349\sigma = \mu + 0{,}674\sigma + 4{,}047\sigma = \mu + 4{,}721\sigma. P(Z>4,72)0,00001P(Z > 4{,}72) \approx 0{,}00001. Em 1000 observações normais, esperamos 0,01\approx 0{,}01 — essencialmente zero.
  13. Ex. 73.13Application

    Boxplot A: caixa estreita, mediana centrada. Boxplot B: caixa larga, mediana próxima a Q1Q_1. Compare dispersão e simetria dos dois conjuntos.

    Show solution
    Boxplot A: caixa estreita (IQRIQR pequeno) com mediana centrada → baixa dispersão e simetria. Boxplot B: caixa larga (IQRIQR grande) com mediana próxima a Q1Q_1 → alta dispersão e assimetria à direita (cauda longa superior).
  14. Ex. 73.14Application

    Distribuição com cauda longa à direita. A média está em que posição em relação à mediana?

    Select the correct option
    Select an option first
    Show solution
    Em distribuição com cauda longa à direita, a cauda puxa a média para cima. A mediana, sendo posicional, não é afetada pela cauda. Logo média está acima da mediana.
  15. Ex. 73.15Application

    Conjunto A tem IQR=5IQR = 5, conjunto B tem IQR=20IQR = 20. Em qual há mais dispersão nos dados centrais?

    Show solution
    IQRIQR mede a dispersão dos 50% centrais. IQR=20IQR = 20 em B é 4 vezes maior que IQR=5IQR = 5 em A — conjunto B tem muito mais dispersão.
  16. Ex. 73.16Application

    Mediana de A=B=50A = B = 50. Q3Q_3 de A=55A = 55, de B=80B = 80. Qual dos dois tem distribuição mais assimétrica à direita?

    Show solution
    Ambos têm mediana 50. Em A, Q3Q2=5550=5Q_3 - Q_2 = 55 - 50 = 5 (metade superior estreita). Em B, Q3Q2=8050=30Q_3 - Q_2 = 80 - 50 = 30 (metade superior larga). Conjunto B é muito mais assimétrico à direita.
  17. Ex. 73.17Application

    P90P_{90} de salários da empresa = R$ 30 mil. Interprete esta informação.

    Show solution
    P90P_{90} de salários = R$ 30 mil significa: 90% dos funcionários ganham até R$ 30 mil por mês, e 10% ganham mais que isso.
  18. Ex. 73.18Application

    Um aluno está no P85P_{85} do ENEM. O que isso significa?

    Show solution
    Aluno no P85P_{85} do ENEM significa: ele tirou nota maior ou igual a 85% dos candidatos que fizeram o exame naquele ano.
  19. Ex. 73.19Application

    Se Q1=Q2=Q3Q_1 = Q_2 = Q_3, o que se pode concluir sobre os dados?

    Select the correct option
    Select an option first
    Show solution
    Se Q1=Q2=Q3Q_1 = Q_2 = Q_3, então IQR=0IQR = 0. Isso significa que pelo menos metade dos dados tem exatamente o mesmo valor — máxima concentração nos 50% centrais. Pode indicar que todos os dados são iguais ou que há grande massa de valores repetidos.
  20. Ex. 73.20Understanding

    A afirmação "a regra 1,5 IQR sinaliza 5% dos dados como outliers" está correta para dados normais?

    Show solution
    Não. Em dados normais, a regra 1,5 IQR sinaliza apenas 0,7%\approx 0{,}7\% das observações como outliers — não 5%. O critério "5% como outliers" usaria aproximadamente Q10,69IQRQ_1 - 0{,}69 \cdot IQR, não 1,5 IQR. A regra de Tukey foi calibrada propositalmente para que outliers sejam raros, não rotineiros.
  21. Ex. 73.21ApplicationAnswer key

    Idades (anos): 40, 52, 55, 58, 62, 66, 72. Calcule o resumo de 5 números e verifique se há outliers.

    Show solution
    Resumo de 5 números para conjunto de 7 valores: mín = 40, Q1=52Q_1 = 52, mediana = 58, Q3=64Q_3 = 64, máx = 72. IQR=12IQR = 12. Limite superior: 64+18=8264 + 18 = 82. Nenhum outlier.
  22. Ex. 73.22ApplicationAnswer key

    Notas de 10 alunos: 3, 5, 6, 7, 7, 8, 8, 9, 10, 10. Boxplot completo (com verificação de outliers).

    Show solution
    Notas: 3, 5, 6, 7, 7, 8, 8, 9, 10, 10. Mediana = (7+8)/2=7,5(7+8)/2 = 7{,}5. Q1=6Q_1 = 6, Q3=9Q_3 = 9. IQR=3IQR = 3. Limites: [64,5;  9+4,5]=[1,5;  13,5][6 - 4{,}5;\; 9 + 4{,}5] = [1{,}5;\; 13{,}5]. Nenhum outlier.
  23. Ex. 73.23Modeling

    Turma de 100 alunos: Q1=5Q_1 = 5, Q3=8Q_3 = 8. Um aluno tirou 9,5 — ele está no top 25%?

    Show solution
    Com Q1=5Q_1 = 5 e Q3=8Q_3 = 8, a nota 9,5 está acima de Q3Q_3. Isso significa que o aluno está no top 25% da turma — sim, top 25%.
  24. Ex. 73.24Modeling

    Por que o IBGE divulga mediana de renda, e não só a média, nos relatórios sobre desigualdade no Brasil?

    Show solution
    Renda no Brasil tem distribuição fortemente assimétrica à direita: poucos milionários puxam a média para cima, distorcendo-a como medida do salário "típico". A mediana não é afetada por valores extremos e representa melhor o que o trabalhador mediano ganha. Exemplo: em 2023, a renda média domiciliar no Brasil era R$ 3.459 e a mediana era R$ 1.850 — diferença de 87%.
  25. Ex. 73.25Modeling

    Peças produzidas com diâmetro: Q1=9,98Q_1 = 9{,}98 mm, Q3=10,02Q_3 = 10{,}02 mm. Especificação: 10,00±0,0510{,}00 \pm 0{,}05 mm. O processo está centrado? Há risco de rejeição significativo?

    Show solution
    Peças com Q1=9,98Q_1 = 9{,}98 mm e Q3=10,02Q_3 = 10{,}02 mm: 50% das peças estão entre 9,98 e 10,02 mm. A especificação é 10,00±0,0510{,}00 \pm 0{,}05, ou seja, 9,95 a 10,05 mm. Como os quartis estão bem dentro dos limites, o processo parece centrado e a maioria das peças deve estar conforme. Para decisão completa, calcular CpC_p e CpkC_{pk} requer σ\sigma ou assumir normalidade.
  26. Ex. 73.26Modeling

    A/B test de site: variante A tem mediana 1,2 s e IQR=0,3IQR = 0{,}3; variante B tem mediana 1,1 s e IQR=1,5IQR = 1{,}5. Qual você prefere para lançar em produção? Justifique usando as estatísticas de dispersão.

    Show solution
    Variante A: mediana 1,2 s, IQR=0,3IQR = 0{,}3 (consistente, mas um pouco mais lenta). Variante B: mediana 1,1 s, IQR=1,5IQR = 1{,}5 (mais rápida em mediana, mas muito variável — provavelmente tem outliers pesados). Para UX, prefere-se A: o usuário prefere carregamento consistentemente rápido a um que às vezes é rápido e às vezes demora muito.
  27. Ex. 73.27ModelingAnswer key

    Você detecta um outlier em transações financeiras que parece ser fraude. Deve removê-lo antes de analisar os dados? Justifique com argumentos estatísticos.

    Show solution
    Não se deve remover o outlier sem investigação. Um outlier em transações financeiras pode ser: (a) erro de lançamento (remova, com justificativa documentada); (b) transação fraudulenta real (preserve — é o ponto mais informativo); (c) cliente de alto valor. Remover outliers de fraude do training set de um modelo de detecção é especialmente prejudicial: o modelo não aprenderá a detectar exatamente os casos de maior risco.
  28. Ex. 73.28Modeling

    Tempos de resposta (ms): 120, 130, 135, 140, 142, 145, 148, 150, 155, 380. Calcule o resumo de 5 números e avalie se o sistema cumpre SLA de 200 ms com base nos quartis.

    Show solution
    Tempo de resposta de sistema: 120, 130, 135, 140, 142, 145, 148, 150, 155, 380 ms. Q1=134Q_1 = 134, Q3=149Q_3 = 149, IQR=15IQR = 15. Limite: 149+22,5=171,5149 + 22{,}5 = 171{,}5. O valor 380 ms é outlier — provavelmente timeout ou falha de rede. Para SLA de 200 ms, o sistema está bem, exceto pelo outlier.
  29. Ex. 73.29Modeling

    Hospital com 4 alas. Tempos de internação (dias): Ala A: 5, 8, 9, 10, 12; Ala B: 3, 4, 4, 5, 20; Ala C: 7, 8, 8, 9, 10; Ala D: 2, 3, 15, 18, 25. Construa os resumos de 5 números e identifique qual ala é mais previsível em gestão de leitos.

    Show solution
    Hospital com 4 alas. Tempos médios de internação (dias) por ala: A(5,8,9,10,12), B(3,4,4,5,20), C(7,8,8,9,10), D(2,3,15,18,25). Ala B e D têm outliers (casos complexos). Ala A tem distribuição mais uniforme (IQR=3IQR = 3), Ala C tem menor variabilidade (IQR=1IQR = 1). Decisão de alocação de leitos deve priorizar IQRIQR baixo (mais previsível) sobre mediana isolada.
  30. Ex. 73.30Modeling

    Notas do ENEM por escola. Escola A: mediana 650, IQR=80IQR = 80. Escola B: mediana 620, IQR=200IQR = 200. Qual escola tem desempenho mais uniforme? O que cada padrão sugere para a política pedagógica?

    Show solution
    Dados de nota do ENEM por escola. Escola A: mediana 650, IQR=80IQR = 80. Escola B: mediana 620, IQR=200IQR = 200. Escola A tem desempenho mais homogêneo (menor IQRIQR) e mediana maior. Escola B tem maior desigualdade interna — possivelmente alunos muito bons e muito fracos. Para políticas públicas, escola B precisa de nivelamento; escola A de aprofundamento para alunos medianos.
  31. Ex. 73.31Modeling

    Precipitação mensal média em São Paulo (mm): 234, 181, 130, 83, 68, 52, 44, 47, 82, 122, 145, 201. Calcule o resumo de 5 números e interprete a sazonalidade.

    Show solution
    Precipitação mensal (mm) em São Paulo: 234, 181, 130, 83, 68, 52, 44, 47, 82, 122, 145, 201. Ordenados: 44, 47, 52, 68, 82, 83, 122, 130, 145, 181, 201, 234. Q1=60Q_1 = 60, mediana = (83+122)/2=102,5(83+122)/2 = 102{,}5, Q3=163Q_3 = 163. IQR=103IQR = 103. Nenhum outlier (limites: [-94,5 e 317,5]). Distribuição assimétrica à direita: chuvas concentradas nos meses de verão.
  32. Ex. 73.32Modeling

    Preços de imóveis em um bairro (R$ mil): 250, 280, 310, 320, 340, 350, 380, 390, 420, 1800. Calcule mediana e média. Por que um comprador deve usar a mediana como referência de preço típico?

    Show solution
    Preços de imóveis: R$ 250 mil, 280 mil, 310 mil, 320 mil, 340 mil, 350 mil, 380 mil, 390 mil, 420 mil, 1,8 milhão. Mediana = R$ 345 mil, média = R$ 484 mil — diferença enorme puxada pelo imóvel de luxo. Para precificação de imóvel típico no bairro, a mediana é a referência correta. O imóvel de R$ 1,8 milhão é outlier (Q3+1,5IQRQ_3 + 1{,}5 \cdot IQR = R$ 550 mil).
  33. Ex. 73.33Understanding

    Explique, em suas próprias palavras, por que mediana e IQR são "robustos" enquanto média e desvio padrão não são. Use um exemplo concreto.

    Show solution
    Mediana e IQR são robustos porque dependem apenas da ordem dos dados, não de seus valores absolutos. Uma observação se torna infinitamente grande: mediana não muda (continua no valor central), IQR não muda (continua medindo os 50% centrais). Média e desvio padrão, ao contrário, somam os valores diretamente — um outlier infinito os torna infinitos.
  34. Ex. 73.34UnderstandingAnswer key

    Um boxplot pode esconder uma distribuição bimodal? Construa um exemplo concreto de distribuição bimodal que tem o mesmo boxplot que uma distribuição unimodal.

    Show solution
    Sim. Exemplo: distribução bimodal com picos em 10 e 90, e valores intermediários raros. Se cada pico tiver 25% dos dados, o quartil Q110Q_1 \approx 10, Q250Q_2 \approx 50, Q390Q_3 \approx 90 — idêntico a uma distribuição uniforme em [10, 90]. O boxplot "vê" a caixa larga mas não distingue os dois modos. Por isso, histograma e violin plot complementam o boxplot.
  35. Ex. 73.35UnderstandingAnswer key

    Para XUniforme(0,1)X \sim \text{Uniforme}(0, 1), o IQRIQR é:

    Select the correct option
    Select an option first
    Show solution
    Para XUniforme(0,1)X \sim \text{Uniforme}(0, 1), a CDF é F(x)=xF(x) = x. Logo Q1=F1(0,25)=0,25Q_1 = F^{-1}(0{,}25) = 0{,}25 e Q3=0,75Q_3 = 0{,}75. Portanto IQR=0,750,25=0,5IQR = 0{,}75 - 0{,}25 = 0{,}5.
  36. Ex. 73.36Challenge

    Calcule analiticamente o IQRIQR de XExponencial(λ)X \sim \text{Exponencial}(\lambda). Expresse em função de λ\lambda.

    Show solution
    Para XExponencial(λ)X \sim \text{Exponencial}(\lambda): CDF F(x)=1eλxF(x) = 1 - e^{-\lambda x}. Q1=ln(0,75)/λQ_1 = -\ln(0{,}75)/\lambda, Q3=ln(0,25)/λ=ln(4)/λQ_3 = -\ln(0{,}25)/\lambda = \ln(4)/\lambda. IQR=(ln4ln(4/3))/λ=ln3/λ1,099/λIQR = (\ln 4 - \ln(4/3))/\lambda = \ln 3/\lambda \approx 1{,}099/\lambda. Para λ=1\lambda = 1: IQR=ln31,099IQR = \ln 3 \approx 1{,}099.
  37. Ex. 73.37Challenge

    Argumente por que o ponto de quebra do IQRIQR é 25%, o da mediana é 50% e o da média é 0%.

    Show solution
    Ponto de quebra do IQR: considere amostras de tamanho nn. Para "destruir" Q1Q_1, precisamos mover ao menos n/4n/4 pontos para além de qualquer limite. Logo o ponto de quebra é 1/4=25%1/4 = 25\%. Para a mediana, análogo argumento dá 50%. Para a média, basta 1 ponto (0%).
  38. Ex. 73.38ProofAnswer key

    Demonstre: se XX é v.a. contínua com densidade simétrica em torno de μ\mu, então μ\mu é a mediana de XX.

    Show solution
    Para XX contínua simétrica em torno de μ\mu: a simetria implica f(μ+t)=f(μt)f(\mu + t) = f(\mu - t) para todo tt. Então P(Xμ)=μf(x)dxP(X \leq \mu) = \int_{-\infty}^\mu f(x)\,dx. Por mudança de variável u=2μxu = 2\mu - x: a integral fica μf(u)du=P(Xμ)\int_\mu^\infty f(u)\,du = P(X \geq \mu). Logo P(Xμ)=P(Xμ)=1/2P(X \leq \mu) = P(X \geq \mu) = 1/2, portanto μ\mu é a mediana.
  39. Ex. 73.39Proof

    Mostre que para nn \to \infty e amostras iid de Uniforme(0,1), o estimador amostral de Q1Q_1 converge para 0,25. Use propriedades de estatísticas de ordem.

    Show solution
    Para XUniforme(0,1)X \sim \text{Uniforme}(0,1), as estatísticas de ordem têm distribuição X(k)Beta(k,nk+1)X_{(k)} \sim \text{Beta}(k, n-k+1). Em particular, X(n/4)Q1=0,25X_{(\lceil n/4 \rceil)} \to Q_1 = 0{,}25 quase certamente quando nn \to \infty pela lei dos grandes números. A variância de X(k)X_{(k)} é k(nk+1)/[(n+1)2(n+2)]k(n-k+1)/[(n+1)^2(n+2)], que vai a zero quando nn \to \infty.
  40. Ex. 73.40Proof

    Demonstre que a mediana minimiza E[Xc]E[|X - c|] sobre todos os valores cRc \in \mathbb{R}.

    Show solution
    A mediana minimiza E[Xc]E[|X - c|]. Prova: seja g(c)=E[Xc]=c(cx)f(x)dx+c(xc)f(x)dxg(c) = E[|X - c|] = \int_{-\infty}^c (c-x)f(x)\,dx + \int_c^\infty (x-c)f(x)\,dx. Derivando: g(c)=cf(x)dxcf(x)dx=F(c)(1F(c))=2F(c)1g'(c) = \int_{-\infty}^c f(x)\,dx - \int_c^\infty f(x)\,dx = F(c) - (1 - F(c)) = 2F(c) - 1. Igualando a zero: F(c)=1/2F(c) = 1/2, ou seja, c=medianac = \text{mediana}. Como g(c)=2f(c)>0g''(c) = 2f(c) > 0, é mínimo.

Fontes

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.