Math ClubMath Club
v1 · padrão canônico

Lição 72 — Variância e desvio padrão

Dispersão estatística: quanto os dados se afastam da média. Variância populacional e amostral, desvio padrão, fórmula computacional, propriedades de linearidade e independência.

Used in: 2.º ano do EM (16-17 anos) · Equiv. Stochastik LK alemão · Equiv. Math B japonês · Equiv. H2 Statistics singapurense

σ2=1ni=1n(xixˉ)2\sigma^2 = \frac{1}{n}\sum_{i=1}^{n}(x_i - \bar{x})^2

A variância é a média dos desvios ao quadrado. Para uma população de nn valores com média xˉ\bar{x}, cada desvio (xixˉ)(x_i - \bar{x}) é elevado ao quadrado — para que positivos e negativos não se cancelem — e tira-se a média. O desvio padrão σ=σ2\sigma = \sqrt{\sigma^2} devolve a dispersão na unidade original dos dados.

Choose your door

Rigorous notation, full derivation, hypotheses

Definição rigorosa

Variância e desvio padrão — população e amostra

"A variância é mais ou menos a distância quadrática média de cada ponto de dados até a média. A unidade associada à variância está em unidades quadráticas. Para que a medida de dispersão tenha as mesmas unidades que os dados, tomamos a raiz quadrada da variância, chamada de desvio padrão." — OpenIntro Statistics §2.1, Diez et al., CC-BY-SA.

"Nos problemas de estatística, geralmente não temos acesso a toda a população, por isso usamos os dados amostrais para estimar os parâmetros populacionais. Para isso, dividimos pelo grau de liberdade da amostra, n1n-1, em vez de nn." — OpenStax Statistics §2.7, Illowsky & Dean, CC-BY.

Propriedades algébricas

Representação geométrica — diagrama de dispersão

Alta dispersão (grande σ)μBaixa dispersão (pequeno σ)μ

Dois conjuntos com mesma média mas dispersões distintas. Pontos afastados da linha pontilhada (média) geram variância alta; pontos agrupados geram variância baixa.

Exemplos resolvidos

Exercise list

40 exercises · 10 with worked solution (25%)

Application 24Understanding 3Modeling 9Proof 4
  1. Ex. 72.1Application

    Calcule a variância populacional e o desvio padrão de {4,6,8}\{4, 6, 8\}.

    Show solution
    Média: μ=(4+6+8)/3=6\mu = (4+6+8)/3 = 6. Desvios: 2,0,+2-2, 0, +2. Quadrados: 4,0,44, 0, 4. Soma dos quadrados: 88. Variância: σ2=8/32,67\sigma^2 = 8/3 \approx 2{,}67. Desvio padrão: σ=8/31,63\sigma = \sqrt{8/3} \approx 1{,}63.
    Show step-by-step (with the why)
    1. Calcule a média: μ=(4+6+8)/3=18/3=6\mu = (4+6+8)/3 = 18/3 = 6. Por quê: a variância mede dispersão em torno da média, então precisamos dela primeiro.
    2. Subtraia a média de cada valor: 46=24-6=-2, 66=06-6=0, 86=28-6=2. Esses são os desvios.
    3. Eleve cada desvio ao quadrado: (2)2=4(-2)^2=4, 02=00^2=0, 22=42^2=4. Por quê ao quadrado: para que desvios positivos e negativos não se cancelem.
    4. Calcule a média dos quadrados: (4+0+4)/3=8/3(4+0+4)/3 = 8/3. Essa é a variância populacional.
    5. Desvio padrão: σ=8/31,63\sigma = \sqrt{8/3} \approx 1{,}63. Macete: o desvio padrão sempre tem a mesma unidade dos dados originais.
  2. Ex. 72.2Application

    Calcule a variância amostral s2s^2 e o desvio padrão amostral ss para {2,4,4,4,5,5,7,9}\{2, 4, 4, 4, 5, 5, 7, 9\}.

    Show solution
    Dados: 2,4,4,4,5,5,7,92, 4, 4, 4, 5, 5, 7, 9. Média xˉ=40/8=5\bar x = 40/8 = 5. Desvios ao quadrado: 9,1,1,1,0,0,4,169,1,1,1,0,0,4,16. Soma =32= 32. Variância amostral: s2=32/74,57s^2 = 32/7 \approx 4{,}57. Desvio padrão: s2,14s \approx 2{,}14.
  3. Ex. 72.3Application

    Calcule o desvio padrão populacional de {5,6,7,8,9}\{5, 6, 7, 8, 9\}.

    Show solution
    Notas: 5,6,7,8,95, 6, 7, 8, 9. Média μ=35/5=7\mu = 35/5 = 7. Desvios: 2,1,0,1,2-2,-1,0,1,2. Quadrados: 4,1,0,1,44,1,0,1,4. Soma =10= 10. Variância: σ2=10/5=2\sigma^2 = 10/5 = 2. Desvio padrão: σ=21,41\sigma = \sqrt{2} \approx 1{,}41.
  4. Ex. 72.4ApplicationAnswer key

    Qual a variância de {10,10,10,10}\{10, 10, 10, 10\}? Explique geometricamente.

    Show solution
    Todos os valores são iguais: {10,10,10,10}\{10, 10, 10, 10\}. Média μ=10\mu = 10. Todos os desvios são 1010=010 - 10 = 0. Logo σ2=0\sigma^2 = 0. Um conjunto constante tem variância zero — não há dispersão.
  5. Ex. 72.5ApplicationAnswer key

    Calcule a variância populacional de {0,100}\{0, 100\}.

    Show solution
    Dados: {0,100}\{0, 100\}. Média μ=50\mu = 50. Desvios: 50,+50-50, +50. Quadrados: 2500,25002500, 2500. Variância: σ2=5000/2=2500\sigma^2 = 5000/2 = 2500. Desvio padrão: σ=50\sigma = 50.
  6. Ex. 72.6Application

    Salários (mil R$): 3,3,4,4,5,203, 3, 4, 4, 5, 20. Calcule média e desvio padrão amostral. Comente o efeito do outlier.

    Show solution
    Salários (mil R\$): 3,3,4,4,5,203, 3, 4, 4, 5, 20. Média: (3+3+4+4+5+20)/6=39/6=6,5(3+3+4+4+5+20)/6 = 39/6 = 6{,}5. Desvios ao quadrado: 12,25;12,25;6,25;6,25;2,25;182,2512{,}25; 12{,}25; 6{,}25; 6{,}25; 2{,}25; 182{,}25. Soma =221,5= 221{,}5. Desvio padrão amostral: s=221,5/56,65s = \sqrt{221{,}5/5} \approx 6{,}65 mil R\$. O outlier (20) eleva a média de 3,8 para 6,5 e o desvio padrão fica maior que a maioria dos salários — sinal de que a média não representa bem este conjunto.
    Show step-by-step (with the why)
    1. Calcule a média dos 6 salários: (3+3+4+4+5+20)/6=6,5(3+3+4+4+5+20)/6 = 6{,}5 mil R\$.
    2. Perceba o outlier: o valor 20 está muito acima dos demais (3 a 5). Isso vai inflacionar a variância.
    3. Calcule os desvios ao quadrado e some: 12,25+12,25+6,25+6,25+2,25+182,25=221,512{,}25 + 12{,}25 + 6{,}25 + 6{,}25 + 2{,}25 + 182{,}25 = 221{,}5.
    4. Variância amostral: s2=221,5/5=44,3s^2 = 221{,}5/5 = 44{,}3. Desvio padrão: s6,65s \approx 6{,}65 mil R\$.
    5. Observação: o desvio padrão (6,65) é maior que a maioria dos salários individuais (3–5). Isso indica que a média não é uma medida representativa — use mediana (4 mil R\$) para este tipo de distribuição assimétrica.
  7. Ex. 72.7Application

    Use a fórmula computacional x2xˉ2\overline{x^2} - \bar{x}^2 para calcular a variância de {1,2,3,4,5}\{1, 2, 3, 4, 5\}.

    Show solution
    Fórmula computacional: σ2=x2xˉ2\sigma^2 = \overline{x^2} - \bar x^2. Para {1,2,3,4,5}\{1,2,3,4,5\}: xˉ=3\bar x = 3; x2=(1+4+9+16+25)/5=11\overline{x^2} = (1+4+9+16+25)/5 = 11. Logo σ2=119=2\sigma^2 = 11 - 9 = 2.
  8. Ex. 72.8Application

    Tempo de espera (min) em 8 atendimentos: 5,7,6,8,4,5,6,75, 7, 6, 8, 4, 5, 6, 7. Calcule o desvio padrão amostral.

    Show solution
    Dados: 5,7,6,8,4,5,6,75, 7, 6, 8, 4, 5, 6, 7 (8 valores). Média: xˉ=48/8=6\bar x = 48/8 = 6. Desvios ao quadrado: 1,1,0,4,4,1,0,11,1,0,4,4,1,0,1. Soma =12= 12. Variância amostral: s2=12/71,71s^2 = 12/7 \approx 1{,}71. Desvio padrão: s1,31s \approx 1{,}31 min.
  9. Ex. 72.9ApplicationAnswer key

    Pesos (kg) de 6 melancias: 8,9,9,10,11,138, 9, 9, 10, 11, 13. Calcule s2s^2 e ss.

    Show solution
    Pesos: 8,9,9,10,11,138, 9, 9, 10, 11, 13 kg. Média: xˉ=60/6=10\bar x = 60/6 = 10. Desvios ao quadrado: 4,1,1,0,1,94,1,1,0,1,9. Soma =16= 16. Variância amostral: s2=16/5=3,2s^2 = 16/5 = 3{,}2. Desvio padrão: s=3,21,79s = \sqrt{3{,}2} \approx 1{,}79 kg.
  10. Ex. 72.10Application

    XX assume valores 1,2,31, 2, 3 com probabilidades 12,14,14\frac{1}{2}, \frac{1}{4}, \frac{1}{4}. Calcule Var(X)\text{Var}(X).

    Show solution
    XX assume valores 1, 2, 3 com probabilidades 1/2,1/4,1/41/2, 1/4, 1/4. E[X]=112+214+314=12+12+34=74E[X] = 1\cdot\frac{1}{2} + 2\cdot\frac{1}{4} + 3\cdot\frac{1}{4} = \frac{1}{2}+\frac{1}{2}+\frac{3}{4} = \frac{7}{4}. E[X2]=112+414+914=12+1+94=154E[X^2] = 1\cdot\frac{1}{2} + 4\cdot\frac{1}{4} + 9\cdot\frac{1}{4} = \frac{1}{2}+1+\frac{9}{4} = \frac{15}{4}. Var(X)=154(74)2=1544916=604916=1116\text{Var}(X) = \frac{15}{4} - \left(\frac{7}{4}\right)^2 = \frac{15}{4} - \frac{49}{16} = \frac{60-49}{16} = \frac{11}{16}.
  11. Ex. 72.11Application

    Dado honesto de 6 faces. Calcule Var(X)\text{Var}(X).

    Show solution
    Dado honesto: E[X]=7/2E[X] = 7/2, E[X2]=(1+4+9+16+25+36)/6=91/6E[X^2] = (1+4+9+16+25+36)/6 = 91/6. Var(X)=91/6(7/2)2=91/649/4=182/12147/12=35/12\text{Var}(X) = 91/6 - (7/2)^2 = 91/6 - 49/4 = 182/12 - 147/12 = 35/12.
  12. Ex. 72.12ApplicationAnswer key

    Soma de dois dados honestos independentes. Calcule Var(S)\text{Var}(S) usando a propriedade de independência.

    Show solution
    Dois dados independentes: S=X1+X2S = X_1 + X_2. Pela independência: Var(S)=Var(X1)+Var(X2)=35/12+35/12=35/6\text{Var}(S) = \text{Var}(X_1) + \text{Var}(X_2) = 35/12 + 35/12 = 35/6. Desvio padrão: σS=35/62,42\sigma_S = \sqrt{35/6} \approx 2{,}42.
  13. Ex. 72.13Application

    Temperatura máxima (°C) em 7 dias: 10,7,4,9,8,11,510, 7, 4, 9, 8, 11, 5. Calcule a variância amostral.

    Show solution
    Dados: 10,7,4,9,8,11,510, 7, 4, 9, 8, 11, 5 (7 valores). Média: xˉ=54/77,71\bar x = 54/7 \approx 7{,}71. Calcule os desvios ao quadrado, some e divida por 6. Resultado: s214,8s^2 \approx 14{,}8, s3,85s \approx 3{,}85.
  14. Ex. 72.14Application

    Use a fórmula computacional E[X2](E[X])2E[X^2] - (E[X])^2 para calcular a variância de {1,3,5,7,9}\{1, 3, 5, 7, 9\}.

    Show solution
    Valores: 1,3,5,7,91, 3, 5, 7, 9. Média: xˉ=5\bar x = 5. E[X2]=(1+9+25+49+81)/5=165/5=33E[X^2] = (1+9+25+49+81)/5 = 165/5 = 33. Variância: σ2=3325=8\sigma^2 = 33 - 25 = 8. Desvio padrão: σ=8=222,83\sigma = \sqrt{8} = 2\sqrt{2} \approx 2{,}83.
    Show step-by-step (with the why)
    1. Calcule a média: xˉ=(1+3+5+7+9)/5=25/5=5\bar x = (1+3+5+7+9)/5 = 25/5 = 5.
    2. Calcule E[X2]E[X^2]: some os quadrados e divida por 5: (1+9+25+49+81)/5=165/5=33(1+9+25+49+81)/5 = 165/5 = 33.
    3. Aplique a fórmula computacional: σ2=E[X2]xˉ2=3325=8\sigma^2 = E[X^2] - \bar x^2 = 33 - 25 = 8. Por quê: é equivalente à definição mas exige apenas uma soma auxiliar.
    4. Desvio padrão: σ=8=22\sigma = \sqrt{8} = 2\sqrt{2}. Macete: para sequências aritméticas {a,a+d,a+2d,}\{a, a+d, a+2d, \ldots\}, existe fórmula fechada para σ\sigma.
  15. Ex. 72.15ApplicationAnswer key

    Se Var(X)=9\text{Var}(X) = 9, calcule Var(2X+5)\text{Var}(2X + 5).

    Show solution
    Pela propriedade: Var(aX+b)=a2Var(X)\text{Var}(aX+b) = a^2 \text{Var}(X). Com a=2,b=5,Var(X)=9a=2, b=5, \text{Var}(X)=9: Var(2X+5)=4×9=36\text{Var}(2X+5) = 4 \times 9 = 36. A translação (+5) não afeta a dispersão; a escala (×2) eleva a variância ao quadrado do fator.
  16. Ex. 72.16Application

    Se σX=4\sigma_X = 4, qual o desvio padrão de 3X3X?

    Show solution
    Var(3X)=9Var(X)=9×16=144\text{Var}(3X) = 9 \text{Var}(X) = 9 \times 16 = 144. Desvio padrão: σ3X=144=12\sigma_{3X} = \sqrt{144} = 12. Alternativamente: σ3X=3σX=3×4=12\sigma_{3X} = |3| \sigma_X = 3 \times 4 = 12.
  17. Ex. 72.17ApplicationAnswer key

    Var(X)=4\text{Var}(X) = 4, Var(Y)=9\text{Var}(Y) = 9, XX e YY independentes. Calcule Var(X+Y)\text{Var}(X+Y) e Var(XY)\text{Var}(X-Y).

    Show solution
    XX e YY independentes: Var(X+Y)=Var(X)+Var(Y)=4+9=13\text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y) = 4+9 = 13. Para a diferença: Var(XY)=Var(X)+(1)2Var(Y)=4+9=13\text{Var}(X-Y) = \text{Var}(X) + (-1)^2 \text{Var}(Y) = 4+9 = 13. Subtrair não reduz dispersão quando as variáveis são independentes.
  18. Ex. 72.18Application

    Padronize X=80X = 80 se μ=70\mu = 70, σ=5\sigma = 5. Calcule o escore zz.

    Show solution
    Escore z: z=(xμ)/σ=(8070)/5=10/5=2z = (x - \mu)/\sigma = (80 - 70)/5 = 10/5 = 2. Um escore z=2z = 2 significa que o valor está 2 desvios padrão acima da média.
  19. Ex. 72.19Application

    F=1,8C+32F = 1{,}8C + 32 (conversão Celsius para Fahrenheit). Se σC=5\sigma_C = 5°C, qual σF\sigma_F?

    Show solution
    Conversão linear: F=1,8C+32F = 1{,}8C + 32. Pela propriedade: σF=1,8σC=1,8×5=9\sigma_F = |1{,}8| \cdot \sigma_C = 1{,}8 \times 5 = 9. A translação (+32) não afeta o desvio padrão; apenas o fator de escala importa.
  20. Ex. 72.20Application

    Calcule o coeficiente de variação CV=σ/μCV = \sigma/\mu para alturas (μ=170\mu = 170 cm, σ=8\sigma = 8 cm) e pesos (μ=70\mu = 70 kg, σ=12\sigma = 12 kg). Qual conjunto é relativamente mais variável?

    Show solution
    Alturas: μ=170\mu = 170 cm, σ=8\sigma = 8 cm; CV=8/1704,7%CV = 8/170 \approx 4{,}7\%. Pesos: μ=70\mu = 70 kg, σ=12\sigma = 12 kg; CV=12/7017,1%CV = 12/70 \approx 17{,}1\%. Pesos são relativamente mais variáveis — CVCV maior.
    Show step-by-step (with the why)
    1. Calcule o CV de alturas: CV=σ/μ=8/1700,047=4,7%CV = \sigma/\mu = 8/170 \approx 0{,}047 = 4{,}7\%.
    2. Calcule o CV de pesos: CV=12/700,171=17,1%CV = 12/70 \approx 0{,}171 = 17{,}1\%.
    3. Compare: pesos têm CV maior, portanto são relativamente mais variáveis. Por quê: o CV é adimensional, permite comparar dispersões em unidades diferentes.
    4. Observação: o desvio padrão sozinho não serve para comparar — 8 cm parece "grande" mas 12 kg pode ser "pequeno" dependendo do contexto. CV normaliza pela média.
  21. Ex. 72.21Application

    Padronize {60,70,80}\{60, 70, 80\} usando μ=70,σ=10\mu = 70, \sigma = 10. Qual a média e o desvio padrão dos escores zz?

    Show solution
    Escore z de cada valor: (6070)/10=1(60-70)/10 = -1, (7070)/10=0(70-70)/10 = 0, (8070)/10=1(80-70)/10 = 1. Média dos zz: (1+0+1)/3=0(-1+0+1)/3 = 0. Desvio padrão dos zz: (1+0+1)/3=2/3\sqrt{(1+0+1)/3} = \sqrt{2/3}... na verdade para população: σz=1\sigma_z = 1 sempre que padronizamos pela própria média e desvio padrão.
  22. Ex. 72.22Application

    Var(X)=16\text{Var}(X) = 16. Qual Var(X)\text{Var}(-X)?

    Show solution
    Var(X)=(1)2Var(X)=Var(X)=16\text{Var}(-X) = (-1)^2 \text{Var}(X) = \text{Var}(X) = 16. Multiplicar por 1-1 inverte os dados em torno de μ-\mu mas não altera as distâncias à média — dispersão é invariante sob reflexão.
  23. Ex. 72.23ApplicationAnswer key

    Média amostral de n=25n = 25 observações independentes com σ=10\sigma = 10. Qual o desvio padrão da média?

    Show solution
    Para a média amostral de n=25n = 25 observações independentes com σ=10\sigma = 10: Var(Xˉ)=σ2/n=100/25=4\text{Var}(\bar X) = \sigma^2/n = 100/25 = 4. Desvio padrão da média: σXˉ=4=2\sigma_{\bar X} = \sqrt{4} = 2.
  24. Ex. 72.24Application

    Soma de 100 variáveis aleatórias iid com σ=1\sigma = 1. Qual o desvio padrão da soma?

    Show solution
    Soma de 100 v.a. iid com σ=1\sigma = 1: Var(S)=100σ2=100\text{Var}(S) = 100 \sigma^2 = 100. Desvio padrão: σS=100=10\sigma_S = \sqrt{100} = 10. A lei da raiz quadrada: somar nn variáveis independentes multiplica a variância por nn e o desvio padrão por n\sqrt{n}.
  25. Ex. 72.25Understanding

    Por que a variância amostral usa divisor n1n-1 em vez de nn?

    Select the correct option
    Select an option first
    Show solution
    Resposta A. Ao usar xˉ\bar x em vez de μ\mu, os desvios (xixˉ)(x_i - \bar x) são forçados a somar zero — perdemos um grau de liberdade. Dividir por nn subestima σ2\sigma^2 sistematicamente; o fator de correção n/(n1)n/(n-1) remove esse viés.
  26. Ex. 72.26Understanding

    Para comparar dispersão entre salários (R$) e alturas (cm), prefere-se σ\sigma ou CVCV? Por quê?

    Select the correct option
    Select an option first
    Show solution
    Resposta A. O CV=σ/μCV = \sigma/\mu é adimensional — normaliza a dispersão pela magnitude da média. Comparar σ\sigma entre salários (R\$) e alturas (cm) não faz sentido; o CVCV remove as unidades e permite a comparação.
  27. Ex. 72.27Understanding

    Variância pode ser negativa?

    Select the correct option
    Select an option first
    Show solution
    Resposta A. σ2=1n(xixˉ)2\sigma^2 = \frac{1}{n}\sum (x_i - \bar x)^2 é soma de quadrados de reais, sempre 0\geq 0. Só é zero quando todos os dados são iguais à média (conjunto constante). Mesmo que a média seja negativa, os quadrados dos desvios são não-negativos.
  28. Ex. 72.28Modeling

    Linha de produção: massa média 500 g, σ=5\sigma = 5 g. Tolerância ±15\pm 15 g. Quantos σ\sigma a tolerância representa?

    Show solution
    Média μ=500\mu = 500 g, σ=5\sigma = 5 g. Tolerância: ±15\pm 15 g. Em número de desvios padrão: 15/5=3σ15/5 = 3\sigma. A tolerância abrange μ±3σ\mu \pm 3\sigma — em distribuição normal, isso cobriria 99,7% das peças.
  29. Ex. 72.29ModelingAnswer key

    Dois fundos com retorno esperado 8%, mas σA=5%\sigma_A = 5\% e σB=15%\sigma_B = 15\%. Qual escolher como avesso ao risco? Por quê?

    Show solution
    Dois fundos, mesmo retorno 8%. Fundo A: σA=5%\sigma_A = 5\% (menor risco). Fundo B: σB=15%\sigma_B = 15\% (maior risco). Avesso ao risco: escolher Fundo A. O mesmo retorno esperado com menor volatilidade é preferível segundo a teoria de Markowitz (variância como medida de risco).
  30. Ex. 72.30Modeling

    Você mede uma resistência 10 vezes: Rˉ=100Ω\bar{R} = 100\,\Omega, s=0,5Ωs = 0{,}5\,\Omega. Estime o desvio padrão da média.

    Show solution
    Desvio padrão da média de n=10n = 10 medições independentes: σRˉ=s/n=0,5/100,158 Ω\sigma_{\bar R} = s/\sqrt{n} = 0{,}5/\sqrt{10} \approx 0{,}158\ \Omega. Essa é a **incerteza padrão** da medição.
  31. Ex. 72.31Modeling

    Tempo de viagem casa-trabalho: μ=30\mu = 30 min, σ=5\sigma = 5 min. Usando a desigualdade de Chebyshev como cota conservadora, quantos minutos antes deve sair para ter ao menos 95% de chance de chegar a tempo?

    Show solution
    Tempo de viagem: μ=30\mu = 30 min, σ=5\sigma = 5 min. Queremos cota para chegar a tempo com 95% de probabilidade. Chebyshev: P(X30kσ)1/k2P(|X-30| \geq k\sigma) \leq 1/k^2. Para margem de 95%: 1/k20,05k204,51/k^2 \leq 0{,}05 \Rightarrow k \geq \sqrt{20} \approx 4{,}5. Logo, sair 30+4,5×5=52,530 + 4{,}5 \times 5 = 52{,}5 min antes. (Usando distribuição normal: 1,65σ = 8,3 min seria suficiente — Chebyshev é muito conservador.)
  32. Ex. 72.32Modeling

    Processo Six Sigma: μ=10,00\mu = 10{,}00 mm, tolerância 9,949{,}94 a 10,0610{,}06 mm. Qual o maior σ\sigma que ainda satisfaz a exigência Six Sigma?

    Show solution
    Six Sigma exige que a tolerância seja pelo menos 6σ6\sigma a partir da média. Tolerância total: 10,0610,00=0,0610{,}06 - 10{,}00 = 0{,}06 mm por lado. Então 6σ0,06σ0,016\sigma \leq 0{,}06 \Rightarrow \sigma \leq 0{,}01 mm. O maior σ\sigma compatível com Six Sigma é σ=0,01\sigma = 0{,}01 mm.
  33. Ex. 72.33ModelingAnswer key

    Ações A: σA=1%\sigma_A = 1\%; Ações B: σB=2%\sigma_B = 2\%. Carteira 50-50, correlação zero. Variância da carteira.

    Show solution
    Carteira 50-50 com independência: R=0,5A+0,5BR = 0{,}5 A + 0{,}5 B. Var(R)=0,52σA2+0,52σB2=0,25×1+0,25×4=1,25 %2\text{Var}(R) = 0{,}5^2 \sigma_A^2 + 0{,}5^2 \sigma_B^2 = 0{,}25 \times 1 + 0{,}25 \times 4 = 1{,}25\ \%^2. σR=1,251,12%\sigma_R = \sqrt{1{,}25} \approx 1{,}12\%. Menor que a média das volatilidades individuais (1,5%) — o efeito da diversificação.
  34. Ex. 72.34Modeling

    Mesma carteira do exercício anterior, mas com correlação 0,5-0{,}5 entre as ações. Variância. Compare com o caso de correlação zero.

    Show solution
    Com correlação ρ=0,5\rho = -0{,}5: Var(R)=0,25σA2+0,25σB2+2(0,5)(0,5)ρσAσB=0,25+1+2(0,25)(0,5)(1)(2)=1,250,5=0,75 %2\text{Var}(R) = 0{,}25\sigma_A^2 + 0{,}25\sigma_B^2 + 2(0{,}5)(0{,}5)\rho\sigma_A\sigma_B = 0{,}25 + 1 + 2(0{,}25)(-0{,}5)(1)(2) = 1{,}25 - 0{,}5 = 0{,}75\ \%^2. σR0,87%\sigma_R \approx 0{,}87\%. Menor ainda — correlação negativa amplifica o benefício da diversificação.
  35. Ex. 72.35Modeling

    Em aprendizado de máquina, por que features com diferentes escalas devem ser padronizadas antes de treinar modelos baseados em gradiente?

    Show solution
    Padronizar features com diferentes escalas (ex.: salário 0–100k vs. idade 0–100) evita que features com maior magnitude dominem o gradiente. Após padronização, cada feature tem μ=0\mu = 0 e σ=1\sigma = 1 — descida de gradiente converge mais rápida e equilibradamente. Feature com σ=0,01\sigma = 0{,}01 teria gradiente ~10.000x menor sem padronização, tornando-a efetivamente invisível para o otimizador.
  36. Ex. 72.36Modeling

    Notas do ENEM em Matemática: μ520\mu \approx 520, σ110\sigma \approx 110 pontos. Um aluno tirou 740. Calcule o escore zz e interprete (em quantos desvios padrão acima da média ele está?).

    Show solution
    ENEM 2023 (exemplo hipotético com distribuição conhecida): notas em Matemática historicamente têm μ520\mu \approx 520, σ110\sigma \approx 110. Um aluno com nota 740 tem escore z=(740520)/110=2z = (740-520)/110 = 2 — dois desvios padrão acima da média, percentil aproximado 97,7% (usando tabela normal).
  37. Ex. 72.37Proof

    Demonstre que Var(X)=E[X2](E[X])2\text{Var}(X) = E[X^2] - (E[X])^2 a partir da definição Var(X)=E[(Xμ)2]\text{Var}(X) = E[(X-\mu)^2].

    Show solution
    Partindo da definição: Var(X)=E[(Xμ)2]=E[X22μX+μ2]\text{Var}(X) = E[(X-\mu)^2] = E[X^2 - 2\mu X + \mu^2]. Pela linearidade de EE: =E[X2]2μE[X]+μ2=E[X2]2μ2+μ2=E[X2]μ2=E[X2](E[X])2= E[X^2] - 2\mu E[X] + \mu^2 = E[X^2] - 2\mu^2 + \mu^2 = E[X^2] - \mu^2 = E[X^2] - (E[X])^2. \square
  38. Ex. 72.38Proof

    Demonstre que Var(aX+b)=a2Var(X)\text{Var}(aX + b) = a^2\,\text{Var}(X) para quaisquer constantes a,ba, b.

    Show solution
    Por definição: E[aX+b]=aE[X]+b=aμ+bE[aX+b] = aE[X]+b = a\mu+b. Então Var(aX+b)=E[(aX+baμb)2]=E[(a(Xμ))2]=a2E[(Xμ)2]=a2Var(X)\text{Var}(aX+b) = E[(aX+b - a\mu - b)^2] = E[(a(X-\mu))^2] = a^2 E[(X-\mu)^2] = a^2 \text{Var}(X). \square
  39. Ex. 72.39ProofAnswer key

    Demonstre que Var(X+Y)=Var(X)+Var(Y)\text{Var}(X + Y) = \text{Var}(X) + \text{Var}(Y) quando XX e YY são independentes.

    Show solution
    Para X,YX, Y independentes: E[XY]=E[X]E[Y]E[XY] = E[X]E[Y]. Então Var(X+Y)=E[(X+Y)2](E[X+Y])2=E[X2]+2E[XY]+E[Y2](μX+μY)2=(E[X2]μX2)+(E[Y2]μY2)+2(E[XY]μXμY)=Var(X)+Var(Y)+0\text{Var}(X+Y) = E[(X+Y)^2] - (E[X+Y])^2 = E[X^2]+2E[XY]+E[Y^2] - (\mu_X+\mu_Y)^2 = (E[X^2]-\mu_X^2) + (E[Y^2]-\mu_Y^2) + 2(E[XY]-\mu_X\mu_Y) = \text{Var}(X) + \text{Var}(Y) + 0. \square
  40. Ex. 72.40Proof

    Demonstre a desigualdade de Chebyshev: P(Xμkσ)1k2P(|X - \mu| \geq k\sigma) \leq \dfrac{1}{k^2} para k>0k > 0.

    Show solution
    Seja A={Xμkσ}A = \{|X - \mu| \geq k\sigma\}. Então σ2=E[(Xμ)2]E[(Xμ)21A]k2σ2P(A)\sigma^2 = E[(X-\mu)^2] \geq E[(X-\mu)^2 \mathbf{1}_A] \geq k^2\sigma^2 P(A), onde a última desigualdade usa que sobre AA temos (Xμ)2k2σ2(X-\mu)^2 \geq k^2\sigma^2. Dividindo por σ2\sigma^2: P(A)1/k2P(A) \leq 1/k^2. \square

Fontes

  • OpenIntro Statistics (4ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA. Fonte primária desta lição. §2.1–§2.2 cobrem variância amostral, desvio padrão, boxplot e exemplos aplicados.

  • Statistics (OpenStax) — Illowsky, Dean · CC-BY. §2.7 cobre medidas de dispersão, fórmula computacional, exercícios com calculadora e dados educacionais/saúde.

  • Introduction to Probability — Grinstead & Snell (Dartmouth) — GNU FDL. Ch. 6 cobre variância de variáveis aleatórias discretas, propriedades algébricas, Chebyshev e conexão com lei dos grandes números.

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.