Lição 72 — Variância e desvio padrão
Dispersão estatística: quanto os dados se afastam da média. Variância populacional e amostral, desvio padrão, fórmula computacional, propriedades de linearidade e independência.
Used in: 2.º ano do EM (16-17 anos) · Equiv. Stochastik LK alemão · Equiv. Math B japonês · Equiv. H2 Statistics singapurense
A variância é a média dos desvios ao quadrado. Para uma população de valores com média , cada desvio é elevado ao quadrado — para que positivos e negativos não se cancelem — e tira-se a média. O desvio padrão devolve a dispersão na unidade original dos dados.
Rigorous notation, full derivation, hypotheses
Definição rigorosa
Variância e desvio padrão — população e amostra
"A variância é mais ou menos a distância quadrática média de cada ponto de dados até a média. A unidade associada à variância está em unidades quadráticas. Para que a medida de dispersão tenha as mesmas unidades que os dados, tomamos a raiz quadrada da variância, chamada de desvio padrão." — OpenIntro Statistics §2.1, Diez et al., CC-BY-SA.
"Nos problemas de estatística, geralmente não temos acesso a toda a população, por isso usamos os dados amostrais para estimar os parâmetros populacionais. Para isso, dividimos pelo grau de liberdade da amostra, , em vez de ." — OpenStax Statistics §2.7, Illowsky & Dean, CC-BY.
Propriedades algébricas
Representação geométrica — diagrama de dispersão
Dois conjuntos com mesma média mas dispersões distintas. Pontos afastados da linha pontilhada (média) geram variância alta; pontos agrupados geram variância baixa.
Exemplos resolvidos
Exercise list
40 exercises · 10 with worked solution (25%)
- Ex. 72.1Application
Calcule a variância populacional e o desvio padrão de .
Show solution
Média: . Desvios: . Quadrados: . Soma dos quadrados: . Variância: . Desvio padrão: .Show step-by-step (with the why)
- Calcule a média: . Por quê: a variância mede dispersão em torno da média, então precisamos dela primeiro.
- Subtraia a média de cada valor: , , . Esses são os desvios.
- Eleve cada desvio ao quadrado: , , . Por quê ao quadrado: para que desvios positivos e negativos não se cancelem.
- Calcule a média dos quadrados: . Essa é a variância populacional.
- Desvio padrão: . Macete: o desvio padrão sempre tem a mesma unidade dos dados originais.
- Ex. 72.2Application
Calcule a variância amostral e o desvio padrão amostral para .
Show solution
Dados: . Média . Desvios ao quadrado: . Soma . Variância amostral: . Desvio padrão: . - Ex. 72.3Application
Calcule o desvio padrão populacional de .
Show solution
Notas: . Média . Desvios: . Quadrados: . Soma . Variância: . Desvio padrão: . - Ex. 72.4ApplicationAnswer key
Qual a variância de ? Explique geometricamente.
Show solution
Todos os valores são iguais: . Média . Todos os desvios são . Logo . Um conjunto constante tem variância zero — não há dispersão. - Ex. 72.5ApplicationAnswer key
Calcule a variância populacional de .
Show solution
Dados: . Média . Desvios: . Quadrados: . Variância: . Desvio padrão: . - Ex. 72.6Application
Salários (mil R$): . Calcule média e desvio padrão amostral. Comente o efeito do outlier.
Show solution
Salários (mil R\$): . Média: . Desvios ao quadrado: . Soma . Desvio padrão amostral: mil R\$. O outlier (20) eleva a média de 3,8 para 6,5 e o desvio padrão fica maior que a maioria dos salários — sinal de que a média não representa bem este conjunto.Show step-by-step (with the why)
- Calcule a média dos 6 salários: mil R\$.
- Perceba o outlier: o valor 20 está muito acima dos demais (3 a 5). Isso vai inflacionar a variância.
- Calcule os desvios ao quadrado e some: .
- Variância amostral: . Desvio padrão: mil R\$.
- Observação: o desvio padrão (6,65) é maior que a maioria dos salários individuais (3–5). Isso indica que a média não é uma medida representativa — use mediana (4 mil R\$) para este tipo de distribuição assimétrica.
- Ex. 72.7Application
Use a fórmula computacional para calcular a variância de .
Show solution
Fórmula computacional: . Para : ; . Logo . - Ex. 72.8Application
Tempo de espera (min) em 8 atendimentos: . Calcule o desvio padrão amostral.
Show solution
Dados: (8 valores). Média: . Desvios ao quadrado: . Soma . Variância amostral: . Desvio padrão: min. - Ex. 72.9ApplicationAnswer key
Pesos (kg) de 6 melancias: . Calcule e .
Show solution
Pesos: kg. Média: . Desvios ao quadrado: . Soma . Variância amostral: . Desvio padrão: kg. - Ex. 72.10Application
assume valores com probabilidades . Calcule .
Show solution
assume valores 1, 2, 3 com probabilidades . . . . - Ex. 72.11Application
Dado honesto de 6 faces. Calcule .
Show solution
Dado honesto: , . . - Ex. 72.12ApplicationAnswer key
Soma de dois dados honestos independentes. Calcule usando a propriedade de independência.
Show solution
Dois dados independentes: . Pela independência: . Desvio padrão: . - Ex. 72.13Application
Temperatura máxima (°C) em 7 dias: . Calcule a variância amostral.
Show solution
Dados: (7 valores). Média: . Calcule os desvios ao quadrado, some e divida por 6. Resultado: , . - Ex. 72.14Application
Use a fórmula computacional para calcular a variância de .
Show solution
Valores: . Média: . . Variância: . Desvio padrão: .Show step-by-step (with the why)
- Calcule a média: .
- Calcule : some os quadrados e divida por 5: .
- Aplique a fórmula computacional: . Por quê: é equivalente à definição mas exige apenas uma soma auxiliar.
- Desvio padrão: . Macete: para sequências aritméticas , existe fórmula fechada para .
- Ex. 72.15ApplicationAnswer key
Se , calcule .
Show solution
Pela propriedade: . Com : . A translação (+5) não afeta a dispersão; a escala (×2) eleva a variância ao quadrado do fator. - Ex. 72.16Application
Se , qual o desvio padrão de ?
Show solution
. Desvio padrão: . Alternativamente: . - Ex. 72.17ApplicationAnswer key
, , e independentes. Calcule e .
Show solution
e independentes: . Para a diferença: . Subtrair não reduz dispersão quando as variáveis são independentes. - Ex. 72.18Application
Padronize se , . Calcule o escore .
Show solution
Escore z: . Um escore significa que o valor está 2 desvios padrão acima da média. - Ex. 72.19Application
(conversão Celsius para Fahrenheit). Se °C, qual ?
Show solution
Conversão linear: . Pela propriedade: . A translação (+32) não afeta o desvio padrão; apenas o fator de escala importa. - Ex. 72.20Application
Calcule o coeficiente de variação para alturas ( cm, cm) e pesos ( kg, kg). Qual conjunto é relativamente mais variável?
Show solution
Alturas: cm, cm; . Pesos: kg, kg; . Pesos são relativamente mais variáveis — maior.Show step-by-step (with the why)
- Calcule o CV de alturas: .
- Calcule o CV de pesos: .
- Compare: pesos têm CV maior, portanto são relativamente mais variáveis. Por quê: o CV é adimensional, permite comparar dispersões em unidades diferentes.
- Observação: o desvio padrão sozinho não serve para comparar — 8 cm parece "grande" mas 12 kg pode ser "pequeno" dependendo do contexto. CV normaliza pela média.
- Ex. 72.21Application
Padronize usando . Qual a média e o desvio padrão dos escores ?
Show solution
Escore z de cada valor: , , . Média dos : . Desvio padrão dos : ... na verdade para população: sempre que padronizamos pela própria média e desvio padrão. - Ex. 72.22Application
. Qual ?
Show solution
. Multiplicar por inverte os dados em torno de mas não altera as distâncias à média — dispersão é invariante sob reflexão. - Ex. 72.23ApplicationAnswer key
Média amostral de observações independentes com . Qual o desvio padrão da média?
Show solution
Para a média amostral de observações independentes com : . Desvio padrão da média: . - Ex. 72.24Application
Soma de 100 variáveis aleatórias iid com . Qual o desvio padrão da soma?
Show solution
Soma de 100 v.a. iid com : . Desvio padrão: . A lei da raiz quadrada: somar variáveis independentes multiplica a variância por e o desvio padrão por . - Ex. 72.25Understanding
Por que a variância amostral usa divisor em vez de ?
Show solution
Resposta A. Ao usar em vez de , os desvios são forçados a somar zero — perdemos um grau de liberdade. Dividir por subestima sistematicamente; o fator de correção remove esse viés. - Ex. 72.26Understanding
Para comparar dispersão entre salários (R$) e alturas (cm), prefere-se ou ? Por quê?
Show solution
Resposta A. O é adimensional — normaliza a dispersão pela magnitude da média. Comparar entre salários (R\$) e alturas (cm) não faz sentido; o remove as unidades e permite a comparação. - Ex. 72.27Understanding
Variância pode ser negativa?
Show solution
Resposta A. é soma de quadrados de reais, sempre . Só é zero quando todos os dados são iguais à média (conjunto constante). Mesmo que a média seja negativa, os quadrados dos desvios são não-negativos. - Ex. 72.28Modeling
Linha de produção: massa média 500 g, g. Tolerância g. Quantos a tolerância representa?
Show solution
Média g, g. Tolerância: g. Em número de desvios padrão: . A tolerância abrange — em distribuição normal, isso cobriria 99,7% das peças. - Ex. 72.29ModelingAnswer key
Dois fundos com retorno esperado 8%, mas e . Qual escolher como avesso ao risco? Por quê?
Show solution
Dois fundos, mesmo retorno 8%. Fundo A: (menor risco). Fundo B: (maior risco). Avesso ao risco: escolher Fundo A. O mesmo retorno esperado com menor volatilidade é preferível segundo a teoria de Markowitz (variância como medida de risco). - Ex. 72.30Modeling
Você mede uma resistência 10 vezes: , . Estime o desvio padrão da média.
Show solution
Desvio padrão da média de medições independentes: . Essa é a **incerteza padrão** da medição. - Ex. 72.31Modeling
Tempo de viagem casa-trabalho: min, min. Usando a desigualdade de Chebyshev como cota conservadora, quantos minutos antes deve sair para ter ao menos 95% de chance de chegar a tempo?
Show solution
Tempo de viagem: min, min. Queremos cota para chegar a tempo com 95% de probabilidade. Chebyshev: . Para margem de 95%: . Logo, sair min antes. (Usando distribuição normal: 1,65σ = 8,3 min seria suficiente — Chebyshev é muito conservador.) - Ex. 72.32Modeling
Processo Six Sigma: mm, tolerância a mm. Qual o maior que ainda satisfaz a exigência Six Sigma?
Show solution
Six Sigma exige que a tolerância seja pelo menos a partir da média. Tolerância total: mm por lado. Então mm. O maior compatível com Six Sigma é mm. - Ex. 72.33ModelingAnswer key
Ações A: ; Ações B: . Carteira 50-50, correlação zero. Variância da carteira.
Show solution
Carteira 50-50 com independência: . . . Menor que a média das volatilidades individuais (1,5%) — o efeito da diversificação. - Ex. 72.34Modeling
Mesma carteira do exercício anterior, mas com correlação entre as ações. Variância. Compare com o caso de correlação zero.
Show solution
Com correlação : . . Menor ainda — correlação negativa amplifica o benefício da diversificação. - Ex. 72.35Modeling
Em aprendizado de máquina, por que features com diferentes escalas devem ser padronizadas antes de treinar modelos baseados em gradiente?
Show solution
Padronizar features com diferentes escalas (ex.: salário 0–100k vs. idade 0–100) evita que features com maior magnitude dominem o gradiente. Após padronização, cada feature tem e — descida de gradiente converge mais rápida e equilibradamente. Feature com teria gradiente ~10.000x menor sem padronização, tornando-a efetivamente invisível para o otimizador. - Ex. 72.36Modeling
Notas do ENEM em Matemática: , pontos. Um aluno tirou 740. Calcule o escore e interprete (em quantos desvios padrão acima da média ele está?).
Show solution
ENEM 2023 (exemplo hipotético com distribuição conhecida): notas em Matemática historicamente têm , . Um aluno com nota 740 tem escore — dois desvios padrão acima da média, percentil aproximado 97,7% (usando tabela normal). - Ex. 72.37Proof
Demonstre que a partir da definição .
Show solution
Partindo da definição: . Pela linearidade de : . - Ex. 72.38Proof
Demonstre que para quaisquer constantes .
Show solution
Por definição: . Então . - Ex. 72.39ProofAnswer key
Demonstre que quando e são independentes.
Show solution
Para independentes: . Então . - Ex. 72.40Proof
Demonstre a desigualdade de Chebyshev: para .
Show solution
Seja . Então , onde a última desigualdade usa que sobre temos . Dividindo por : .
Fontes
-
OpenIntro Statistics (4ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA. Fonte primária desta lição. §2.1–§2.2 cobrem variância amostral, desvio padrão, boxplot e exemplos aplicados.
-
Statistics (OpenStax) — Illowsky, Dean · CC-BY. §2.7 cobre medidas de dispersão, fórmula computacional, exercícios com calculadora e dados educacionais/saúde.
-
Introduction to Probability — Grinstead & Snell (Dartmouth) — GNU FDL. Ch. 6 cobre variância de variáveis aleatórias discretas, propriedades algébricas, Chebyshev e conexão com lei dos grandes números.