Lição 78 — Correlação e regressão linear simples
Coeficiente de Pearson r, covariância, reta de mínimos quadrados, coeficiente de determinação r². Correlação não é causalidade — o teorema de Anscombe, o quarteto que todo cientista deve conhecer.
Used in: 2.º ano do EM (16-17 anos) · Stochastik LK alemão §12 · H2 Math singapurense §19 · AP Statistics USA §3
Rigorous notation, full derivation, hypotheses
Definições e propriedades rigorosas
Covariância
"The covariance is a measure of the joint variability of two random variables. If the greater values of one variable mainly correspond with the greater values of the other variable, and the same holds for the lesser values, the covariance is positive." — OpenStax Statistics, §12.1
Coeficiente de correlação de Pearson
Quatro diagramas de dispersão com diferentes valores de r. A nuvem de pontos concentra-se mais em torno de uma reta quando |r| é próximo de 1.
Reta de mínimos quadrados (OLS)
Coeficiente de determinação
Hipóteses LINE
Exemplos resolvidos
Exercise list
32 exercises · 8 with worked solution (25%)
- Ex. 78.1ApplicationAnswer key
, . Calcule sem usar calculadora e justifique o resultado.
- Ex. 78.2Application
, . Calcule e identifique o sinal esperado antes de computar.
- Ex. 78.3Application
, . Calcule e discuta se a relação é linear.
- Ex. 78.4ApplicationAnswer key
Se e , qual a relação entre e ? Justifique com a definição.
- Ex. 78.5ApplicationAnswer key
Dados com pares: e . Calcule .
- Ex. 78.6ApplicationAnswer key
, . Calcule e a covariância .
- Ex. 78.7Application
, , , , . Encontre a reta de mínimos quadrados.
- Ex. 78.8Application
Usando a reta do exercício 78.7 (), preveja para e para .
- Ex. 78.9Application
Com (exercício 78.7), calcule e interprete em termos de variância explicada.
- Ex. 78.10Application
Usando a reta de 78.7, calcule o resíduo do ponto .
- Ex. 78.11Understanding
O que significa ?
- Ex. 78.12Understanding
Vendas de sorvete correlacionam positivamente com mortes por afogamento (). A melhor explicação é:
- Ex. 78.13Application
Com , , , calcule as inclinações das duas retas de regressão: em e em . As retas coincidem?
- Ex. 78.14Application
Um modelo de regressão explica 64% da variância de gastos em função da renda. Qual é ?
- Ex. 78.15Application
Se , qual a relação entre e ?
- Ex. 78.16Modeling
Relação altura () vs. peso (): cm, kg, cm, kg, . Equação da reta e previsão para uma pessoa de 175 cm.
- Ex. 78.17Modeling
Um pesquisador encontrou entre Índice de Percepção de Corrupção e PIB per capita em 120 países. Interprete e discuta limitações causais.
- Ex. 78.18Modeling
Um gráfico de resíduos vs. valores ajustados mostra um padrão em U (resíduos primeiro negativos, depois positivos). O que isso indica sobre o modelo linear?
- Ex. 78.19Application
, . Teste vs. ao nível 5%.
- Ex. 78.20Application
, . Construa um IC de 95% para usando a transformação de Fisher.
- Ex. 78.21Modeling
Para cada par, identifique se é correlação causal, espúria, ou de causalidade reversa: (a) chuva e vendas de guarda-chuva; (b) número de policiais e criminalidade por cidade.
- Ex. 78.22ApplicationAnswer key
Interprete em um estudo que relaciona anos de estudo com salário.
- Ex. 78.23Application
Explique o risco de extrapolar a reta de regressão para valores de fora do intervalo amostral.
- Ex. 78.24Modeling
Em finanças, o "beta" de uma ação é o coeficiente de regressão do retorno da ação sobre o retorno do mercado. Expresse beta em termos de , e .
- Ex. 78.25Modeling
Uma distribuidora de energia tem dados mensais de temperatura média (°C) e consumo (MWh) nos últimos 5 anos. Descreva o fluxo de análise de correlação e regressão para prever consumo.
- Ex. 78.26Application
Os quatro conjuntos de Anscombe têm e mesma reta de regressão. Por que o modelo linear é adequado para o conjunto I mas não para os outros três?
- Ex. 78.27ModelingAnswer key
Por que a correlação de Spearman é mais adequada que Pearson para dados ordinais (ex.: satisfação de 1 a 5) ou com outliers?
- Ex. 78.28Modeling
Diferencie confundidor, mediador e moderador em um estudo observacional.
- Ex. 78.29ChallengeAnswer key
pares; ; SQT = 500. Calcule a Soma dos Quadrados dos Resíduos (SQR) e o RMSE.
- Ex. 78.30Challenge
Por que nunca decresce quando se adiciona uma variável ao modelo, e como ajustado resolve esse problema?
- Ex. 78.31Understanding
Qual propriedade define a reta de mínimos quadrados (OLS)?
- Ex. 78.32ProofAnswer key
Prove que usando a desigualdade de Cauchy-Schwarz.
Fontes
- OpenStax Statistics — Illowsky, Dean · 2022 · CC-BY. Fonte primária dos exercícios 78.1–2, 78.5–10, 78.14, 78.16, 78.19–20, 78.22–25, 78.29–31 e exemplos 1–3, 5.
- OpenIntro Statistics (4.ª ed) — Diez, Çetinkaya-Rundel, Barr · 2019 · CC-BY-SA. Fonte dos exercícios 78.3, 78.9, 78.11–12, 78.17–18, 78.21, 78.23, 78.26–28, 78.32 e exemplo 4.
- Introduction to Probability (Grinstead-Snell) — Grinstead, Snell · Dartmouth · GNU FDL. Fonte dos exercícios 78.4, 78.13, 78.15 e prova de |r| ≤ 1.