Math ClubMath Club
v1 · padrão canônico

Lição 78 — Correlação e regressão linear simples

Coeficiente de Pearson r, covariância, reta de mínimos quadrados, coeficiente de determinação r². Correlação não é causalidade — o teorema de Anscombe, o quarteto que todo cientista deve conhecer.

Used in: 2.º ano do EM (16-17 anos) · Stochastik LK alemão §12 · H2 Math singapurense §19 · AP Statistics USA §3

r=i=1n(xixˉ)(yiyˉ)i=1n(xixˉ)2i=1n(yiyˉ)2r = \frac{\displaystyle\sum_{i=1}^n (x_i - \bar x)(y_i - \bar y)}{\sqrt{\displaystyle\sum_{i=1}^n (x_i-\bar x)^2 \cdot \sum_{i=1}^n (y_i-\bar y)^2}}
Choose your door

Rigorous notation, full derivation, hypotheses

Definições e propriedades rigorosas

Covariância

"The covariance is a measure of the joint variability of two random variables. If the greater values of one variable mainly correspond with the greater values of the other variable, and the same holds for the lesser values, the covariance is positive." — OpenStax Statistics, §12.1

Coeficiente de correlação de Pearson

r ≈ +1r ≈ −1r ≈ 0r ≈ 0.7

Quatro diagramas de dispersão com diferentes valores de r. A nuvem de pontos concentra-se mais em torno de uma reta quando |r| é próximo de 1.

Reta de mínimos quadrados (OLS)

Coeficiente de determinação

r2=1SQRSQT,SQT=(yiyˉ)2r^2 = 1 - \frac{\text{SQR}}{\text{SQT}}, \quad \text{SQT} = \sum(y_i - \bar y)^2
what this means · r² mede a fração da variância de Y explicada pelo modelo linear em X.

Hipóteses LINE

Exemplos resolvidos

Exercise list

32 exercises · 8 with worked solution (25%)

Application 18Understanding 3Modeling 8Challenge 2Proof 1
  1. Ex. 78.1ApplicationAnswer key

    X=(1,2,3,4)X = (1, 2, 3, 4), Y=(2,4,6,8)Y = (2, 4, 6, 8). Calcule rr sem usar calculadora e justifique o resultado.

  2. Ex. 78.2Application

    X=(1,2,3,4)X = (1, 2, 3, 4), Y=(8,6,4,2)Y = (8, 6, 4, 2). Calcule rr e identifique o sinal esperado antes de computar.

  3. Ex. 78.3Application

    X=(1,2,3)X = (1, 2, 3), Y=(1,4,9)Y = (1, 4, 9). Calcule rr e discuta se a relação é linear.

  4. Ex. 78.4ApplicationAnswer key

    Se U=X+5U = X + 5 e V=2YV = 2Y, qual a relação entre r(U,V)r(U, V) e r(X,Y)r(X, Y)? Justifique com a definição.

  5. Ex. 78.5ApplicationAnswer key

    Dados com n=5n = 5 pares: x=(1,2,3,4,5)x = (1, 2, 3, 4, 5) e y=(10,7,5,4,3)y = (10, 7, 5, 4, 3). Calcule rr.

  6. Ex. 78.6ApplicationAnswer key

    X=(1,2,3,4,5)X = (1, 2, 3, 4, 5), Y=(1,4,5,9,10)Y = (1, 4, 5, 9, 10). Calcule rr e a covariância sxys_{xy}.

  7. Ex. 78.7Application

    r=0,85r = 0,85, xˉ=10\bar x = 10, yˉ=50\bar y = 50, sx=3s_x = 3, sy=12s_y = 12. Encontre a reta de mínimos quadrados.

  8. Ex. 78.8Application

    Usando a reta do exercício 78.7 (y^=16+3,4x\hat y = 16 + 3,4x), preveja YY para x=15x = 15 e para x=5x = 5.

  9. Ex. 78.9Application

    Com r=0,85r = 0,85 (exercício 78.7), calcule r2r^2 e interprete em termos de variância explicada.

  10. Ex. 78.10Application

    Usando a reta de 78.7, calcule o resíduo do ponto (10,55)(10, 55).

  11. Ex. 78.11Understanding

    O que significa r=0r = 0?

  12. Ex. 78.12Understanding

    Vendas de sorvete correlacionam positivamente com mortes por afogamento (r0,8r \approx 0,8). A melhor explicação é:

  13. Ex. 78.13Application

    Com r=0,6r = 0,6, sx=2s_x = 2, sy=5s_y = 5, calcule as inclinações das duas retas de regressão: YY em XX e XX em YY. As retas coincidem?

  14. Ex. 78.14Application

    Um modelo de regressão explica 64% da variância de gastos em função da renda. Qual é r|r|?

  15. Ex. 78.15Application

    Se V=YV = -Y, qual a relação entre r(X,V)r(X, V) e r(X,Y)r(X, Y)?

  16. Ex. 78.16Modeling

    Relação altura (XX) vs. peso (YY): xˉ=170\bar x = 170 cm, yˉ=70\bar y = 70 kg, sx=8s_x = 8 cm, sy=12s_y = 12 kg, r=0,75r = 0,75. Equação da reta e previsão para uma pessoa de 175 cm.

  17. Ex. 78.17Modeling

    Um pesquisador encontrou r=0,82r = 0,82 entre Índice de Percepção de Corrupção e PIB per capita em 120 países. Interprete r2r^2 e discuta limitações causais.

  18. Ex. 78.18Modeling

    Um gráfico de resíduos vs. valores ajustados mostra um padrão em U (resíduos primeiro negativos, depois positivos). O que isso indica sobre o modelo linear?

  19. Ex. 78.19Application

    n=25n = 25, r=0,45r = 0,45. Teste H0:ρ=0H_0: \rho = 0 vs. H1:ρ0H_1: \rho \neq 0 ao nível 5%.

  20. Ex. 78.20Application

    n=50n = 50, r=0,60r = 0,60. Construa um IC de 95% para ρ\rho usando a transformação de Fisher.

  21. Ex. 78.21Modeling

    Para cada par, identifique se é correlação causal, espúria, ou de causalidade reversa: (a) chuva e vendas de guarda-chuva; (b) número de policiais e criminalidade por cidade.

  22. Ex. 78.22ApplicationAnswer key

    Interprete r2=0,25r^2 = 0,25 em um estudo que relaciona anos de estudo com salário.

  23. Ex. 78.23Application

    Explique o risco de extrapolar a reta de regressão para valores de xx fora do intervalo amostral.

  24. Ex. 78.24Modeling

    Em finanças, o "beta" de uma ação é o coeficiente de regressão do retorno da ação sobre o retorno do mercado. Expresse beta em termos de rr, sris_{r_i} e srms_{r_m}.

  25. Ex. 78.25Modeling

    Uma distribuidora de energia tem dados mensais de temperatura média (°C) e consumo (MWh) nos últimos 5 anos. Descreva o fluxo de análise de correlação e regressão para prever consumo.

  26. Ex. 78.26Application

    Os quatro conjuntos de Anscombe têm r0,82r \approx 0,82 e mesma reta de regressão. Por que o modelo linear é adequado para o conjunto I mas não para os outros três?

  27. Ex. 78.27ModelingAnswer key

    Por que a correlação de Spearman é mais adequada que Pearson para dados ordinais (ex.: satisfação de 1 a 5) ou com outliers?

  28. Ex. 78.28Modeling

    Diferencie confundidor, mediador e moderador em um estudo observacional.

  29. Ex. 78.29ChallengeAnswer key

    n=22n = 22 pares; r2=0,64r^2 = 0,64; SQT = 500. Calcule a Soma dos Quadrados dos Resíduos (SQR) e o RMSE.

  30. Ex. 78.30Challenge

    Por que R2R^2 nunca decresce quando se adiciona uma variável ao modelo, e como R2R^2 ajustado resolve esse problema?

  31. Ex. 78.31Understanding

    Qual propriedade define a reta de mínimos quadrados (OLS)?

  32. Ex. 78.32ProofAnswer key

    Prove que 1r1-1 \leq r \leq 1 usando a desigualdade de Cauchy-Schwarz.

Fontes

  • OpenStax Statistics — Illowsky, Dean · 2022 · CC-BY. Fonte primária dos exercícios 78.1–2, 78.5–10, 78.14, 78.16, 78.19–20, 78.22–25, 78.29–31 e exemplos 1–3, 5.
  • OpenIntro Statistics (4.ª ed) — Diez, Çetinkaya-Rundel, Barr · 2019 · CC-BY-SA. Fonte dos exercícios 78.3, 78.9, 78.11–12, 78.17–18, 78.21, 78.23, 78.26–28, 78.32 e exemplo 4.
  • Introduction to Probability (Grinstead-Snell) — Grinstead, Snell · Dartmouth · GNU FDL. Fonte dos exercícios 78.4, 78.13, 78.15 e prova de |r| ≤ 1.

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.