Math ClubMath Club
v1 · padrão canônico

Lição 105 — Regressão linear simples

Modelo OLS, estimadores de mínimos quadrados, R², resíduos, inferência sobre a inclinação. Fundamento do aprendizado supervisionado e da econometria.

Used in: Stochastik LK alemão (Klasse 12) · H2 Mathematics Singapura (§14) · Math B japonês

Y^=β^0+β^1X,β^1=SxySxx\hat{Y} = \hat\beta_0 + \hat\beta_1 X, \qquad \hat\beta_1 = \frac{S_{xy}}{S_{xx}}
Choose your door

Rigorous notation, full derivation, hypotheses

Definição rigorosa

Modelo de regressão linear simples

"The regression equation is written as y^=a+bx\hat{y} = a + bx, where bb is the slope and aa is the yy-intercept." — OpenStax Statistics, §12.3

Decomposição da variância e R²

"The coefficient of determination r2r^2 is the square of the correlation coefficient rr. It tells you the fraction of total variability in the response that is explained by the least-squares line." — OpenIntro Statistics, §7.2, p. 331

Inferência sobre a inclinação

YXeReta ajustadaDadosResíduo eᵢ

Reta de mínimos quadrados (dourada) minimizando a soma dos quadrados dos resíduos (laranjas). Cada resíduo e é a distância vertical do ponto à reta.

Exemplos resolvidos

Exercise list

30 exercises · 7 with worked solution (25%)

Application 15Understanding 4Modeling 5Challenge 4Proof 2
  1. Ex. 105.1Application

    Dados: n=6n=6, Xˉ=4\bar X = 4, Yˉ=10\bar Y = 10, Sxx=20S_{xx} = 20, Sxy=30S_{xy} = 30. Calcule β^0\hat\beta_0 e β^1\hat\beta_1.

  2. Ex. 105.2Application

    Pares (X,Y)(X,Y): (2,5)(2,5), (4,9)(4,9), (6,11)(6,11), (8,15)(8,15), (10,20)(10,20). Calcule a reta de mínimos quadrados.

  3. Ex. 105.3Application

    Usando Y^=1,2+1,8X\hat Y = 1{,}2 + 1{,}8X (exercício anterior), preveja YY para X=7X=7 e X=12X=12. Identifique qual previsão é extrapolação.

  4. Ex. 105.4Application

    Para os dados do Exercício 105.1: Xˉ=4\bar X=4, Yˉ=10\bar Y=10, Sxx=20S_{xx}=20, Sxy=30S_{xy}=30, Syy=52S_{yy}=52. Calcule R2R^2 e interprete.

  5. Ex. 105.5ApplicationAnswer key

    O coeficiente de correlação de Pearson entre duas variáveis é r=0,87r = 0{,}87. Qual é o R2R^2 da regressão simples de YY em XX?

  6. Ex. 105.6ApplicationAnswer key

    Regressão de salário anual (em mil R$) em anos de experiência produziu Y^=32,4+2,5X\hat Y = 32{,}4 + 2{,}5X. Interprete β^0\hat\beta_0 e β^1\hat\beta_1.

  7. Ex. 105.7Application

    Usando Y^=32,4+2,5X\hat Y = 32{,}4 + 2{,}5X, um funcionário com 14 anos de experiência ganha R$ 72 mil/ano. Calcule o resíduo.

  8. Ex. 105.8ApplicationAnswer key

    Cinco valores observados de YY: (8,10,12,9,11)(8, 10, 12, 9, 11) com Yˉ=10\bar Y = 10. O SSE da regressão é 3,2. Calcule SST, SSR e R2R^2.

  9. Ex. 105.9Application

    Uma regressão com n=20n=20 produziu SSE=48,6SSE = 48{,}6. Calcule MSEMSE e σ^\hat\sigma e interprete.

  10. Ex. 105.10Application

    β^1=3,6\hat\beta_1 = 3{,}6, σ^=2,1\hat\sigma = 2{,}1, Sxx=144S_{xx} = 144. Calcule SE(β^1)SE(\hat\beta_1) e a estatística TT.

  11. Ex. 105.11Application

    n=30n=30, β^1=1,4\hat\beta_1 = 1{,}4, SE(β^1)=0,38SE(\hat\beta_1) = 0{,}38. Construa IC 95% para β1\beta_1 e interprete.

  12. Ex. 105.12Application

    r=0,73r = -0{,}73, sX=4s_X = 4, sY=6s_Y = 6. Qual o sinal de β^1\hat\beta_1? Calcule β^1\hat\beta_1 usando a relação β^1=r(sY/sX)\hat\beta_1 = r(s_Y/s_X).

  13. Ex. 105.13UnderstandingAnswer key

    Qual das afirmações sobre a reta de mínimos quadrados é CORRETA?

  14. Ex. 105.14Understanding

    Qual é a interpretação correta de R2=0R^2 = 0 em regressão linear simples?

  15. Ex. 105.15Understanding

    Uma regressão produziu R2=0,85R^2 = 0{,}85 e β^1=2,3>0\hat\beta_1 = 2{,}3 > 0. O que se pode concluir?

  16. Ex. 105.16Modeling

    Um imobiliário de Curitiba coletou dados de 10 apartamentos: área (XX, em m²) e custo de aluguel (YY, em R$/mês). Xˉ=80\bar X=80, Yˉ=1600\bar Y=1600, Sxx=3200S_{xx}=3200, Sxy=64000S_{xy}=64000. Ajuste a reta e preveja o aluguel para um apartamento de 95 m².

  17. Ex. 105.17Modeling

    Crianças de 10 a 25 anos: Xˉ=22\bar X = 22 anos, Yˉ=74\bar Y = 74 kg, sX=2,3s_X = 2{,}3, sY=8,5s_Y = 8{,}5, r=0,82r = 0{,}82. Ajuste a reta usando β^1=r(sY/sX)\hat\beta_1 = r(s_Y/s_X) e preveja o peso de uma criança de 30 anos.

  18. Ex. 105.18ModelingAnswer key

    Regressão com n=25n=25, SST=1200SST=1200, R2=0,72R^2=0{,}72. Monte a tabela ANOVA (SSR, SSE, MSR, MSE, F) e teste H0:β1=0H_0: \beta_1 = 0 ao nível 5%.

  19. Ex. 105.19Modeling

    Uma regressão de consumo de água (litros/dia) em temperatura (°C) produziu Y^=50+8X\hat Y = 50 + 8X com R2=0,91R^2=0{,}91 para n=30n=30 pontos. O ponto (15;430)(15; 430) aparece muito longe dos demais. Que procedimento usar para avaliar sua influência?

  20. Ex. 105.20Modeling

    Uma transportadora registrou número de pedidos XX e custo logístico mensal YY (em R$ mil) para 5 filiais: (10,100)(10,100), (20,180)(20,180), (30,270)(30,270), (40,340)(40,340), (50,400)(50,400). Ajuste a reta.

  21. Ex. 105.21Application

    Usando Y^=30+7,6X\hat Y = 30 + 7{,}6X, calcule a previsão e o resíduo para uma filial com X=35X=35 pedidos e custo observado de R$ 310 mil.

  22. Ex. 105.22Application

    Para a regressão do Exercício 105.20, calcule os 5 resíduos, o SSE e o desvio padrão residual σ^\hat\sigma.

  23. Ex. 105.23Understanding

    O gráfico de resíduos vs. Y^\hat Y tem formato de funil (variância crescente). O que isso indica?

  24. Ex. 105.24Application

    Para a regressão do Exercício 105.20 (Y^=30+7,6X\hat Y = 30 + 7{,}6X, n=5n=5, Xˉ=30\bar X=30, Sxx=1000S_{xx}=1000, σ^10,95\hat\sigma \approx 10{,}95), construa IC 95% para o custo médio de uma filial com X=40X^*=40 pedidos. Use t3;0,025=3,182t_{3;\,0{,}025} = 3{,}182.

  25. Ex. 105.25ChallengeAnswer key

    Prove algebricamente que, para regressão linear simples, R2=r2R^2 = r^2 (quadrado do coeficiente de correlação de Pearson).

  26. Ex. 105.26ChallengeAnswer key

    Derive as fórmulas de β^0\hat\beta_0 e β^1\hat\beta_1 por minimização de SSE=(Yiβ0β1Xi)2SSE = \sum (Y_i - \beta_0 - \beta_1 X_i)^2 via cálculo diferencial (equações normais).

  27. Ex. 105.27Proof

    Prove que, para qualquer reta de mínimos quadrados, a soma dos resíduos é zero: i=1nei=0\sum_{i=1}^n e_i = 0.

  28. Ex. 105.28Challenge

    Dados resumidos: n=15n=15, Xˉ=12\bar X=12, Yˉ=45\bar Y=45, Sxx=420S_{xx}=420, Sxy=1260S_{xy}=1260, Syy=4800S_{yy}=4800. Calcule: reta ajustada, R2R^2, teste H0:β1=0H_0:\beta_1=0 ao nível 5%.

  29. Ex. 105.29Challenge

    Por que reduzir a variabilidade de XX (estreitar o intervalo amostrado) prejudica a estimação de β1\beta_1? Relacione com a fórmula de SE(β^1)SE(\hat\beta_1).

  30. Ex. 105.30Proof

    Prove que os estimadores OLS β^0\hat\beta_0 e β^1\hat\beta_1 são não-viesados, i.e., E[β^j]=βjE[\hat\beta_j] = \beta_j.

Fontes

  • Statistics — OpenStax — Illowsky, Dean · CC-BY · Capítulos 12 (Linear Regression and Correlation). Fonte primária para exemplos, equações e exercícios desta lição.
  • OpenIntro Statistics (4ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA · Capítulo 7 (Introduction to linear regression). Fonte primária para diagnóstico de resíduos, inferência e exercícios com dados reais.
  • Probabilidade e Estatística — Wikilivros — colaborativo · CC-BY-SA · Seção de regressão linear. Referência em PT-BR com notação compatível com o currículo nacional.

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.