Math ClubMath Club
v1 · padrão canônico

Lição 106 — Regressão múltipla

Modelo com p preditores, solução matricial OLS, R² ajustado, multicolinearidade, seleção de variáveis e diagnóstico de pressupostos.

Used in: Stochastik LK alemão (Klasse 12) · H2 Mathematics Singapura (§15) · econometria introdutória

β^=(XTX)1XTy\hat{\boldsymbol\beta} = (X^TX)^{-1}X^T\mathbf{y}
Choose your door

Rigorous notation, full derivation, hypotheses

Definição rigorosa

Modelo de regressão linear múltipla

"The multiple regression model is y=β0+β1x1+β2x2++βkxk+εy = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \cdots + \beta_k x_k + \varepsilon. The coefficient βi\beta_i measures the expected change in yy per unit change in xix_i when all other predictors are held constant." — OpenIntro Statistics, §8.1, p. 362

Métricas de ajuste

Inferência

Matriz de design X (n=4, p=2)1 X₁₁ X₁₂1 X₂₁ X₂₂1 X₃₁ X₃₂1 X₄₁ X₄₂n×(p+1)×β₀β₁β₂(p+1)×1=Ŷ₁Ŷ₂Ŷ₃Ŷ₄n×1+ε₁ε₂ε₃ε₄n×1

Representação matricial do modelo: Y=Xβ+ε\mathbf{Y} = X\boldsymbol\beta + \boldsymbol\varepsilon. A primeira coluna de 1s em XX gera o intercepto β0\beta_0.

Exemplos resolvidos

Exercise list

20 exercises · 5 with worked solution (25%)

Application 10Understanding 3Modeling 3Challenge 3Proof 1
  1. Ex. 106.1ApplicationAnswer key

    Regressão: Y^=50+3,2X1+28X2+5,5X3\hat Y = 50 + 3{,}2X_1 + 28X_2 + 5{,}5X_3 (preço em R$ mil, área m², quartos, andar). Interprete cada coeficiente.

  2. Ex. 106.2Application

    Usando Y^=50+3,2X1+28X2+5,5X3\hat Y = 50 + 3{,}2X_1 + 28X_2 + 5{,}5X_3, calcule a previsão e o resíduo para um apartamento de 80 m², 3 quartos, 5º andar com preço observado de R$ 450 mil.

  3. Ex. 106.3ApplicationAnswer key

    n=40n=40, p=3p=3 preditores, SST=2000SST=2000, SSE=800SSE=800. Calcule R2R^2 e Rˉ2\bar R^2.

  4. Ex. 106.4ApplicationAnswer key

    n=50n=50. Três modelos com p=1,3,6p=1,3,6 preditores e SSE/SST=0,40SSE/SST = 0{,}40; 0,350{,}35; 0,320{,}32. Calcule Rˉ2\bar R^2 de cada e aponte o preferível.

  5. Ex. 106.5Application

    n=60n=60, p=4p=4, SST=3600SST=3600, R2=0,72R^2=0{,}72. Monte a tabela ANOVA e teste o modelo ao nível 5%.

  6. Ex. 106.6Application

    Regressões auxiliares para 3 preditores: R12=0,30R_1^2=0{,}30, R22=0,70R_2^2=0{,}70, R32=0,92R_3^2=0{,}92. Calcule os VIFs e identifique multicolinearidade severa.

  7. Ex. 106.7Application

    Regressão da nota do ENEM em renda familiar (X1X_1) e participação em programa de reforço (DD: 1=sim, 0=não): Y^=480+8,2X1+12,4D\hat Y = 480 + 8{,}2X_1 + 12{,}4D, n=200n=200. Interprete β^D=12,4\hat\beta_D = 12{,}4.

  8. Ex. 106.8Application

    n=50n=50, p=3p=3, β^1=2,8\hat\beta_1=2{,}8, SE(β^1)=0,7SE(\hat\beta_1)=0{,}7. Teste H0:β1=0H_0:\beta_1=0 ao nível 5% (bicaudal).

  9. Ex. 106.9Application

    n=50n=50, p=3p=3, β^2=5,2\hat\beta_2=5{,}2, SE(β^2)=1,8SE(\hat\beta_2)=1{,}8. Construa IC 95% para β2\beta_2. Use t46;0,0252,013t_{46;\,0{,}025}\approx 2{,}013.

  10. Ex. 106.10Application

    Quatro dos cinco resíduos de uma regressão são: 3,23{,}2; 1,5-1{,}5; 0,8-0{,}8; 2,12{,}1. Qual é o quinto resíduo?

  11. Ex. 106.11Understanding

    Qual afirmação sobre R2R^2 e R2R^2 ajustado é CORRETA?

  12. Ex. 106.12Understanding

    Qual é o principal efeito prático da multicolinearidade em regressão múltipla?

  13. Ex. 106.13Understanding

    Qual afirmação sobre coeficientes parciais em regressão múltipla é CORRETA?

  14. Ex. 106.14Modeling

    Regressão do gasto mensal familiar (R$ mil) sobre 4 preditores socioeconômicos: n=80n=80, SST=18000SST=18000, SSE=5400SSE=5400. Calcule MSEMSE, σ^\hat\sigma e Rˉ2\bar R^2.

  15. Ex. 106.15Modeling

    Modelo: Y^=45+2,5X18D\hat Y = 45 + 2{,}5X_1 - 8D (salário em R$ mil, experiência em anos, DD=1 se mulher). Calcule salários para (a) homem, 10 anos; (b) mulher, 10 anos. Como incluir interação para verificar se o gap varia com experiência?

  16. Ex. 106.16ModelingAnswer key

    Um pesquisador tem modelo de regressão com 2 preditores (R2=0,65R^2=0{,}65, Rˉ2=0,64\bar R^2=0{,}64) e considera adicionar um terceiro preditor. Descreva dois critérios para decidir se deve incluí-lo.

  17. Ex. 106.17Challenge

    Prove que o hat matrix H=X(XTX)1XTH = X(X^TX)^{-1}X^T é idempotente: H2=HH^2 = H.

  18. Ex. 106.18Challenge

    Dados: n=6n=6 observações com Y=(10,14,18,12,16,20)Y=(10,14,18,12,16,20), X1=(1,2,3,2,3,4)X_1=(1,2,3,2,3,4), X2=(5,4,3,6,5,4)X_2=(5,4,3,6,5,4). Escreva a matriz de design XX e enuncie o procedimento para calcular β^=(XTX)1XTy\hat{\boldsymbol\beta} = (X^TX)^{-1}X^T\mathbf{y} (não é necessário executar a inversão a mão — descreva os passos).

  19. Ex. 106.19ProofAnswer key

    Prove que em qualquer regressão com intercepto, i=1nei=0\sum_{i=1}^n e_i = 0, usando a ortogonalidade XTe=0X^T\mathbf{e} = \mathbf{0}.

  20. Ex. 106.20Challenge

    Mostre que adicionar um preditor ao modelo aumenta Rˉ2\bar R^2 se e somente se a estatística T|T| do novo preditor é maior que 1.

Fontes

  • OpenIntro Statistics (4ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA · Capítulo 8 (Multiple and logistic regression). Fonte primária para interpretação de coeficientes, Rˉ2\bar R^2, multicolinearidade e variáveis dummy.
  • Statistics — OpenStax — Illowsky, Dean · CC-BY · Capítulo 13 (Linear Regression and Correlation — Multiple). Fonte para tabelas ANOVA de regressão múltipla e teste F global.
  • Probabilidade e Estatística — Wikilivros — colaborativo · CC-BY-SA · Seção de regressão múltipla. Referência em PT-BR com notação matricial.

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.