Lição 106 — Regressão múltipla
Modelo com p preditores, solução matricial OLS, R² ajustado, multicolinearidade, seleção de variáveis e diagnóstico de pressupostos.
Used in: Stochastik LK alemão (Klasse 12) · H2 Mathematics Singapura (§15) · econometria introdutória
Na regressão múltipla com preditores, o estimador OLS é a solução matricial das equações normais. Cada coeficiente mede o efeito de sobre mantendo os demais preditores fixos — o chamado efeito parcial.
Rigorous notation, full derivation, hypotheses
Definição rigorosa
Modelo de regressão linear múltipla
"The multiple regression model is . The coefficient measures the expected change in per unit change in when all other predictors are held constant." — OpenIntro Statistics, §8.1, p. 362
Métricas de ajuste
Inferência
Representação matricial do modelo: . A primeira coluna de 1s em gera o intercepto .
Exemplos resolvidos
Exercise list
20 exercises · 5 with worked solution (25%)
- Ex. 106.1ApplicationAnswer key
Regressão: (preço em R$ mil, área m², quartos, andar). Interprete cada coeficiente.
Show solution
Efeito parcial de cada preditor: manter os demais fixos. : cada m² extra adiciona R\$ 3.200 ao preço, controlando quartos e andar. : cada quarto a mais adiciona R\$ 28.000. : cada andar a mais adiciona R\$ 5.500. - Ex. 106.2Application
Usando , calcule a previsão e o resíduo para um apartamento de 80 m², 3 quartos, 5º andar com preço observado de R$ 450 mil.
Show solution
Previsão: R\undefined 32.500 (apartamento acima do previsto pelo modelo).Show step-by-step (with the why)
- Identifique os valores: m², quartos, andar.
- Substitua na equação: .
- mil R\$.
- Resíduo: mil R\. O apartamento custa R\ 32.500 a mais do que o modelo prevê.
- Macete: resíduo positivo = observado acima do esperado (pode indicar localização privilegiada não capturada pelos preditores).
- Ex. 106.3ApplicationAnswer key
, preditores, , . Calcule e .
Show solution
. Comparar com : o ajuste penalizado cai levemente. - Ex. 106.4ApplicationAnswer key
. Três modelos com preditores e ; ; . Calcule de cada e aponte o preferível.
Show solution
M1: . Com : . M2: . M3: . M3 tem maior : preferível entre os três. - Ex. 106.5Application
, , , . Monte a tabela ANOVA e teste o modelo ao nível 5%.
Show solution
; ; ; ; . Valor crítico : rejeita . - Ex. 106.6Application
Regressões auxiliares para 3 preditores: , , . Calcule os VIFs e identifique multicolinearidade severa.
Show solution
. ; ; . : preditor 3 apresenta multicolinearidade severa. - Ex. 106.7Application
Regressão da nota do ENEM em renda familiar () e participação em programa de reforço (: 1=sim, 0=não): , . Interprete .
Show solution
O coeficiente da dummy indica que participar do programa está associado a 12,4 pontos a mais na nota, controlando por renda familiar. Efeito causal requer desenho experimental adequado.Show step-by-step (with the why)
- Modelo com dummy: onde se tratado, se controle.
- é a diferença média de entre tratados e controles, controlando por .
- Com : o programa está associado a um aumento médio de 12,4 pontos na nota, dado o mesmo nível de renda familiar.
- Observação: isso ainda não é efeito causal — precisa de aleatorização ou design quase-experimental.
- Ex. 106.8Application
, , , . Teste ao nível 5% (bicaudal).
Show solution
Teste : . Com , . Como , rejeitamos . O preditor é significativo ao nível 5%. - Ex. 106.9Application
, , , . Construa IC 95% para . Use .
Show solution
IC 95% para : . O IC não contém 0: é significativo ao nível 5%. - Ex. 106.10Application
Quatro dos cinco resíduos de uma regressão são: ; ; ; . Qual é o quinto resíduo?
Show solution
Soma dos resíduos é sempre zero em qualquer regressão com intercepto: . Portanto o quinto resíduo é . Verificar: soma . Correto. - Ex. 106.11Understanding
Qual afirmação sobre e ajustado é CORRETA?
Show solution
nunca cai ao adicionar preditores (propriedade matemática do OLS). penaliza pelo número de preditores e pode cair quando o preditor adicionado é fraco. Por isso é o critério adequado para comparar modelos com diferentes números de preditores. - Ex. 106.12Understanding
Qual é o principal efeito prático da multicolinearidade em regressão múltipla?
Show solution
Multicolinearidade não vicia os estimadores (eles continuam BLUE), mas torna quase-singular, inflando e portanto os . Testes individuais perdem poder, mas o teste global e as previsões continuam confiáveis. - Ex. 106.13Understanding
Qual afirmação sobre coeficientes parciais em regressão múltipla é CORRETA?
Show solution
O fenômeno é chamado de "inversão de sinal" ou efeito de supressão. Ocorre quando está correlacionado com de forma que controlar por revela a verdadeira relação de com . Exemplo clássico: correlação positiva entre pompas de incêndio e dano — ao controlar pelo tamanho do incêndio, o efeito pode mudar. - Ex. 106.14Modeling
Regressão do gasto mensal familiar (R$ mil) sobre 4 preditores socioeconômicos: , , . Calcule , e .
Show solution
Com preditores: . mil R\undefined 8.490 no consumo previsto. . Com : . - Ex. 106.15Modeling
Modelo: (salário em R$ mil, experiência em anos, =1 se mulher). Calcule salários para (a) homem, 10 anos; (b) mulher, 10 anos. Como incluir interação para verificar se o gap varia com experiência?
Show solution
Homem 10 anos: R\ 70 mil. Mulher 10 anos: R\ 62 mil. O gap salarial de R\$ 8 mil é constante no modelo sem interação.Show step-by-step (with the why)
- Modelo sem interação: uma reta de inclinação igual para homens e mulheres.
- Para homens (): . Para mulheres (): .
- Diferença salarial entre gêneros é constante em R\$ 8 mil para qualquer nível de experiência.
- Para testar se a diferença varia com experiência, adicione o termo de interação .
- Observação: o modelo com interação é . Se for significativo, a diferença de gênero varia com experiência.
- Ex. 106.16ModelingAnswer key
Um pesquisador tem modelo de regressão com 2 preditores (, ) e considera adicionar um terceiro preditor. Descreva dois critérios para decidir se deve incluí-lo.
Show solution
Comparar modelos com e sem : se sobe ao incluir , manter. Alternativa: fazer teste parcial para . Se p-valor menor que 0,05, é significativo dado os demais. Critério AIC: , menor é melhor. Usar VIF para verificar se introduz multicolinearidade severa. - Ex. 106.17Challenge
Prove que o hat matrix é idempotente: .
Show solution
O hat matrix é simétrico () e idempotente (). Idempotência: . Isso confirma que é uma projeção ortogonal: aplicá-la duas vezes dá o mesmo resultado. - Ex. 106.18Challenge
Dados: observações com , , . Escreva a matriz de design e enuncie o procedimento para calcular (não é necessário executar a inversão a mão — descreva os passos).
Show solution
Montar as matrizes com os dados fornecidos, calcular o produto e obter . Este exercício é melhor resolvido com calculadora matricial ou R/Python.Show step-by-step (with the why)
- Com , : montar (coluna de 1s, coluna , coluna ).
- Calcular (matriz 3×3).
- Calcular .
- Calcular (vetor 3×1).
- Multiplicar: .
- Curiosidade: em aplicações reais, é calculado numericamente via decomposição QR, não pela inversa direta (mais estável numericamente).
- Ex. 106.19ProofAnswer key
Prove que em qualquer regressão com intercepto, , usando a ortogonalidade .
Show solution
Devemos mostrar que . Como e a primeira coluna de é um vetor de 1s (), temos . A primeira linha de é , portanto . - Ex. 106.20Challenge
Mostre que adicionar um preditor ao modelo aumenta se e somente se a estatística do novo preditor é maior que 1.
Show solution
Fórmula da diferença de ao adicionar um preditor: aumenta se e somente se o valor parcial do novo preditor for maior que 1. Equivalentemente: do modelo ampliado do modelo reduzido . Isso mostra que o critério é menos conservador do que o teste ao nível 5% (que exigiria ).
Fontes
- OpenIntro Statistics (4ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA · Capítulo 8 (Multiple and logistic regression). Fonte primária para interpretação de coeficientes, , multicolinearidade e variáveis dummy.
- Statistics — OpenStax — Illowsky, Dean · CC-BY · Capítulo 13 (Linear Regression and Correlation — Multiple). Fonte para tabelas ANOVA de regressão múltipla e teste F global.
- Probabilidade e Estatística — Wikilivros — colaborativo · CC-BY-SA · Seção de regressão múltipla. Referência em PT-BR com notação matricial.