Math ClubMath Club
v1 · padrão canônico

Lição 106 — Regressão múltipla

Modelo com p preditores, solução matricial OLS, R² ajustado, multicolinearidade, seleção de variáveis e diagnóstico de pressupostos.

Used in: Stochastik LK alemão (Klasse 12) · H2 Mathematics Singapura (§15) · econometria introdutória

β^=(XTX)1XTy\hat{\boldsymbol\beta} = (X^TX)^{-1}X^T\mathbf{y}
Choose your door

Rigorous notation, full derivation, hypotheses

Definicja rygorystyczna

Model regresji liniowej wielorakiej

"The multiple regression model is y=β0+β1x1+β2x2++βkxk+εy = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \cdots + \beta_k x_k + \varepsilon. The coefficient βi\beta_i measures the expected change in yy per unit change in xix_i when all other predictors are held constant." — OpenIntro Statistics, §8.1, p. 362

Metryki dopasowania

Wnioskowanie

Macierz projektowania X (n=4, p=2)1 X₁₁ X₁₂1 X₂₁ X₂₂1 X₃₁ X₃₂1 X₄₁ X₄₂n×(p+1)×β₀β₁β₂(p+1)×1=Ŷ₁Ŷ₂Ŷ₃Ŷ₄n×1+ε₁ε₂ε₃ε₄n×1

Reprezentacja macierzowa modelu: Y=Xβ+ε\mathbf{Y} = X\boldsymbol\beta + \boldsymbol\varepsilon. Pierwsza kolumna jedynek w XX generuje wyraz wolny β0\beta_0.

Przykłady rozwiązane

Exercise list

20 exercises · 5 with worked solution (25%)

Application 10Understanding 3Modeling 3Challenge 3Proof 1
  1. Ex. 106.1ApplicationAnswer key

    Regresja: Y^=50+3,2X1+28X2+5,5X3\hat Y = 50 + 3{,}2X_1 + 28X_2 + 5{,}5X_3 (cena w tys. R$, powierzchnia m², pokoje, piętro). Zinterpretuj każdy współczynnik.

  2. Ex. 106.2Application

    Używając Y^=50+3,2X1+28X2+5,5X3\hat Y = 50 + 3{,}2X_1 + 28X_2 + 5{,}5X_3, oblicz prognozę i resztę dla mieszkania 80 m², 3 pokoje, piętro 5 z obserwowaną ceną 450 tys. R$.

  3. Ex. 106.3ApplicationAnswer key

    n=40n=40, p=3p=3 predyktory, SST=2000SST=2000, SSE=800SSE=800. Oblicz R2R^2 i Rˉ2\bar R^2.

  4. Ex. 106.4ApplicationAnswer key

    n=50n=50. Trzy modele z p=1,3,6p=1,3,6 predyktorami i SSE/SST=0,40SSE/SST = 0{,}40; 0,350{,}35; 0,320{,}32. Oblicz Rˉ2\bar R^2 każdego i wskaż preferowany.

  5. Ex. 106.5Application

    n=60n=60, p=4p=4, SST=3600SST=3600, R2=0,72R^2=0{,}72. Złóż tabelę ANOVA i testuj model na poziomie 5%.

  6. Ex. 106.6Application

    Regresje pomocnicze dla 3 predyktorów: R12=0,30R_1^2=0{,}30, R22=0,70R_2^2=0{,}70, R32=0,92R_3^2=0{,}92. Oblicz VIFy i zidentyfikuj silną współliniowość.

  7. Ex. 106.7Application

    Regresja wyniku ENEM na dochody rodzinne (X1X_1) i uczestnictwo w programie wsparcia (DD: 1=tak, 0=nie): Y^=480+8,2X1+12,4D\hat Y = 480 + 8{,}2X_1 + 12{,}4D, n=200n=200. Zinterpretuj β^D=12,4\hat\beta_D = 12{,}4.

  8. Ex. 106.8Application

    n=50n=50, p=3p=3, β^1=2,8\hat\beta_1=2{,}8, SE(β^1)=0,7SE(\hat\beta_1)=0{,}7. Testuj H0:β1=0H_0:\beta_1=0 na poziomie 5% (dwustronnie).

  9. Ex. 106.9Application

    n=50n=50, p=3p=3, β^2=5,2\hat\beta_2=5{,}2, SE(β^2)=1,8SE(\hat\beta_2)=1{,}8. Zbuduj PU 95% dla β2\beta_2. Użyj t46;0,0252,013t_{46;\,0{,}025}\approx 2{,}013.

  10. Ex. 106.10Application

    Cztery z pięciu reszt regresji to: 3,23{,}2; 1,5-1{,}5; 0,8-0{,}8; 2,12{,}1. Jaka jest piąta reszta?

  11. Ex. 106.11Understanding

    Które stwierdzenie o R2R^2 i R2R^2 skorygowanym jest PRAWDZIWE?

  12. Ex. 106.12Understanding

    Jaki jest główny praktyczny efekt współliniowości w regresji wielorakiej?

  13. Ex. 106.13Understanding

    Które stwierdzenie o współczynnikach cząstkowych w regresji wielorakiej jest PRAWDZIWE?

  14. Ex. 106.14Modeling

    Regresja miesięcznych wydatków rodziny (tys. R$) na 4 predyktorach społeczno-ekonomicznych: n=80n=80, SST=18000SST=18000, SSE=5400SSE=5400. Oblicz MSEMSE, σ^\hat\sigma i Rˉ2\bar R^2.

  15. Ex. 106.15Modeling

    Model: Y^=45+2,5X18D\hat Y = 45 + 2{,}5X_1 - 8D (wynagrodzenie w tys. R$, doświadczenie w latach, DD=1 jeśli kobieta). Oblicz wynagrodzenia dla (a) mężczyzny, 10 lat; (b) kobiety, 10 lat. Jak dodać interakcję aby sprawdzić czy różnica zmienia się z doświadczeniem?

  16. Ex. 106.16ModelingAnswer key

    Badacz ma model regresji z 2 predyktorami (R2=0,65R^2=0{,}65, Rˉ2=0,64\bar R^2=0{,}64) i rozważa dodanie trzeciego predyktora. Opisz dwa kryteria aby zdecydować czy go uwzględnić.

  17. Ex. 106.17Challenge

    Udowodnij że macierz hat H=X(XTX)1XTH = X(X^TX)^{-1}X^T jest idempotentna: H2=HH^2 = H.

  18. Ex. 106.18Challenge

    Dane: n=6n=6 obserwacji z Y=(10,14,18,12,16,20)Y=(10,14,18,12,16,20), X1=(1,2,3,2,3,4)X_1=(1,2,3,2,3,4), X2=(5,4,3,6,5,4)X_2=(5,4,3,6,5,4). Napisz macierz projektowania XX i opisz procedurę do obliczenia β^=(XTX)1XTy\hat{\boldsymbol\beta} = (X^TX)^{-1}X^T\mathbf{y} (nie trzeba wykonywać inwersji ręcznie — opisz kroki).

  19. Ex. 106.19ProofAnswer key

    Udowodnij że w każdej regresji z wyrazem wolnym, i=1nei=0\sum_{i=1}^n e_i = 0, używając ortogonalności XTe=0X^T\mathbf{e} = \mathbf{0}.

  20. Ex. 106.20Challenge

    Pokaż że dodanie predyktora do modelu zwiększa Rˉ2\bar R^2 wtedy i tylko wtedy gdy statystyka T|T| nowego predyktora jest większa niż 1.

Źródła

  • OpenIntro Statistics (4. ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA · Rozdział 8 (Multiple and logistic regression). Źródło pierwotne dla interpretacji współczynników, Rˉ2\bar R^2, współliniowości i zmiennych dummy.
  • Statistics — OpenStax — Illowsky, Dean · CC-BY · Rozdział 13 (Linear Regression and Correlation — Multiple). Źródło dla tabel ANOVA regresji wielorakiej i globalnego testu F.
  • Probabilidade e Estatística — Wikilivros — kolaboratywne · CC-BY-SA · Sekcja regresji wielorakiej. Odniesienie w PT-BR z notacją macierzową.

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.