Math ClubMath Club
v1 · padrão canônico

Lição 105 — Regressão linear simples

Modelo OLS, estimadores de mínimos quadrados, R², resíduos, inferência sobre a inclinação. Fundamento do aprendizado supervisionado e da econometria.

Used in: Stochastik LK alemão (Klasse 12) · H2 Mathematics Singapura (§14) · Math B japonês

Y^=β^0+β^1X,β^1=SxySxx\hat{Y} = \hat\beta_0 + \hat\beta_1 X, \qquad \hat\beta_1 = \frac{S_{xy}}{S_{xx}}
Choose your door

Rigorous notation, full derivation, hypotheses

Definicja ścisła

Model regresji liniowej prostej

"The regression equation is written as y^=a+bx\hat{y} = a + bx, where bb is the slope and aa is the yy-intercept." — OpenStax Statistics, §12.3

Rozkład wariancji i R²

"The coefficient of determination r2r^2 is the square of the correlation coefficient rr. It tells you the fraction of total variability in the response that is explained by the least-squares line." — OpenIntro Statistics, §7.2, p. 331

Wnioskowanie o nachyleniu

YXeDostosowana liniaDaneReszta eᵢ

Linia najmniejszych kwadratów (złota) minimalizująca sumę kwadratów reszt (pomarańczowe). Każda reszta e to odległość pionowa punktu od linii.

Rozwiązane przykłady

Exercise list

30 exercises · 7 with worked solution (25%)

Application 15Understanding 4Modeling 5Challenge 4Proof 2
  1. Ex. 105.1Application

    Dane: n=6n=6, Xˉ=4\bar X = 4, Yˉ=10\bar Y = 10, Sxx=20S_{xx} = 20, Sxy=30S_{xy} = 30. Oblicz β^0\hat\beta_0 i β^1\hat\beta_1.

  2. Ex. 105.2Application

    Pary (X,Y)(X,Y): (2,5)(2,5), (4,9)(4,9), (6,11)(6,11), (8,15)(8,15), (10,20)(10,20). Oblicz linię najmniejszych kwadratów.

  3. Ex. 105.3Application

    Używając Y^=1,2+1,8X\hat Y = 1{,}2 + 1{,}8X (poprzednie ćwiczenie), przewidź YY dla X=7X=7 i X=12X=12. Zidentyfikuj, która prognoza jest ekstrapolacją.

  4. Ex. 105.4Application

    Dla danych z Ćwiczenia 105.1: Xˉ=4\bar X=4, Yˉ=10\bar Y=10, Sxx=20S_{xx}=20, Sxy=30S_{xy}=30, Syy=52S_{yy}=52. Oblicz R2R^2 i zinterpretuj.

  5. Ex. 105.5ApplicationAnswer key

    Współczynnik korelacji Pearsona między dwiema zmiennymi to r=0,87r = 0{,}87. Jaki jest R2R^2 prostej regresji YY na XX?

  6. Ex. 105.6ApplicationAnswer key

    Regresja rocznego wynagrodzenia (w tysiącach R$) na lata doświadczenia dała Y^=32,4+2,5X\hat Y = 32{,}4 + 2{,}5X. Zinterpretuj β^0\hat\beta_0 i β^1\hat\beta_1.

  7. Ex. 105.7Application

    Używając Y^=32,4+2,5X\hat Y = 32{,}4 + 2{,}5X, pracownik z 14 latami doświadczenia zarabia R$ 72 tys./rok. Oblicz resztę.

  8. Ex. 105.8ApplicationAnswer key

    Pięć obserwowanych wartości YY: (8,10,12,9,11)(8, 10, 12, 9, 11) z Yˉ=10\bar Y = 10. SSE regresji to 3,2. Oblicz SST, SSR i R2R^2.

  9. Ex. 105.9Application

    Regresja z n=20n=20 dała SSE=48,6SSE = 48{,}6. Oblicz MSEMSE i σ^\hat\sigma i zinterpretuj.

  10. Ex. 105.10Application

    β^1=3,6\hat\beta_1 = 3{,}6, σ^=2,1\hat\sigma = 2{,}1, Sxx=144S_{xx} = 144. Oblicz SE(β^1)SE(\hat\beta_1) i statystykę TT.

  11. Ex. 105.11Application

    n=30n=30, β^1=1,4\hat\beta_1 = 1{,}4, SE(β^1)=0,38SE(\hat\beta_1) = 0{,}38. Skonstruuj PU 95% dla β1\beta_1 i zinterpretuj.

  12. Ex. 105.12Application

    r=0,73r = -0{,}73, sX=4s_X = 4, sY=6s_Y = 6. Jaki jest znak β^1\hat\beta_1? Oblicz β^1\hat\beta_1 używając relacji β^1=r(sY/sX)\hat\beta_1 = r(s_Y/s_X).

  13. Ex. 105.13UnderstandingAnswer key

    Które stwierdzenie o linii najmniejszych kwadratów jest POPRAWNE?

  14. Ex. 105.14Understanding

    Jaka jest poprawna interpretacja R2=0R^2 = 0 w prostej regresji liniowej?

  15. Ex. 105.15Understanding

    Regresja dała R2=0,85R^2 = 0{,}85 i β^1=2,3>0\hat\beta_1 = 2{,}3 > 0. Co można wnioskować?

  16. Ex. 105.16Modeling

    Agent nieruchomości z Kurytyby zebrał dane z 10 apartamentów: powierzchnia (XX, w m²) i koszt wynajmu (YY, w R$/miesiąc). Xˉ=80\bar X=80, Yˉ=1600\bar Y=1600, Sxx=3200S_{xx}=3200, Sxy=64000S_{xy}=64000. Dostosuj linię i przewidź czynsz dla apartamentu 95 m².

  17. Ex. 105.17Modeling

    Dzieci w wieku 10 do 25 lat: Xˉ=22\bar X = 22 lat, Yˉ=74\bar Y = 74 kg, sX=2,3s_X = 2{,}3, sY=8,5s_Y = 8{,}5, r=0,82r = 0{,}82. Dostosuj linię używając β^1=r(sY/sX)\hat\beta_1 = r(s_Y/s_X) i przewidź wagę dziecka w wieku 30 lat.

  18. Ex. 105.18ModelingAnswer key

    Regresja z n=25n=25, SST=1200SST=1200, R2=0,72R^2=0{,}72. Skonstruuj tabelę ANOVA (SSR, SSE, MSR, MSE, F) i testuj H0:β1=0H_0: \beta_1 = 0 na poziomie 5%.

  19. Ex. 105.19Modeling

    Regresja zużycia wody (litrów/dzień) vs. temperatura (°C) dała Y^=50+8X\hat Y = 50 + 8X z R2=0,91R^2=0{,}91 dla n=30n=30 punktów. Punkt (15;430)(15; 430) wygląda znacznie poza innymi. Jaką procedurę użyć do oceny jego wpływu?

  20. Ex. 105.20Modeling

    Firma transportowa zanotowała liczbę zamówień XX i miesięczny koszt logistyki YY (w R$ tys.) dla 5 filii: (10,100)(10,100), (20,180)(20,180), (30,270)(30,270), (40,340)(40,340), (50,400)(50,400). Dostosuj linię.

  21. Ex. 105.21Application

    Używając Y^=30+7,6X\hat Y = 30 + 7{,}6X, oblicz prognozę i resztę dla filii z X=35X=35 zamówieniami i obserwowanym kosztem R$ 310 tys.

  22. Ex. 105.22Application

    Dla regresji z Ćwiczenia 105.20, oblicz 5 reszt, SSE i resztkowe odchylenie standardowe σ^\hat\sigma.

  23. Ex. 105.23Understanding

    Wykres reszt vs. Y^\hat Y ma kształt lejka (rosnąca wariancja). Co to wskazuje?

  24. Ex. 105.24Application

    Dla regresji z Ćwiczenia 105.20 (Y^=30+7,6X\hat Y = 30 + 7{,}6X, n=5n=5, Xˉ=30\bar X=30, Sxx=1000S_{xx}=1000, σ^10,95\hat\sigma \approx 10{,}95), skonstruuj PU 95% dla średniego kosztu filii z X=40X^*=40 zamówieniami. Użyj t3;0,025=3,182t_{3;\,0{,}025} = 3{,}182.

  25. Ex. 105.25ChallengeAnswer key

    Udowodnij algebraicznie, że dla prostej regresji liniowej R2=r2R^2 = r^2 (kwadrat współczynnika korelacji Pearsona).

  26. Ex. 105.26ChallengeAnswer key

    Wyprowadź formuły dla β^0\hat\beta_0 i β^1\hat\beta_1 przez minimalizację SSE=(Yiβ0β1Xi)2SSE = \sum (Y_i - \beta_0 - \beta_1 X_i)^2 za pomocą rachunku różniczkowego (równania normalne).

  27. Ex. 105.27Proof

    Udowodnij, że dla każdej linii najmniejszych kwadratów suma reszt wynosi zero: i=1nei=0\sum_{i=1}^n e_i = 0.

  28. Ex. 105.28Challenge

    Dane podsumowane: n=15n=15, Xˉ=12\bar X=12, Yˉ=45\bar Y=45, Sxx=420S_{xx}=420, Sxy=1260S_{xy}=1260, Syy=4800S_{yy}=4800. Oblicz: dopasowaną linię, R2R^2, test H0:β1=0H_0:\beta_1=0 na poziomie 5%.

  29. Ex. 105.29Challenge

    Dlaczego zmniejszenie zmienności XX (zawężenie próbkowanego przedziału) pogarsza szacowanie β1\beta_1? Powiąż z formułą SE(β^1)SE(\hat\beta_1).

  30. Ex. 105.30Proof

    Udowodnij, że estymatory OLS β^0\hat\beta_0 i β^1\hat\beta_1 są nieobciążone, tzn. E[β^j]=βjE[\hat\beta_j] = \beta_j.

Źródła

  • Statistics — OpenStax — Illowsky, Dean · CC-BY · Rozdziały 12 (Linear Regression and Correlation). Źródło podstawowe dla przykładów, równań i ćwiczeń tej lekcji.
  • OpenIntro Statistics (4ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA · Rozdział 7 (Introduction to linear regression). Źródło podstawowe do diagnostyki reszt, wnioskowania i ćwiczeń z rzeczywistymi danymi.
  • Probabilidade e Estatística — Wikilivros — współpracownicy · CC-BY-SA · Sekcja regresji liniowej. Odniesienie w PT-BR z notacją kompatybilną z krajowym programem nauczania.

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.