Math ClubMath Club
v1 · padrão canônico

Lição 78 — Correlação e regressão linear simples

Coeficiente de Pearson r, covariância, reta de mínimos quadrados, coeficiente de determinação r². Correlação não é causalidade — o teorema de Anscombe, o quarteto que todo cientista deve conhecer.

Used in: 2.º ano do EM (16-17 anos) · Stochastik LK alemão §12 · H2 Math singapurense §19 · AP Statistics USA §3

r=i=1n(xixˉ)(yiyˉ)i=1n(xixˉ)2i=1n(yiyˉ)2r = \frac{\displaystyle\sum_{i=1}^n (x_i - \bar x)(y_i - \bar y)}{\sqrt{\displaystyle\sum_{i=1}^n (x_i-\bar x)^2 \cdot \sum_{i=1}^n (y_i-\bar y)^2}}
Choose your door

Rigorous notation, full derivation, hypotheses

Definicje i właściwości rygorystyczne

Kowariancja

"The covariance is a measure of the joint variability of two random variables. If the greater values of one variable mainly correspond with the greater values of the other variable, and the same holds for the lesser values, the covariance is positive." — OpenStax Statistics, §12.1

Współczynnik korelacji Pearsona

r ≈ +1r ≈ −1r ≈ 0r ≈ 0.7

Cztery wykresy rozrzutu z różnymi wartościami r. Chmura punktów skupia się bardziej wokół linii prostej, gdy |r| jest bliskie 1.

Linia najmniejszych kwadratów (OLS)

Współczynnik determinacji

r2=1SQRSQT,SQT=(yiyˉ)2r^2 = 1 - \frac{\text{SQR}}{\text{SQT}}, \quad \text{SQT} = \sum(y_i - \bar y)^2
what this means · r² mierzy frakcję wariancji Y wyjaśnioną przez model liniowy w X.

Założenia LINE

Przykłady rozwiązane

Exercise list

32 exercises · 8 with worked solution (25%)

Application 18Understanding 3Modeling 8Challenge 2Proof 1
  1. Ex. 78.1ApplicationAnswer key

    X=(1,2,3,4)X = (1, 2, 3, 4), Y=(2,4,6,8)Y = (2, 4, 6, 8). Oblicz rr bez kalkulatora i uzasadnij wynik.

  2. Ex. 78.2Application

    X=(1,2,3,4)X = (1, 2, 3, 4), Y=(8,6,4,2)Y = (8, 6, 4, 2). Oblicz rr i zidentyfikuj oczekiwany znak przed obliczeniami.

  3. Ex. 78.3Application

    X=(1,2,3)X = (1, 2, 3), Y=(1,4,9)Y = (1, 4, 9). Oblicz rr i omów czy związek jest liniowy.

  4. Ex. 78.4ApplicationAnswer key

    Jeśli U=X+5U = X + 5 i V=2YV = 2Y, jaki jest związek między r(U,V)r(U, V) i r(X,Y)r(X, Y)? Uzasadnij definicją.

  5. Ex. 78.5ApplicationAnswer key

    Dane z n=5n = 5 parami: x=(1,2,3,4,5)x = (1, 2, 3, 4, 5) i y=(10,7,5,4,3)y = (10, 7, 5, 4, 3). Oblicz rr.

  6. Ex. 78.6ApplicationAnswer key

    X=(1,2,3,4,5)X = (1, 2, 3, 4, 5), Y=(1,4,5,9,10)Y = (1, 4, 5, 9, 10). Oblicz rr i kowariancję sxys_{xy}.

  7. Ex. 78.7Application

    r=0,85r = 0,85, xˉ=10\bar x = 10, yˉ=50\bar y = 50, sx=3s_x = 3, sy=12s_y = 12. Znajdź linię najmniejszych kwadratów.

  8. Ex. 78.8Application

    Używając linii z ćwiczenia 78.7 (y^=16+3,4x\hat y = 16 + 3,4x), przewidź YY dla x=15x = 15 i dla x=5x = 5.

  9. Ex. 78.9Application

    Z r=0,85r = 0,85 (ćwiczenie 78.7), oblicz r2r^2 i zinterpretuj w kategoriach wyjaśnionej wariancji.

  10. Ex. 78.10Application

    Używając linii z 78.7, oblicz resztę punktu (10,55)(10, 55).

  11. Ex. 78.11Understanding

    Co oznacza r=0r = 0?

  12. Ex. 78.12Understanding

    Sprzedaż lodów koreluje dodatnio ze śmiercią przez utonięcie (r0,8r \approx 0,8). Najlepsze wyjaśnienie to:

  13. Ex. 78.13Application

    Z r=0,6r = 0,6, sx=2s_x = 2, sy=5s_y = 5, oblicz nachylenia dwóch linii regresji: YY na XX i XX na YY. Czy linie się pokrywają?

  14. Ex. 78.14Application

    Model regresji wyjaśnia 64% wariancji wydatków jako funkcję dochodu. Jaka jest r|r|?

  15. Ex. 78.15Application

    Jeśli V=YV = -Y, jaki jest związek między r(X,V)r(X, V) i r(X,Y)r(X, Y)?

  16. Ex. 78.16Modeling

    Związek wzrost (XX) vs. waga (YY): xˉ=170\bar x = 170 cm, yˉ=70\bar y = 70 kg, sx=8s_x = 8 cm, sy=12s_y = 12 kg, r=0,75r = 0,75. Równanie linii i prognoza dla osoby o wzroście 175 cm.

  17. Ex. 78.17Modeling

    Badacz znalazł r=0,82r = 0,82 między Wskaźnikiem Postrzegania Korupcji a PKB per capita w 120 krajach. Zinterpretuj r2r^2 i omów ograniczenia przyczynowe.

  18. Ex. 78.18Modeling

    Wykres reszt vs. wartości dopasowanych pokazuje wzór w kształcie U (reszty najpierw ujemne, potem dodatnie). Co to wskazuje o modelu liniowym?

  19. Ex. 78.19Application

    n=25n = 25, r=0,45r = 0,45. Testuj H0:ρ=0H_0: \rho = 0 vs. H1:ρ0H_1: \rho \neq 0 na poziomie 5%.

  20. Ex. 78.20Application

    n=50n = 50, r=0,60r = 0,60. Skonstruuj PU 95% dla ρ\rho używając transformacji Fishera.

  21. Ex. 78.21Modeling

    Dla każdej pary, zidentyfikuj czy to korelacja przyczynowa, pozorna, czy odwrotna przyczynowość: (a) deszcz i sprzedaż parasoli; (b) liczba policjantów i przestępczość na miasto.

  22. Ex. 78.22ApplicationAnswer key

    Zinterpretuj r2=0,25r^2 = 0,25 w badaniu, które wiąże lata nauki z wynagrodzeniem.

  23. Ex. 78.23Application

    Wyjaśnij ryzyko ekstrapolacji linii regresji dla wartości xx poza zakresem próbki.

  24. Ex. 78.24Modeling

    W finansach "beta" akcji to współczynnik regresji zwrotu akcji na zwrot rynkowy. Wyraź beta w kategoriach rr, sris_{r_i} i srms_{r_m}.

  25. Ex. 78.25Modeling

    Dystrybutor energii ma miesięczne dane temperatury średniej (°C) i zużycia (MWh) z ostatnich 5 lat. Opisz przepływ analizy korelacji i regresji do prognozy zużycia.

  26. Ex. 78.26Application

    Cztery zestawy Anscomba mają r0,82r \approx 0,82 i tę samą linię regresji. Dlaczego model liniowy jest adekwatny dla zestawu I ale nie dla trzech pozostałych?

  27. Ex. 78.27ModelingAnswer key

    Dlaczego korelacja Spearmana jest bardziej adekwatna niż Pearson dla danych porządkowych (np.: satysfakcja 1 do 5) lub z odstającymi?

  28. Ex. 78.28Modeling

    Rozróżnij zmienną mylącą, mediatora i moderatora w badaniu obserwacyjnym.

  29. Ex. 78.29ChallengeAnswer key

    n=22n = 22 pary; r2=0,64r^2 = 0,64; SQT = 500. Oblicz Sumę Kwadratów Reszt (SQR) i RMSE.

  30. Ex. 78.30Challenge

    Dlaczego R2R^2 nigdy nie maleje gdy dodajemy zmienną do modelu, i jak skorygowany R2R^2 rozwiązuje ten problem?

  31. Ex. 78.31Understanding

    Jaka właściwość definiuje linię najmniejszych kwadratów (OLS)?

  32. Ex. 78.32ProofAnswer key

    Udowodnij że 1r1-1 \leq r \leq 1 używając nierówności Cauchy'ego-Schwarza.

Fonty

  • OpenStax Statistics — Illowsky, Dean · 2022 · CC-BY. Główne źródło ćwiczeń 78.1–2, 78.5–10, 78.14, 78.16, 78.19–20, 78.22–25, 78.29–31 i przykładów 1–3, 5.
  • OpenIntro Statistics (4. ed) — Diez, Çetinkaya-Rundel, Barr · 2019 · CC-BY-SA. Źródło ćwiczeń 78.3, 78.9, 78.11–12, 78.17–18, 78.21, 78.23, 78.26–28, 78.32 i przykład 4.
  • Introduction to Probability (Grinstead-Snell) — Grinstead, Snell · Dartmouth · GNU FDL. Źródło ćwiczeń 78.4, 78.13, 78.15 i dowód |r| ≤ 1.

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.