Lição 78 — Correlação e regressão linear simples
Coeficiente de Pearson r, covariância, reta de mínimos quadrados, coeficiente de determinação r². Correlação não é causalidade — o teorema de Anscombe, o quarteto que todo cientista deve conhecer.
Used in: 2.º ano do EM (16-17 anos) · Stochastik LK alemão §12 · H2 Math singapurense §19 · AP Statistics USA §3
Rigorous notation, full derivation, hypotheses
Definicje i właściwości rygorystyczne
Kowariancja
"The covariance is a measure of the joint variability of two random variables. If the greater values of one variable mainly correspond with the greater values of the other variable, and the same holds for the lesser values, the covariance is positive." — OpenStax Statistics, §12.1
Współczynnik korelacji Pearsona
Cztery wykresy rozrzutu z różnymi wartościami r. Chmura punktów skupia się bardziej wokół linii prostej, gdy |r| jest bliskie 1.
Linia najmniejszych kwadratów (OLS)
Współczynnik determinacji
Założenia LINE
Przykłady rozwiązane
Exercise list
32 exercises · 8 with worked solution (25%)
- Ex. 78.1ApplicationAnswer key
, . Oblicz bez kalkulatora i uzasadnij wynik.
- Ex. 78.2Application
, . Oblicz i zidentyfikuj oczekiwany znak przed obliczeniami.
- Ex. 78.3Application
, . Oblicz i omów czy związek jest liniowy.
- Ex. 78.4ApplicationAnswer key
Jeśli i , jaki jest związek między i ? Uzasadnij definicją.
- Ex. 78.5ApplicationAnswer key
Dane z parami: i . Oblicz .
- Ex. 78.6ApplicationAnswer key
, . Oblicz i kowariancję .
- Ex. 78.7Application
, , , , . Znajdź linię najmniejszych kwadratów.
- Ex. 78.8Application
Używając linii z ćwiczenia 78.7 (), przewidź dla i dla .
- Ex. 78.9Application
Z (ćwiczenie 78.7), oblicz i zinterpretuj w kategoriach wyjaśnionej wariancji.
- Ex. 78.10Application
Używając linii z 78.7, oblicz resztę punktu .
- Ex. 78.11Understanding
Co oznacza ?
- Ex. 78.12Understanding
Sprzedaż lodów koreluje dodatnio ze śmiercią przez utonięcie (). Najlepsze wyjaśnienie to:
- Ex. 78.13Application
Z , , , oblicz nachylenia dwóch linii regresji: na i na . Czy linie się pokrywają?
- Ex. 78.14Application
Model regresji wyjaśnia 64% wariancji wydatków jako funkcję dochodu. Jaka jest ?
- Ex. 78.15Application
Jeśli , jaki jest związek między i ?
- Ex. 78.16Modeling
Związek wzrost () vs. waga (): cm, kg, cm, kg, . Równanie linii i prognoza dla osoby o wzroście 175 cm.
- Ex. 78.17Modeling
Badacz znalazł między Wskaźnikiem Postrzegania Korupcji a PKB per capita w 120 krajach. Zinterpretuj i omów ograniczenia przyczynowe.
- Ex. 78.18Modeling
Wykres reszt vs. wartości dopasowanych pokazuje wzór w kształcie U (reszty najpierw ujemne, potem dodatnie). Co to wskazuje o modelu liniowym?
- Ex. 78.19Application
, . Testuj vs. na poziomie 5%.
- Ex. 78.20Application
, . Skonstruuj PU 95% dla używając transformacji Fishera.
- Ex. 78.21Modeling
Dla każdej pary, zidentyfikuj czy to korelacja przyczynowa, pozorna, czy odwrotna przyczynowość: (a) deszcz i sprzedaż parasoli; (b) liczba policjantów i przestępczość na miasto.
- Ex. 78.22ApplicationAnswer key
Zinterpretuj w badaniu, które wiąże lata nauki z wynagrodzeniem.
- Ex. 78.23Application
Wyjaśnij ryzyko ekstrapolacji linii regresji dla wartości poza zakresem próbki.
- Ex. 78.24Modeling
W finansach "beta" akcji to współczynnik regresji zwrotu akcji na zwrot rynkowy. Wyraź beta w kategoriach , i .
- Ex. 78.25Modeling
Dystrybutor energii ma miesięczne dane temperatury średniej (°C) i zużycia (MWh) z ostatnich 5 lat. Opisz przepływ analizy korelacji i regresji do prognozy zużycia.
- Ex. 78.26Application
Cztery zestawy Anscomba mają i tę samą linię regresji. Dlaczego model liniowy jest adekwatny dla zestawu I ale nie dla trzech pozostałych?
- Ex. 78.27ModelingAnswer key
Dlaczego korelacja Spearmana jest bardziej adekwatna niż Pearson dla danych porządkowych (np.: satysfakcja 1 do 5) lub z odstającymi?
- Ex. 78.28Modeling
Rozróżnij zmienną mylącą, mediatora i moderatora w badaniu obserwacyjnym.
- Ex. 78.29ChallengeAnswer key
pary; ; SQT = 500. Oblicz Sumę Kwadratów Reszt (SQR) i RMSE.
- Ex. 78.30Challenge
Dlaczego nigdy nie maleje gdy dodajemy zmienną do modelu, i jak skorygowany rozwiązuje ten problem?
- Ex. 78.31Understanding
Jaka właściwość definiuje linię najmniejszych kwadratów (OLS)?
- Ex. 78.32ProofAnswer key
Udowodnij że używając nierówności Cauchy'ego-Schwarza.
Fonty
- OpenStax Statistics — Illowsky, Dean · 2022 · CC-BY. Główne źródło ćwiczeń 78.1–2, 78.5–10, 78.14, 78.16, 78.19–20, 78.22–25, 78.29–31 i przykładów 1–3, 5.
- OpenIntro Statistics (4. ed) — Diez, Çetinkaya-Rundel, Barr · 2019 · CC-BY-SA. Źródło ćwiczeń 78.3, 78.9, 78.11–12, 78.17–18, 78.21, 78.23, 78.26–28, 78.32 i przykład 4.
- Introduction to Probability (Grinstead-Snell) — Grinstead, Snell · Dartmouth · GNU FDL. Źródło ćwiczeń 78.4, 78.13, 78.15 i dowód |r| ≤ 1.