Math ClubMath Club
v1 · padrão canônico

Lição 107 — ANOVA one-way

Analiza wariancji (ANOVA one-way): rozkład SST = SSB + SSW, statystyka F, tabela ANOVA, weryfikacja założeń, test post-hoc Tukeya, wielkość efektu eta².

Used in: 3.º ano EM — Estatística Inferencial · Stochastik LK alemão · H2 Math singapurense (estatística) · Math B japonês

F=MSentreMSdentro=SSB/(k1)SSW/(Nk)F = \frac{MS_{\text{entre}}}{MS_{\text{dentro}}} = \frac{SSB/(k-1)}{SSW/(N-k)}
Choose your door

Rigorous notation, full derivation, hypotheses

Definicja rygorystyczna

Problem: porównanie k średnich przy użyciu jednego testu

Załóż, że masz k2k \geq 2 niezależnych grup i chcesz sprawdzić, czy średnie populacyjne μ1,,μk\mu_1, \ldots, \mu_k są równe. Przeprowadzenie (k2)\binom{k}{2} oddzielnych testów tt inflacjonuje błąd typu I. ANOVA rozwiązuje to problemem za pomocą jednego globalnego testu.

"In a one-way analysis of variance problem, we are interested in comparing the means of kk populations. If the means are all equal, we say the treatments, or factor levels, are not different from one another. If at least one mean differs, we say the treatments are different." — OpenStax Statistics §13.1

Rozkład całkowitej wariancji

Grupa 1Ȳ₁ = 75Grupa 2Ȳ₂ = 110Grupa 3Ȳ₃ = 140Ȳ

Trzy grupy z różnymi średnimi. Linia kolorowa kreska = średnia grupy (). Linia szara przerywana = wielka średnia (). SSB mierzy, jak daleko kolorowe średnie odbiegają od szarej; SSW mierzy rozrzut punktów wokół własnych średnich.

Statystyka F i tabela ANOVA

"The one-way ANOVA test statistic FF is the ratio of two independent chi-square variables divided by their respective degrees of freedom... Under the null hypothesis, FF follows an FF distribution with k1k-1 and NkN-k degrees of freedom." — OpenStax Statistics §13.2

Założenia modelu

Wielkość efektu

Przykłady rozwiązane

Exercise list

42 exercises · 10 with worked solution (25%)

Application 17Understanding 10Modeling 5Challenge 6Proof 4
  1. Ex. 107.1Application

    Eksperyment porównuje 3 grupy z 10 obserwacjami każda. Określ dfBdf_B i dfWdf_W.

  2. Ex. 107.2ApplicationAnswer key

    Badacz używa 5 grup z 10 uczestnikami każda. Określ dfBdf_B i dfWdf_W.

  3. Ex. 107.3Application

    W eksperymencie z 3 grupami SSB=40SSB = 40 (dfB=2df_B = 2) i SSW=150SSW = 150 (dfW=30df_W = 30). Oblicz MSBMS_B i MSWMS_W.

  4. Ex. 107.4ApplicationAnswer key

    Na podstawie wartości z ćwiczenia 107.3 oblicz statystykę FF.

  5. Ex. 107.5Application

    Wartość F=4,0F = 4{,}0 z df=(2,30)df = (2, 30) i α=0,05\alpha = 0{,}05 (krytyczne 3,32\approx 3{,}32). Jaki jest prawidłowy wniosek?

  6. Ex. 107.6Application

    SST=200SST = 200 i SSB=80SSB = 80. Oblicz η2\eta^2 i sklasyfikuj wielkość efektu.

  7. Ex. 107.7Application

    Używając danych z ćwiczenia 107.6 (SST=200SST = 200, SSB=80SSB = 80), określ SSWSSW.

  8. Ex. 107.8ApplicationAnswer key

    Dlaczego przy H0H_0 oczekuje się że F1F \approx 1? Wyjaśnij w kategoriach tego co estymują MSBMS_B i MSWMS_W.

  9. Ex. 107.9Application

    Trzy grupy z n=15n = 15 każda. Średnie grup: 9, 11 i 13. Oblicz wielką średnią Yˉ\bar{Y}.

  10. Ex. 107.10Application

    Używając danych z ćwiczenia 107.9 oblicz SSBSSB.

  11. Ex. 107.11Understanding

    Dlaczego nie robić wielu testów tt aby porównać 4 grupy? Oblicz prawdopodobieństwo co najmniej jednego fałszywego pozytywu z α=0,05\alpha = 0{,}05.

  12. Ex. 107.12Understanding

    Wymień trzy założenia ANOVA one-way. Z n=8n = 8 na grupę i odchyleniami standardowymi s1=3s_1 = 3, s2=3s_2 = 3, s3=9s_3 = 9, które założenie jest podejrzane?

  13. Ex. 107.13Understanding

    Badanie ma k=3k = 3 grupy z n=8n = 8. Shapiro-Wilk odrzuca normalność w grupie (p=0,008p = 0{,}008). Stosunek wariancji: 9:1. Jaki test użyć?

  14. Ex. 107.14UnderstandingAnswer key

    Do czego służy test Levene'a przed ANOVA? Jaki wniosek wyciągnąć z p=0,38p = 0{,}38?

  15. Ex. 107.15Understanding

    ANOVA odrzuca H0H_0 w eksperymencie z 5 grupami. Co to znaczy? Co robić dalej?

  16. Ex. 107.16UnderstandingAnswer key

    Porównaj Tukey HSD i Bonferroni: który jest bardziej konserwatywny? Kiedy użyć każdego?

  17. Ex. 107.17Understanding

    Dla k=2k = 2 grup jak się mają FF ANOVA i tt testu dwóch próbek? Czy wartości p się pokrywają?

  18. Ex. 107.18UnderstandingAnswer key

    Opisz kształt rozkładu FF z małymi stopniami swobody. Dlaczego FF nigdy nie jest ujemny?

  19. Ex. 107.19Understanding

    Konwertuj η2=0,09\eta^2 = 0{,}09 na Cohen's ff i sklasyfikuj wielkość efektu.

  20. Ex. 107.20Understanding

    Dlaczego E[MSW]=σ2E[MS_W] = \sigma^2 nawet dla H1H_1, ale E[MSB]>σ2E[MS_B] > \sigma^2 dla H1H_1?

  21. Ex. 107.21Application

    Trzy grupy z n=8n = 8 każda. Średnie: 12, 15 i 18. Oblicz SSBSSB i MSBMS_B.

  22. Ex. 107.22ApplicationAnswer key

    Kontynuacja ćwiczenia 107.21: SSW=336SSW = 336 i dfW=21df_W = 21. Oblicz FF i zdecyduj przy α=0,05\alpha = 0{,}05 (krytyczne 3,47\approx 3{,}47).

  23. Ex. 107.23Application

    Używając danych z ćwiczeń 107.21–107.22 (SSB=144SSB = 144, SSW=336SSW = 336) oblicz η2\eta^2.

  24. Ex. 107.24Application

    4 grupy z n=12n = 12 każda. SSB=120SSB = 120 i SSW=440SSW = 440. Przeprowadź pełną ANOVA przy α=0,05\alpha = 0{,}05 (krytyczne F3,442,82F_{3,44} \approx 2{,}82) i oblicz η2\eta^2.

  25. Ex. 107.25Application

    Uzupełnij tabelę ANOVA: MSB=12MS_B = 12, MSW=2MS_W = 2. Oblicz FF.

  26. Ex. 107.26ModelingAnswer key

    Nauczyciel chce porównać trzy metody nauczania (A, B, C) z 20 uczniami każda, oceniane testem. Sformalizuj model ANOVA, hipotezy i niezbędne założenia.

  27. Ex. 107.27Modeling

    Badanie kliniczne porównuje 4 diety dla utraty wagi z 40 uczestnikami każda. Opisz jak weryfikować założenia ANOVA przed przeprowadzeniem testu.

  28. Ex. 107.28Modeling

    Badacz porównuje 3 algorytmy ML testowane na tych samych 30 zbiorach danych. Czy ANOVA one-way jest odpowiednia? Uzasadnij.

  29. Ex. 107.29Modeling

    Pięć sklepów monitoruje sprzedaż tygodniową przez 30 tygodni. Chcesz użyć ANOVA. Naszkicuj: dfBdf_B, dfWdf_W i czy n=30n = 30 wystarczy do wykrycia efektu średniego (Cohen's f=0,25f = 0{,}25, moc 80%).

  30. Ex. 107.30Modeling

    Laboratorium chemiczne porównuje cztery stężenia katalizatora (0, 5, 10, 20 g/L) na wydajności reakcji z 10 replikacjami każda. Uzasadnij użycie ANOVA one-way i wymień założenia do weryfikacji.

  31. Ex. 107.31Application

    4 diety, 25 osób każda. Straty wagi (kg) — średnie na diecie: 3, 4, 5 i 4,5. Oblicz SSBSSB.

  32. Ex. 107.32ApplicationAnswer key

    SST=300SST = 300 i η2=0,5\eta^2 = 0{,}5. Określ SSBSSB i SSWSSW.

  33. Ex. 107.33ChallengeAnswer key

    Wyprowadź algebraicznie rozkład SST=SSB+SSWSST = SSB + SSW. Wykaż jawnie dlaczego człony krzyżowe się anulują.

  34. Ex. 107.34Challenge

    Wykaż że dla k=2k = 2 grup zbalansowanych, statystyka FF ANOVA równa się kwadratowi statystyki tt testu dwóch próbek ze wspólną wariancją.

  35. Ex. 107.35Challenge

    Argumentuj (bez pełnego dowodu) dlaczego dla H0H_0, SSB/σ2χk12SSB/\sigma^2 \sim \chi^2_{k-1} i SSW/σ2χNk2SSW/\sigma^2 \sim \chi^2_{N-k} są niezależne. Jak to implikuje że FFk1,NkF \sim F_{k-1, N-k}?

  36. Ex. 107.36Challenge

    Co się dzieje z ANOVA gdy grupy mają znacznie różne rozmiary (skrajny brak równości)? Test jest wciąż ważny?

  37. Ex. 107.37Challenge

    Aby wykryć efekt średni (f=0,25f = 0{,}25) między 4 grupami przy α=0,05\alpha = 0{,}05 z mocą 80%, ile osób na grupę potrzeba (w przybliżeniu)? Z n=25n = 25 na grupę, badanie jest odpowiednio zaplanowane?

  38. Ex. 107.38Challenge

    Co to jest faktor Bayesa BF10BF_{10} w ANOVA bayesowskiej? Jak zinterpretować BF10=15BF_{10} = 15 kontra BF10=0,08BF_{10} = 0{,}08?

  39. Ex. 107.39Proof

    Udowodnij że SST=SSB+SSWSST = SSB + SSW pokazując że człony krzyżowe się anulują przy sumowaniu po jj dla każdego ustalonego ii.

  40. Ex. 107.40Proof

    Wykaż że E[MSB]=σ2E[MS_B] = \sigma^2 dla H0H_0 (dla grup zbalansowanych, ni=nn_i = n).

  41. Ex. 107.41Proof

    Wyprowadź statystykę testu Kruskal-Wallis i wyjaśnij dlaczego jest to nieparametryczny analog ANOVA one-way.

  42. Ex. 107.42Proof

    Wyprowadź statystykę FF^* ANOVA Welcha dla nierównych wariancji. Wyjaśnij jak są korygowane stopnie swobody mianownika.

Fonty

  • OpenStax — Statistics — Illowsky, Dean · CC-BY 4.0 · §13.1–13.4. Główne źródło tej lekcji. Definicja modelu, statystyka F, tabela ANOVA, ćwiczenia aplikacyjne.

  • OpenIntro Statistics (4.ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA 3.0 · §7.5. Założenia modelu, homogeniczność, post-hoc Tukey'a i Bonferroniego.

  • Learning Statistics with R — Navarro · CC-BY-SA 4.0 · r. 14. Intuicja geometryczna dla F, wielkość efektu η2\eta^2, ANOVA Welcha, ANOVA bayesowska.

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.