Lição 107 — ANOVA one-way
Analiza wariancji (ANOVA one-way): rozkład SST = SSB + SSW, statystyka F, tabela ANOVA, weryfikacja założeń, test post-hoc Tukeya, wielkość efektu eta².
Used in: 3.º ano EM — Estatística Inferencial · Stochastik LK alemão · H2 Math singapurense (estatística) · Math B japonês
Rigorous notation, full derivation, hypotheses
Definicja rygorystyczna
Problem: porównanie k średnich przy użyciu jednego testu
Załóż, że masz niezależnych grup i chcesz sprawdzić, czy średnie populacyjne są równe. Przeprowadzenie oddzielnych testów inflacjonuje błąd typu I. ANOVA rozwiązuje to problemem za pomocą jednego globalnego testu.
"In a one-way analysis of variance problem, we are interested in comparing the means of populations. If the means are all equal, we say the treatments, or factor levels, are not different from one another. If at least one mean differs, we say the treatments are different." — OpenStax Statistics §13.1
Rozkład całkowitej wariancji
Trzy grupy z różnymi średnimi. Linia kolorowa kreska = średnia grupy (). Linia szara przerywana = wielka średnia (). SSB mierzy, jak daleko kolorowe średnie odbiegają od szarej; SSW mierzy rozrzut punktów wokół własnych średnich.
Statystyka F i tabela ANOVA
"The one-way ANOVA test statistic is the ratio of two independent chi-square variables divided by their respective degrees of freedom... Under the null hypothesis, follows an distribution with and degrees of freedom." — OpenStax Statistics §13.2
Założenia modelu
Wielkość efektu
Przykłady rozwiązane
Exercise list
42 exercises · 10 with worked solution (25%)
- Ex. 107.1Application
Eksperyment porównuje 3 grupy z 10 obserwacjami każda. Określ i .
- Ex. 107.2ApplicationAnswer key
Badacz używa 5 grup z 10 uczestnikami każda. Określ i .
- Ex. 107.3Application
W eksperymencie z 3 grupami () i (). Oblicz i .
- Ex. 107.4ApplicationAnswer key
Na podstawie wartości z ćwiczenia 107.3 oblicz statystykę .
- Ex. 107.5Application
Wartość z i (krytyczne ). Jaki jest prawidłowy wniosek?
- Ex. 107.6Application
i . Oblicz i sklasyfikuj wielkość efektu.
- Ex. 107.7Application
Używając danych z ćwiczenia 107.6 (, ), określ .
- Ex. 107.8ApplicationAnswer key
Dlaczego przy oczekuje się że ? Wyjaśnij w kategoriach tego co estymują i .
- Ex. 107.9Application
Trzy grupy z każda. Średnie grup: 9, 11 i 13. Oblicz wielką średnią .
- Ex. 107.10Application
Używając danych z ćwiczenia 107.9 oblicz .
- Ex. 107.11Understanding
Dlaczego nie robić wielu testów aby porównać 4 grupy? Oblicz prawdopodobieństwo co najmniej jednego fałszywego pozytywu z .
- Ex. 107.12Understanding
Wymień trzy założenia ANOVA one-way. Z na grupę i odchyleniami standardowymi , , , które założenie jest podejrzane?
- Ex. 107.13Understanding
Badanie ma grupy z . Shapiro-Wilk odrzuca normalność w grupie (). Stosunek wariancji: 9:1. Jaki test użyć?
- Ex. 107.14UnderstandingAnswer key
Do czego służy test Levene'a przed ANOVA? Jaki wniosek wyciągnąć z ?
- Ex. 107.15Understanding
ANOVA odrzuca w eksperymencie z 5 grupami. Co to znaczy? Co robić dalej?
- Ex. 107.16UnderstandingAnswer key
Porównaj Tukey HSD i Bonferroni: który jest bardziej konserwatywny? Kiedy użyć każdego?
- Ex. 107.17Understanding
Dla grup jak się mają ANOVA i testu dwóch próbek? Czy wartości p się pokrywają?
- Ex. 107.18UnderstandingAnswer key
Opisz kształt rozkładu z małymi stopniami swobody. Dlaczego nigdy nie jest ujemny?
- Ex. 107.19Understanding
Konwertuj na Cohen's i sklasyfikuj wielkość efektu.
- Ex. 107.20Understanding
Dlaczego nawet dla , ale dla ?
- Ex. 107.21Application
Trzy grupy z każda. Średnie: 12, 15 i 18. Oblicz i .
- Ex. 107.22ApplicationAnswer key
Kontynuacja ćwiczenia 107.21: i . Oblicz i zdecyduj przy (krytyczne ).
- Ex. 107.23Application
Używając danych z ćwiczeń 107.21–107.22 (, ) oblicz .
- Ex. 107.24Application
4 grupy z każda. i . Przeprowadź pełną ANOVA przy (krytyczne ) i oblicz .
- Ex. 107.25Application
Uzupełnij tabelę ANOVA: , . Oblicz .
- Ex. 107.26ModelingAnswer key
Nauczyciel chce porównać trzy metody nauczania (A, B, C) z 20 uczniami każda, oceniane testem. Sformalizuj model ANOVA, hipotezy i niezbędne założenia.
- Ex. 107.27Modeling
Badanie kliniczne porównuje 4 diety dla utraty wagi z 40 uczestnikami każda. Opisz jak weryfikować założenia ANOVA przed przeprowadzeniem testu.
- Ex. 107.28Modeling
Badacz porównuje 3 algorytmy ML testowane na tych samych 30 zbiorach danych. Czy ANOVA one-way jest odpowiednia? Uzasadnij.
- Ex. 107.29Modeling
Pięć sklepów monitoruje sprzedaż tygodniową przez 30 tygodni. Chcesz użyć ANOVA. Naszkicuj: , i czy wystarczy do wykrycia efektu średniego (Cohen's , moc 80%).
- Ex. 107.30Modeling
Laboratorium chemiczne porównuje cztery stężenia katalizatora (0, 5, 10, 20 g/L) na wydajności reakcji z 10 replikacjami każda. Uzasadnij użycie ANOVA one-way i wymień założenia do weryfikacji.
- Ex. 107.31Application
4 diety, 25 osób każda. Straty wagi (kg) — średnie na diecie: 3, 4, 5 i 4,5. Oblicz .
- Ex. 107.32ApplicationAnswer key
i . Określ i .
- Ex. 107.33ChallengeAnswer key
Wyprowadź algebraicznie rozkład . Wykaż jawnie dlaczego człony krzyżowe się anulują.
- Ex. 107.34Challenge
Wykaż że dla grup zbalansowanych, statystyka ANOVA równa się kwadratowi statystyki testu dwóch próbek ze wspólną wariancją.
- Ex. 107.35Challenge
Argumentuj (bez pełnego dowodu) dlaczego dla , i są niezależne. Jak to implikuje że ?
- Ex. 107.36Challenge
Co się dzieje z ANOVA gdy grupy mają znacznie różne rozmiary (skrajny brak równości)? Test jest wciąż ważny?
- Ex. 107.37Challenge
Aby wykryć efekt średni () między 4 grupami przy z mocą 80%, ile osób na grupę potrzeba (w przybliżeniu)? Z na grupę, badanie jest odpowiednio zaplanowane?
- Ex. 107.38Challenge
Co to jest faktor Bayesa w ANOVA bayesowskiej? Jak zinterpretować kontra ?
- Ex. 107.39Proof
Udowodnij że pokazując że człony krzyżowe się anulują przy sumowaniu po dla każdego ustalonego .
- Ex. 107.40Proof
Wykaż że dla (dla grup zbalansowanych, ).
- Ex. 107.41Proof
Wyprowadź statystykę testu Kruskal-Wallis i wyjaśnij dlaczego jest to nieparametryczny analog ANOVA one-way.
- Ex. 107.42Proof
Wyprowadź statystykę ANOVA Welcha dla nierównych wariancji. Wyjaśnij jak są korygowane stopnie swobody mianownika.
Fonty
-
OpenStax — Statistics — Illowsky, Dean · CC-BY 4.0 · §13.1–13.4. Główne źródło tej lekcji. Definicja modelu, statystyka F, tabela ANOVA, ćwiczenia aplikacyjne.
-
OpenIntro Statistics (4.ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA 3.0 · §7.5. Założenia modelu, homogeniczność, post-hoc Tukey'a i Bonferroniego.
-
Learning Statistics with R — Navarro · CC-BY-SA 4.0 · r. 14. Intuicja geometryczna dla F, wielkość efektu , ANOVA Welcha, ANOVA bayesowska.