Lição 108 — Teste qui-quadrado: aderência e independência
Estatística chi-quadrado: distribuição assintótica, graus de liberdade, teste de aderência (goodness of fit) e teste de independência em tabelas de contingência. Correção de Yates, V de Cramér.
Used in: 3.º ano EM · Stochastik LK alemão · H2 Statistics singapurense · Math B japonês — estatística inferencial
Rigorous notation, full derivation, hypotheses
Definicja rygorystyczna
Rozkład chi-kwadrat
"Rozkłady chi-kwadrat mają właściwość addytywności: jeśli i są niezależne, to ." — OpenStax Statistics, §11.1
Test zgodności (goodness of fit)
Test niezależności w tabeli
"Liczebności oczekiwane dla testu niezależności są obliczane przy założeniu, że proporcje wierszy są równe we wszystkich kolumnach. Jeśli hipoteza zerowa jest prawdziwa (zmienne niezależne), to założenie jest spełnione." — OpenIntro Statistics, §6.4
Założenia ważności (reguła Cochrana)
Korekcja Yatesa (tabela )
Wielkość efektu: V Craméra
Krzywa chi-kwadrat z df = 5. Region żółty na prawo od wartości krytycznej to obszar odrzucenia H0 na poziomie alfa = 5%.
Przykłady rozwiązane
Exercise list
42 exercises · 10 with worked solution (25%)
- Ex. 108.1Application
Sześciościenna kostka jest rzucana 60 razy. Jaka jest liczba stopni swobody w teście zgodności z rozkładem jednostajnym?
- Ex. 108.2Application
Dla kostki z poprzedniego ćwiczenia rzucanej 60 razy, jaka jest oczekiwana liczebność na każdej ściance?
- Ex. 108.3Application
Kostka jest rzucana 60 razy: obserwuje się 12, 8, 11, 9, 13, 7 dla ścian 1 do 6. Oblicz i wyciągnij wnioski na 5%.
- Ex. 108.4Application
Oblicz stopnie swobody dla testu niezależności w tabeli kontyngencji .
- Ex. 108.5Application
W tabeli kontyngencji z , , , oblicz .
- Ex. 108.6Application
W teście niezależności uzyskano przy . Wartość krytyczna na 5% wynosi 5,99. Jaki jest wniosek?
- Ex. 108.7ApplicationAnswer key
Oblicz V Craméra: , , tabela (stąd ).
- Ex. 108.8ApplicationAnswer key
W jakich sytuacjach powinna się zastosować korekcję Yatesa w teście chi-kwadrat?
- Ex. 108.9ApplicationAnswer key
Badacz ma w dwóch z pięciu komórek tabeli. Czy test chi-kwadrat jest stosowny? Uzasadnij.
- Ex. 108.10Application
Obserwuje się w obserwacjach z proporcjami oczekiwanymi . Oblicz .
- Ex. 108.11Application
Dla poprzedniego ćwiczenia (3 kategorie, rozkład w pełni określony), jaka jest liczba stopni swobody?
- Ex. 108.12Application
Badanie mierzy ciśnienie krwi (wysokie/normalne) w tej samej grupie pacjentów przed i po programie ćwiczeń. Dlaczego test chi-kwadrat niezależności nie jest stosowny?
- Ex. 108.13Application
Jaka jest wartość krytyczna (chi-kwadrat z 1 stopniem swobody na poziomie 5%)?
- Ex. 108.14
Oblicz oczekiwane liczebności dla tabeli z komórkami , , , .
- Ex. 108.15
Ze średnikami z poprzedniego ćwiczenia, oblicz i wyciągnij wnioski na 5%.
- Ex. 108.16Answer key
Dlaczego w każdej tabeli kontyngencji ? Wyjaśnij geometrycznie lub algebraicznie.
- Ex. 108.17Application
Jaka jest średnia i wariancja ? Dla , czy rozkład jest w przybliżeniu symetryczny?
- Ex. 108.18Application
W teście zgodności z kategoriami, jak zmieniają się stopnie swobody gdy szacujemy parametrów rozkładu z samych danych?
- Ex. 108.19Application
Pokaż, że statystyka chi-kwadrat jest zawsze nieujemna.
- Ex. 108.20Answer key
Czy test chi-kwadrat zgodności jest jednostronny (prawy ogon) czy dwustronny? Dlaczego?
- Ex. 108.21Application
w z oczekiwanym rozkładem jednostajnym. Oblicz i wyciągnij wnioski na 1%.
- Ex. 108.22Application
Jaka jest koncepcyjna różnica między testem jednorodności a testem niezależności? Czy wzór na się zmienia?
- Ex. 108.23Application
z . Jaki jest wniosek na 5% i na 1%? (Krytyczne: 11,07 i 15,09 odpowiednio.)
- Ex. 108.24Understanding
Co znaczyłoby uzyskanie w teście zgodności? Czy to możliwe w danych rzeczywistych?
- Ex. 108.25Understanding
Dlaczego bardzo duże próby sprawiają, że jest problematyczną miarą? Jaka jest alternatywa do użycia?
- Ex. 108.26UnderstandingAnswer key
Opisz kształt krzywej chi-kwadrat dla małego (np. ) vs. duży (np. ). Jak to się wiąże z pochodzeniem rozkładu jako suma kwadratów?
- Ex. 108.27UnderstandingAnswer key
Który z poniższych wzorów to statystyka chi-kwadrat Pearsona?
- Ex. 108.28Understanding
Wyjaśnij dlaczego reguła Cochrana () jest konieczna dla ważności testu chi-kwadrat.
- Ex. 108.29ModelingAnswer key
Krzyżowanie dihidrydowe grochu przewiduje fenotypy w proporcji 9:3:3:1. W 160 potomkach obserwuje się 95, 30, 27, 8. Testuj zgodność na 5%.
- Ex. 108.30Modeling
W badaniu z 400 studentami uniwersyteckimi (200 mężczyzn, 200 kobiet), uzyskano następującą tabelaryzację opinii na temat kwot (Przychylny/Neutralny/Przeciwny): mężczyźni 70/60/70, kobiety 110/50/40. Testuj niezależność na 5%.
- Ex. 108.31Modeling
Próba 200 M&M's z opakowania wykazuje: 30 czerwonych, 35 pomarańczowych, 22 żółtych, 40 zielonych, 55 niebieskich, 18 brązowych. Według producenta, proporcje to 13%, 20%, 14%, 16%, 24%, 13%. Testuj zgodność na 5%.
- Ex. 108.32Modeling
Test A/B/C na stronie docelowej: 200 odwiedzających na wariant. Konwersje: A = 24, B = 30, C = 40. Testuj jednorodność stawek konwersji na 5%.
- Ex. 108.33Modeling
Cztery maszyny produkują wady: 30, 40, 25, 35 wad odpowiednio (razem 130). Testuj czy wskaźnik wad jest jednostajny między maszynami na poziomie 5%.
- Ex. 108.34ModelingAnswer key
Badanie kliniczne z 50 pacjentami (25 per grupa): szczepionka wyleczył 18, placebo 12. Zbuduj tabelę i zastosuj test chi-kwadrat z korekcją Yatesa na 5%.
- Ex. 108.35Modeling
Czy dane o wypadkach na drogach DNIT podlegają rozkładowi Poissona? Opisz pełny schemat testu zgodności, w tym jak radzić sobie z nieznanym parametrem.
- Ex. 108.36Understanding
Które z poniższych warunków są konieczne dla ważności testu chi-kwadrat niezależności?
- Ex. 108.37Understanding
W badaniu przed-po, ci sami 80 pacjentów są klasyfikowani jako nadciśnieniowi lub normalni przed i po interwencji. Dlaczego użyć McNeara zamiast standardowego chi-kwadrat?
- Ex. 108.38Understanding
Badanie z 500 Brazylijczykami rejestruje region (Północ, Południowo-wschód, Południe) i preferencję płatności (gotówka vs. raty). Który test jest najbardziej odpowiedni, aby sprawdzić czy preferencja i region są niezależne?
- Ex. 108.39Challenge
Pogotowie ratunkowe zarejestrowało 210 wizyt w tygodniu (30 na dzień oczekiwane). Obserwowano: Niedz=18, Pon=40, Wt=28, Śr=25, Czw=29, Pt=42, Sob=28. Czy przepływ pacjentów jest jednostajny między dniami? Testuj na 5%.
- Ex. 108.40Challenge
Badanie sondażowe w 3 stanach brazylijskich (SP, RJ, MG) z 600 wyborców (po 200 per stan) rejestruje preferencję kandydata (A, B, C). Dane: SP=(80,70,50), RJ=(60,90,50), MG=(70,60,70). Testuj niezależność między stanem a kandydatem na 5% i oblicz V Craméra.
- Ex. 108.41ProofAnswer key
Pokaż że dla kategorii, gdzie to statystyka dwustronnego testu dla proporcji. To wyjaśnia dlaczego .
- Ex. 108.42Proof
Wykaż wzór dla testu niezależności w tabeli , wyjaśniając ile niezależnych ograniczeń marginaleszy nakładają na wektor liczebności.
Źródła
- OpenStax Statistics — Illowsky, Dean · CC-BY · Rozdział 11 (§11.1–11.5). Główne źródło ćwiczeń i przykładów.
- OpenIntro Statistics (4ª ed) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA · §6.3–6.4. Koncepcyjne podejście i ćwiczenia w kontekście.
- Introduction to Modern Statistics — Çetinkaya-Rundel, Hardin · CC-BY-SA · §18–19. Perspektywa poprzez symulację i współczesną inferencję.