Math ClubMath Club
v1 · padrão canônico

Lição 108 — Teste qui-quadrado: aderência e independência

Estatística chi-quadrado: distribuição assintótica, graus de liberdade, teste de aderência (goodness of fit) e teste de independência em tabelas de contingência. Correção de Yates, V de Cramér.

Used in: 3.º ano EM · Stochastik LK alemão · H2 Statistics singapurense · Math B japonês — estatística inferencial

χ2=i=1k(OiEi)2Ei\chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i}
Choose your door

Rigorous notation, full derivation, hypotheses

Definicja rygorystyczna

Rozkład chi-kwadrat

"Rozkłady chi-kwadrat mają właściwość addytywności: jeśli X1χn12X_1 \sim \chi^2_{n_1} i X2χn22X_2 \sim \chi^2_{n_2} są niezależne, to X1+X2χn1+n22X_1 + X_2 \sim \chi^2_{n_1 + n_2}." — OpenStax Statistics, §11.1

Test zgodności (goodness of fit)

Test niezależności w tabeli r×cr \times c

"Liczebności oczekiwane dla testu niezależności są obliczane przy założeniu, że proporcje wierszy są równe we wszystkich kolumnach. Jeśli hipoteza zerowa jest prawdziwa (zmienne niezależne), to założenie jest spełnione." — OpenIntro Statistics, §6.4

Założenia ważności (reguła Cochrana)

Korekcja Yatesa (tabela 2×22 \times 2)

Wielkość efektu: V Craméra

xf(x)region krytycznywartość krytycznachi-kwadrat df=5

Krzywa chi-kwadrat z df = 5. Region żółty na prawo od wartości krytycznej to obszar odrzucenia H0 na poziomie alfa = 5%.

Przykłady rozwiązane

Exercise list

42 exercises · 10 with worked solution (25%)

Application 19Understanding 8Modeling 7Challenge 2Proof 2 4
  1. Ex. 108.1Application

    Sześciościenna kostka jest rzucana 60 razy. Jaka jest liczba stopni swobody w teście zgodności z rozkładem jednostajnym?

  2. Ex. 108.2Application

    Dla kostki z poprzedniego ćwiczenia rzucanej 60 razy, jaka jest oczekiwana liczebność na każdej ściance?

  3. Ex. 108.3Application

    Kostka jest rzucana 60 razy: obserwuje się 12, 8, 11, 9, 13, 7 dla ścian 1 do 6. Oblicz χ2\chi^2 i wyciągnij wnioski na 5%.

  4. Ex. 108.4Application

    Oblicz stopnie swobody dla testu niezależności w tabeli kontyngencji 3×43 \times 4.

  5. Ex. 108.5Application

    W tabeli kontyngencji z R1=80R_1 = 80, C1=120C_1 = 120, n=300n = 300, oblicz E11E_{11}.

  6. Ex. 108.6Application

    W teście niezależności uzyskano χ2=8\chi^2 = 8 przy df=2df = 2. Wartość krytyczna na 5% wynosi 5,99. Jaki jest wniosek?

  7. Ex. 108.7ApplicationAnswer key

    Oblicz V Craméra: χ2=20\chi^2 = 20, n=200n = 200, tabela 3×43 \times 4 (stąd min(r1,c1)=2\min(r-1,c-1) = 2).

  8. Ex. 108.8ApplicationAnswer key

    W jakich sytuacjach powinna się zastosować korekcję Yatesa w teście chi-kwadrat?

  9. Ex. 108.9ApplicationAnswer key

    Badacz ma Ei=3E_i = 3 w dwóch z pięciu komórek tabeli. Czy test chi-kwadrat jest stosowny? Uzasadnij.

  10. Ex. 108.10Application

    Obserwuje się O=(45,35,20)O = (45, 35, 20) w n=100n = 100 obserwacjach z proporcjami oczekiwanymi (0,5;  0,3;  0,2)(0,5;\; 0,3;\; 0,2). Oblicz χ2\chi^2.

  11. Ex. 108.11Application

    Dla poprzedniego ćwiczenia (3 kategorie, rozkład w pełni określony), jaka jest liczba stopni swobody?

  12. Ex. 108.12Application

    Badanie mierzy ciśnienie krwi (wysokie/normalne) w tej samej grupie pacjentów przed i po programie ćwiczeń. Dlaczego test chi-kwadrat niezależności nie jest stosowny?

  13. Ex. 108.13Application

    Jaka jest wartość krytyczna χ0,05;12\chi^2_{0,05;\,1} (chi-kwadrat z 1 stopniem swobody na poziomie 5%)?

  14. Ex. 108.14

    Oblicz oczekiwane liczebności dla tabeli 2×22 \times 2 z komórkami a=80a = 80, b=20b = 20, c=60c = 60, d=40d = 40.

  15. Ex. 108.15

    Ze średnikami z poprzedniego ćwiczenia, oblicz χ2\chi^2 i wyciągnij wnioski na 5%.

  16. Ex. 108.16Answer key

    Dlaczego df=1df = 1 w każdej tabeli kontyngencji 2×22 \times 2? Wyjaśnij geometrycznie lub algebraicznie.

  17. Ex. 108.17Application

    Jaka jest średnia i wariancja χk2\chi^2_k? Dla k=20k = 20, czy rozkład jest w przybliżeniu symetryczny?

  18. Ex. 108.18Application

    W teście zgodności z kk kategoriami, jak zmieniają się stopnie swobody gdy szacujemy rr parametrów rozkładu z samych danych?

  19. Ex. 108.19Application

    Pokaż, że statystyka chi-kwadrat χ2=(OiEi)2/Ei\chi^2 = \sum (O_i - E_i)^2 / E_i jest zawsze nieujemna.

  20. Ex. 108.20Answer key

    Czy test chi-kwadrat zgodności jest jednostronny (prawy ogon) czy dwustronny? Dlaczego?

  21. Ex. 108.21Application

    O=(10,20,30,40)O = (10, 20, 30, 40) w n=100n = 100 z oczekiwanym rozkładem jednostajnym. Oblicz χ2\chi^2 i wyciągnij wnioski na 1%.

  22. Ex. 108.22Application

    Jaka jest koncepcyjna różnica między testem jednorodności a testem niezależności? Czy wzór na χ2\chi^2 się zmienia?

  23. Ex. 108.23Application

    χ2=14,5\chi^2 = 14,5 z df=5df = 5. Jaki jest wniosek na 5% i na 1%? (Krytyczne: 11,07 i 15,09 odpowiednio.)

  24. Ex. 108.24Understanding

    Co znaczyłoby uzyskanie χ2=0\chi^2 = 0 w teście zgodności? Czy to możliwe w danych rzeczywistych?

  25. Ex. 108.25Understanding

    Dlaczego bardzo duże próby sprawiają, że χ2\chi^2 jest problematyczną miarą? Jaka jest alternatywa do użycia?

  26. Ex. 108.26UnderstandingAnswer key

    Opisz kształt krzywej chi-kwadrat dla małego dfdf (np. df=2df = 2) vs. duży dfdf (np. df=20df = 20). Jak to się wiąże z pochodzeniem rozkładu jako suma kwadratów?

  27. Ex. 108.27UnderstandingAnswer key

    Który z poniższych wzorów to statystyka chi-kwadrat Pearsona?

  28. Ex. 108.28Understanding

    Wyjaśnij dlaczego reguła Cochrana (Ei5E_i \geq 5) jest konieczna dla ważności testu chi-kwadrat.

  29. Ex. 108.29ModelingAnswer key

    Krzyżowanie dihidrydowe grochu przewiduje fenotypy w proporcji 9:3:3:1. W 160 potomkach obserwuje się 95, 30, 27, 8. Testuj zgodność na 5%.

  30. Ex. 108.30Modeling

    W badaniu z 400 studentami uniwersyteckimi (200 mężczyzn, 200 kobiet), uzyskano następującą tabelaryzację opinii na temat kwot (Przychylny/Neutralny/Przeciwny): mężczyźni 70/60/70, kobiety 110/50/40. Testuj niezależność na 5%.

  31. Ex. 108.31Modeling

    Próba 200 M&M's z opakowania wykazuje: 30 czerwonych, 35 pomarańczowych, 22 żółtych, 40 zielonych, 55 niebieskich, 18 brązowych. Według producenta, proporcje to 13%, 20%, 14%, 16%, 24%, 13%. Testuj zgodność na 5%.

  32. Ex. 108.32Modeling

    Test A/B/C na stronie docelowej: 200 odwiedzających na wariant. Konwersje: A = 24, B = 30, C = 40. Testuj jednorodność stawek konwersji na 5%.

  33. Ex. 108.33Modeling

    Cztery maszyny produkują wady: 30, 40, 25, 35 wad odpowiednio (razem 130). Testuj czy wskaźnik wad jest jednostajny między maszynami na poziomie 5%.

  34. Ex. 108.34ModelingAnswer key

    Badanie kliniczne z 50 pacjentami (25 per grupa): szczepionka wyleczył 18, placebo 12. Zbuduj tabelę 2×22 \times 2 i zastosuj test chi-kwadrat z korekcją Yatesa na 5%.

  35. Ex. 108.35Modeling

    Czy dane o wypadkach na drogach DNIT podlegają rozkładowi Poissona? Opisz pełny schemat testu zgodności, w tym jak radzić sobie z nieznanym parametrem.

  36. Ex. 108.36Understanding

    Które z poniższych warunków są konieczne dla ważności testu chi-kwadrat niezależności?

  37. Ex. 108.37Understanding

    W badaniu przed-po, ci sami 80 pacjentów są klasyfikowani jako nadciśnieniowi lub normalni przed i po interwencji. Dlaczego użyć McNeara zamiast standardowego chi-kwadrat?

  38. Ex. 108.38Understanding

    Badanie z 500 Brazylijczykami rejestruje region (Północ, Południowo-wschód, Południe) i preferencję płatności (gotówka vs. raty). Który test jest najbardziej odpowiedni, aby sprawdzić czy preferencja i region są niezależne?

  39. Ex. 108.39Challenge

    Pogotowie ratunkowe zarejestrowało 210 wizyt w tygodniu (30 na dzień oczekiwane). Obserwowano: Niedz=18, Pon=40, Wt=28, Śr=25, Czw=29, Pt=42, Sob=28. Czy przepływ pacjentów jest jednostajny między dniami? Testuj na 5%.

  40. Ex. 108.40Challenge

    Badanie sondażowe w 3 stanach brazylijskich (SP, RJ, MG) z 600 wyborców (po 200 per stan) rejestruje preferencję kandydata (A, B, C). Dane: SP=(80,70,50), RJ=(60,90,50), MG=(70,60,70). Testuj niezależność między stanem a kandydatem na 5% i oblicz V Craméra.

  41. Ex. 108.41ProofAnswer key

    Pokaż że dla k=2k = 2 kategorii, χ2=Z2\chi^2 = Z^2 gdzie ZZ to statystyka zz dwustronnego testu dla proporcji. To wyjaśnia dlaczego χ0,05;12=(1,96)23,84\chi^2_{0,05;\,1} = (1,96)^2 \approx 3,84.

  42. Ex. 108.42Proof

    Wykaż wzór df=(r1)(c1)df = (r-1)(c-1) dla testu niezależności w tabeli r×cr \times c, wyjaśniając ile niezależnych ograniczeń marginaleszy nakładają na wektor liczebności.

Źródła

  • OpenStax Statistics — Illowsky, Dean · CC-BY · Rozdział 11 (§11.1–11.5). Główne źródło ćwiczeń i przykładów.
  • OpenIntro Statistics (4ª ed) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA · §6.3–6.4. Koncepcyjne podejście i ćwiczenia w kontekście.
  • Introduction to Modern Statistics — Çetinkaya-Rundel, Hardin · CC-BY-SA · §18–19. Perspektywa poprzez symulację i współczesną inferencję.

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.