Lição 103 — Teste de hipótese: estrutura e lógica
Estrutura formal do teste de hipótese: H0 vs H1, estatística de teste, p-valor, nível de significância, erros tipo I e II, e poder do teste.
Used in: 3.º ano do EM (17-18 anos) · Equiv. Stochastik LK alemão · Equiv. Math B japonês · H2 Statistics singapurense
Rigorous notation, full derivation, hypotheses
Definição rigorosa
Pięć elementów testu hipotezy
"Hipoteza zerowa reprezentuje postulat sceptycyzmu. To status quo, który byłby utrzymywany, chyba że znaleziona zostanie wystarczająca przeciw niemu evidencja." — OpenIntro Statistics, §5.1
Błędy i moc testu
Formalna definicja p-wartości
"P-wartość mierzy, jak zgodne są dane z . Mała p-wartość wskazuje, że dane są niezgodne z — a nie że jest fałszywa z prawdopodobieństwem ." — OpenIntro Statistics, §5.1
Rodzaje hipotezy alternatywnej
Exemplos resolvidos
Exercise list
26 exercises · 6 with worked solution (25%)
- Ex. 103.1ApplicationAnswer key
Sformułuj hipotezy i dla następującego scenariusza: agencja ochrony konsumenta chce sprawdzić, czy średnia waga opakowania mąki o deklarowanej masie 500 g jest zgodna z normą.
- Ex. 103.2Application
Badacze chcą sprawdzić, czy brazylijscy nastolatki śpią mniej niż zalecane 8 godzin na noc. Sformułuj i .
- Ex. 103.3Application
, . Dane: , , (znane). Oblicz statystykę z i p-wartość. Wnioskuj dla .
- Ex. 103.4Application
Producent twierdzi, że jego żarówki trwają średnio 1000 h. Próba żarówek daje h z h (znane). Na poziomie 5%, średnia żywotność jest mniejsza niż twierdzenie?
- Ex. 103.5Application
W procesie karnym to „oskarżony jest niewinny" a to „oskarżony jest winny". Opisz Błędy Typu I i II w tym kontekście. Który jest uważany za bardziej poważny w brazylijskim systemie prawnym? Dlaczego?
- Ex. 103.6Understanding
Test daje . Które ze stwierdzenia poniżej jest prawidłowe?
- Ex. 103.7Understanding
Test z daje . Badacz wyciąga wniosek „efekt nie istnieje". Co może być nie tak?
- Ex. 103.8Application
Szkoła wdrożyła nową metodologię. Historyczna średnia ocen to punktów. Po interwencji, uczniów osiągnęło z (znane). Na poziomie 5%, oceny się poprawiły?
- Ex. 103.9Application
UPA chce wykryć zmniejszenie 5 min w czasie konsultacji (, ). Z i mocą 90%, jaka jest minimalna ?
- Ex. 103.10ApplicationAnswer key
Moneta jest rzucana 100 razy i wypadł orzeł 60 razy. Na poziomie 5%, czy moneta jest uczciwa?
- Ex. 103.11Application
Badacz zmienia poziom istotności z na , utrzymując stałe. Wyjaśnij wpływ na Błąd Typu II i moc testu.
- Ex. 103.12Answer key
Normalna glikemia na czczo to mg/dL. Próba diabetyków daje mg/dL z mg/dL. Na poziomie 1%, czy średnia glikemia jest podwyższona?
- Ex. 103.13Understanding
Wynik jest „statystycznie istotny na poziomie 5%". Co to prawidłowo oznacza?
- Ex. 103.14Application
Firma chce wykryć, czy średnia waga jej produktów spadła z g do g, z g, i mocą 80%. Jaka jest minimalna ?
- Ex. 103.15Application
Badanie genomiki przeprowadza 1000 testów jednocześnie z . Wszystkie testowane geny są zerowe (bez rzeczywistego efektu). Ile fałszywych pozytywów jest oczekiwanych? Jeśli 60 genów jest „istotnych", jaka jest szacunkowa stopa fałszywych odkryć?
- Ex. 103.16
Moneta jest rzucana 800 razy i wypadł orzeł 384 razy. Na poziomie 5%, czy moneta jest uczciwa?
- Ex. 103.17Answer key
Badanie z nastolatkami zarejestrował średni sen h z h (z wcześniejszych badań). Na poziomie 5%, czy śpią mniej niż 8 godzin?
- Ex. 103.18UnderstandingAnswer key
Które ze stwierdzeń o istotności statystycznej jest prawidłowe?
- Ex. 103.19Modeling
Badanie kliniczne testuje 20 punktów końcowych jednocześnie z . Jakie jest prawdopodobieństwo co najmniej jednego fałszywego pozytywu bez korekcji? Opisz, jak korekcja Bonferroni rozwiązuje problem i omów jej ograniczenie.
- Ex. 103.20
Historyczna stopa zatwierdzenia ENEM w szkole to 30%. Po nowej metodologii, 38 ze 100 uczniów przeszło. Na poziomie 5%, czy stopa się poprawiła?
- Ex. 103.21
Testuj vs z i . Oblicz p-wartość dla i . Co to ujawnia o p-wartości i wielkości efektu?
- Ex. 103.22Answer key
Normalne ciśnienie skurczowe: mmHg. Próba dorosłych малoaktywnych: mmHg, mmHg. Na poziomie 1%, czy średnie ciśnienie jest podwyższone?
- Ex. 103.23
Badanie weterynarii chce wykryć, że średnia waga świń rasy zmieniła się z 125 kg na 120 kg (, ). Z dwustronnym i mocą 80%, ile zwierząt jest potrzebnych?
- Ex. 103.24Modeling
ENEM szkoły ma punktów wobec średniej stanowej, z i uczniów. Wynik jest „wysoce istotny" (). Oblicz znormalizowaną wielkość efektu Cohena . Czy różnica 2 punktów jest edukacyjnie znacząca? Omów.
- Ex. 103.25Challenge
Pokaż, że pod warunkiem, że jest prawdziwa, p-wartość ma rozkład Jednostajny dla testów ciągłych. Użyj tego wyniku, aby sprawdzić, że .
- Ex. 103.26Proof
Użyj Lematu Neymana-Pearsona, aby pokazać, że test z jednostronny (odrzucić, jeśli ) jest testem o największej mocy poziomu dla vs z danymi normalnymi i znanym .
Fontes
- OpenIntro Statistics (4ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA. Seções §5.1–5.3 (estrutura do teste, p-valor, poder, tamanho amostral).
- Statistics (OpenStax) — Illowsky, Dean · CC-BY. Capítulo 9 (hipóteses nula e alternativa, erros Tipo I e II, exemplos completos com z).
- Statistical Thinking for the 21st Century — Russell Poldrack · CC-BY-NC. Capítulos 10–11 (crise de replicabilidade, uso responsável do p-valor, FDR, tamanho de efeito).