Lição 101 — Amostragem: tipos, vieses e distribuição amostral
Amostragem aleatória simples, estratificada e por conglomerados. Vieses de seleção. Distribuição amostral da média e o Teorema Central do Limite.
Used in: 3.º ano do EM (17-18 anos) · Equiv. Stochastik LK alemão · Equiv. Math B japonês · H2 Statistics singapurense
Rigorous notation, full derivation, hypotheses
Definicja rygorystyczna
Struktura: populacja, próba i estymatory
"Próba to podzbiór populacji. Statystyka to liczba obliczona z próby. Parametry to liczby, które podsumowują dane całej populacji." — OpenStax Statistics, §1.1
Typy próbkowania
"W próbkowaniu stratyfikowanym populacja jest podzielona na grupy zwane stratami. Następnie losowo pobiera się próbę z każdego stratu." — OpenStax Statistics, §1.3
Pożądane właściwości estymatorów
Rozkład próbkowy średniej
Wspólne błędy
Cztery klasyczne źródła błędu próbkowania. Każde sprawia, że próba nie reprezentuje populacji docelowej.
Przykłady rozwiązane
Exercise list
30 exercises · 7 with worked solution (25%)
- Ex. 101.1Application
Fabryka produkuje śruby ze średnią masą i odchyleniem standardowym g. Pobierana jest próba śrub. Oblicz błąd standardowy średniej próbkowej.
- Ex. 101.2Application
Ankieta zaczyna się od . Ile razy musisz zwiększyć , aby zmniejszyć błąd standardowy o połowę? Wyjaśnij za pomocą formuły.
- Ex. 101.3ApplicationAnswer key
Czas oczekiwania w banku ma rozkład normalny z s i s. Pobierana jest próba klientów. Jakie jest prawdopodobieństwo s?
- Ex. 101.4Application
Szpital chce oszacować zadowolenie pacjentów z obsługi. Dyrektor wie, że płeć i grupa wiekowa bardzo wpływają na percepcję. Jaki typ próbkowania jest bardziej odpowiedni? Uzasadnij.
- Ex. 101.5Application
Sklep internetowy wysyła e-mail z prośbą o ocenę po każdym zakupie. Odpowiada tylko 12% klientów. Zidentyfikuj najprawdopodobniejszy typ błędu i wyjaśnij jego wpływ na szacunek.
- Ex. 101.6Application
Ankieta chce oszacować odsetek gospodarstw domowych z dostępem do internetu na obszarach wiejskich, z marginesem błędu 4% z 95% pewnością. Jaka jest minimalna wielkość próby?
- Ex. 101.7Application
Konsultant analizuje średni wzrost 50 startupów założonych 5 lat temu i wciąż aktywnych, wnioskując, że "startupy rosną średnio 120% rocznie". Jaki błąd jest obecny?
- Ex. 101.8Application
Pokaż, że średnia próbkowa jest (a) nieobciążona, (b) konsystentna i (c) efektywna dla , w klasie estymatorów liniowych.
- Ex. 101.9Application
Badanie dotyczące wydatków na transport publiczny zbiera rejestrów. Historyczne odchylenie standardowe wynosi \sigma = R\,40$. Oblicz błąd standardowy i zinterpretuj jego znaczenie.
- Ex. 101.10Application
IBGE chce oszacować średni dochód brazylijskich przedsiębiorstw. Opisz, jak wyglądałoby proste próbkowanie losowe, stratyfikowane wg sektora i grupowe. Które byłoby bardziej efektywne? Dlaczego?
- Ex. 101.11UnderstandingAnswer key
Dla średniej próbkowej z ustalonym i iid populacją, które stwierdzenie jest poprawne?
- Ex. 101.12UnderstandingAnswer key
Dlaczego w wielu praktycznych badaniach średnia próbkowa ma rozkład w przybliżeniu normalny, nawet nie znając dokładnego rozkładu populacji?
- Ex. 101.13Understanding
Stwierdzenie: "W prostym losowym próbkowaniu każda osoba ma takie samo prawdopodobieństwo bycia wybraną. To jest równoważne z twierdzeniem, że każdy zestaw osób ma takie samo prawdopodobieństwo bycia próbą." Stwierdzenie jest poprawne?
- Ex. 101.14Application
Historyczna średnia ocena egzaminu wynosi z . Dla klasy , jakie jest prawdopodobieństwo, że średnia klasy będzie poniżej 3,2?
- Ex. 101.15Application
IBGE musi oszacować dostęp do sanitacji w gminach na całym Brazylii, z ograniczonym budżetem. Lista gospodarstw domowych nie jest dostępna, ale lista gmin i ulic tak. Zaproponuj plan próbkowania.
- Ex. 101.16Application
Ankieta z wyborców wykazała aprobaty dla władz gminnych. Oblicz błąd standardowy i margines błędu z 95% pewnością.
- Ex. 101.17ApplicationAnswer key
Oblicz minimalne wielkości próby do oszacowania proporcji z marginesem błędu (a) 5% i (b) 2,5%, oba z 95% pewnością. Wyjaśnij relację między wynikami.
- Ex. 101.18Application
Przedsiębiorstwo ma 3000 klientów w kolejności numerów umów. Chce wybrać 300 do ankiety. Opisz procedurę próbkowania systematycznego i omów, kiedy może wprowadzić błąd.
- Ex. 101.19Application
Masa worków ryżu ma kg i kg. Dla próby , oblicz .
- Ex. 101.20Understanding
Uniwersytet przeprowadza badanie zadowolenia ze studiami będącymi w trakcie. Jaki błąd jest najbardziej istotny w tym podejściu?
- Ex. 101.21Application
Bez wcześniejszej wiedzy o , jaka jest minimalna wielkość próby do oszacowania proporcji z marginesem błędu 2% z 95%?
- Ex. 101.22Application
Badacz rozmawia z mieszkańcami miasta od drzwi do drzwi między godz. 9:00 a 17:00 w dni robocze. Chce oszacować średni dochód gospodarstwa domowego. Zidentyfikuj błąd i opisz jego kierunek (niedoszacowanie czy przeszacowanie średniego dochodu?).
- Ex. 101.23ApplicationAnswer key
Czas konsultacji lekarskiej ma min. Oblicz błąd standardowy średniej dla i oraz porównaj.
- Ex. 101.24Application
Miesięczne zużycie energii elektrycznej w mieście ma kWh i kWh. Dla wylosowanych gospodarstw domowych, oblicz .
- Ex. 101.25Modeling
IBGE używa około 211 tys. gospodarstw domowych w PNAD Kontynualnej. Krajowa stopa bezrobocia wynosi około 12%. (a) Jaki byłby minimalny teoretyczny do oszacowania bezrobocia z marginesem z 95%? (b) Dlaczego IBGE używa znacznie większego ?
- Ex. 101.26ModelingAnswer key
Bank chce oszacować średnią zaległość w portfelu kredytowym 500 tys. klientów. Zmienność zaległości bardzo zmienia się wg grupy dochodowej. Zaproponuj efektywny plan próbkowania i uzasadnij przydział wywiadów wg straty.
- Ex. 101.27Modeling
Analityk finansowy porównuje średni historyczny zwrot aktywnych funduszy inwestycyjnych i kończy, że aktywni menedżerowie przewyższają indeks. Dane zawierają tylko fundusze, które wciąż istnieją dzisiaj. Zidentyfikuj błąd i wyjaśnij, jak wpływa na wniosek.
- Ex. 101.28Modeling
Pokaż algebraicznie, że jest nieobciążona dla . Dlaczego dzielnik to zamiast ?
- Ex. 101.29ChallengeAnswer key
Zastosuj nierówność Hoeffdinga dla : . Dla , oblicz ograniczenie dla i . Zinterpretuj wynik.
- Ex. 101.30Proof
Formalnie udowodnij, że średnia próbkowa jest (a) nieobciążona i (b) konsystentna dla , używając nierówności Czebyszewa do części (b).
Źródła
- OpenIntro Statistics (4. ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA. Sekcje §1.3–1.4 (typy próbkowania i błędy) i §4.1–4.2 (rozkład próbkowy).
- Statistics (OpenStax) — Illowsky, Dean · CC-BY. Rozdział 1 (wstęp do próbkowania) i Rozdział 7 (rozkład próbkowy i CTG).
- Statistical Thinking for the 21st Century — Russell Poldrack · CC-BY-NC. Rozdziały 3–4 (błąd próbkowania i rozkład próbkowy z symulacjami).