Lição 101 — Amostragem: tipos, vieses e distribuição amostral
Amostragem aleatória simples, estratificada e por conglomerados. Vieses de seleção. Distribuição amostral da média e o Teorema Central do Limite.
Used in: 3.º ano do EM (17-18 anos) · Equiv. Stochastik LK alemão · Equiv. Math B japonês · H2 Statistics singapurense
Rigorous notation, full derivation, hypotheses
Rigorose Definition
Struktur: Grundgesamtheit, Stichprobe und Schätzer
„Eine Stichprobe ist eine Teilmenge der Grundgesamtheit. Eine Statistik ist eine aus einer Stichprobe berechnete Zahl. Parameter sind Zahlen, die Daten einer ganzen Grundgesamtheit zusammenfassen." — OpenStax Statistics, §1.1
Stichprobentypen
„Beim geschichteten Sampling wird die Grundgesamtheit in Gruppen namens Schichten unterteilt. Eine Zufallsstichprobe wird dann aus jeder Schicht ausgewählt." — OpenStax Statistics, §1.3
Wünschenswerte Eigenschaften von Schätzern
Stichprobenverteilung des Mittelwerts
Häufige Verzerrungen
Vier klassische Quellen von Stichprobenbias. Jede macht die Stichprobe nicht repräsentativ für die Zielgesamtheit.
Gelöste Beispiele
Exercise list
30 exercises · 7 with worked solution (25%)
- Ex. 101.1Application
Eine Fabrik produziert Schrauben mit Mittelmasse und Standardabweichung g. Eine Stichprobe von Schrauben wird erhoben. Berechnen Sie den Standardfehler des Stichprobenmittelwerts.
- Ex. 101.2Application
Eine Umfrage beginnt mit . Wie oft musst du erhöhen, um den Standardfehler auf die Hälfte zu reduzieren? Erkläre mit der Formel.
- Ex. 101.3ApplicationAnswer key
Die Wartezeit in einer Bank hat Normalverteilung mit s und s. Eine Stichprobe von Kunden wird erhoben. Wie groß ist die Wahrscheinlichkeit von s?
- Ex. 101.4Application
Ein Krankenhaus möchte die Patientenzufriedenheit mit dem Service schätzen. Der Direktor weiß, dass Geschlecht und Altersgruppe die Wahrnehmung stark beeinflussen. Welcher Stichprobentyp ist am geeignetsten? Begründen Sie.
- Ex. 101.5Application
Ein Online-Shop sendet nach jedem Kauf eine E-Mail um eine Bewertung zu bitten. Nur 12% der Kunden antworten. Identifizieren Sie den wahrscheinlichsten Bias-Typ und erklären Sie seine Auswirkung auf die Schätzung.
- Ex. 101.6Application
Eine Umfrage möchte den Anteil der Haushalte mit Internetugang im ländlichen Raum mit 4% Fehlerquote bei 95% Konfidenz schätzen. Wie groß ist die Mindeststichprobengröße?
- Ex. 101.7Application
Ein Berater analysiert das durchschnittliche Wachstum von 50 Startups, gegründet vor 5 Jahren und noch aktiv, und schlussfolgert, dass „Startups durchschnittlich 120% pro Jahr wachsen". Welcher Bias ist präsent?
- Ex. 101.8Application
Zeigen Sie, dass der Stichprobenmittelwert (a) erwartungstreu, (b) konsistent und (c) effizient für , in der Klasse der linearen Schätzer, ist.
- Ex. 101.9Application
Eine Studie über Ausgaben für öffentliche Verkehrsmittel sammelt Aufzeichnungen. Die historische Standardabweichung ist \sigma = R\,40$. Berechnen Sie den Standardfehler und interpretieren Sie seine Bedeutung.
- Ex. 101.10Application
Das IBGE möchte das durchschnittliche Einkommen brasilianischer Unternehmen schätzen. Beschreiben Sie, wie eine EZS, eine geschichtete Stichprobe nach Sektor und eine nach Cluster durchgeführt würden. Welche wäre effizienter? Warum?
- Ex. 101.11UnderstandingAnswer key
Für den Stichprobenmittelwert mit festem und unabhängig identisch verteilter Bevölkerung, welche Aussage ist richtig?
- Ex. 101.12UnderstandingAnswer key
Warum hat der Stichprobenmittelwert in vielen praktischen Umfragen eine näherungsweise Normalverteilung, ohne die genaue Bevölkerungsverteilung zu kennen?
- Ex. 101.13Understanding
Aussage: „In der einfachen Zufallsstichprobe hat jedes Individuum die gleiche Wahrscheinlichkeit ausgewählt zu werden. Das ist äquivalent zu sagen, dass jede Menge von Individuen die gleiche Wahrscheinlichkeit hat, die Stichprobe zu sein." Ist die Aussage richtig?
- Ex. 101.14Application
Die historische durchschnittliche Note eines Prüfung ist mit . Für eine Klasse von , wie groß ist die Wahrscheinlichkeit, dass der Klassendurchschnitt kleiner als 3,2 ist?
- Ex. 101.15Application
Das IBGE muss den Zugang zu Grundversorgung in Gemeinden ganz Brasiliens mit begrenztem Budget schätzen. Die Liste der Haushalte ist nicht verfügbar, aber die Liste der Gemeinden und Straßen schon. Schlagen Sie einen Stichprobenplan vor.
- Ex. 101.16Application
Eine Umfrage mit Wählern ergab Zustimmung zum Bürgermeister. Berechnen Sie den Standardfehler und die Fehlerquote bei 95% Konfidenz.
- Ex. 101.17ApplicationAnswer key
Berechnen Sie die Mindeststichprobengrößen um eine Proportion mit Fehlerquoten von (a) 5% und (b) 2,5%, beide bei 95% Konfidenz, zu schätzen. Erklären Sie die Beziehung zwischen den Ergebnissen.
- Ex. 101.18Application
Ein Unternehmen hat 3000 in Vertragsordnung sortierte Kunden. Es möchte 300 für eine Umfrage auswählen. Beschreiben Sie den Prozess der systematischen Stichprobenziehung und diskutieren Sie, wann sie Bias einführen kann.
- Ex. 101.19Application
Das Gewicht von Reissäcken hat kg und kg. Für eine Stichprobe von , berechnen Sie .
- Ex. 101.20Understanding
Eine Universität führt Zufriedenheitsumfrage unter derzeit angemeldeten Studierenden durch. Welcher Bias ist am relevantesten in diesem Ansatz?
- Ex. 101.21Application
Ohne vorherige Kenntnis von , wie groß ist die Mindeststichprobengröße um eine Proportion mit Fehlerquote von 2% bei 95% zu schätzen?
- Ex. 101.22Application
Ein Forscher befragt Bewohner einer Stadt zwischen 9 Uhr und 17 Uhr an Werktagen. Er möchte das Durchschnittsfamilieneinkommen schätzen. Identifizieren Sie den Bias und beschreiben Sie seine Richtung (unterschätzt oder überschätzt er das Durchschnittseinkommen?).
- Ex. 101.23ApplicationAnswer key
Die ärztliche Konsultationsdauer hat min. Berechnen Sie den Standardfehler des Mittelwerts für und , und vergleichen Sie.
- Ex. 101.24Application
Der monatliche Stromverbrauch einer Stadt hat kWh und kWh. Für ausgewählte Haushalte, berechnen Sie .
- Ex. 101.25Modeling
Das IBGE nutzt etwa 211.000 Haushalte in der PNAD Contínua. Die nationale Arbeitslosenquote ist etwa 12%. (a) Wie groß wäre das theoretische Minimum um Arbeitslosigkeit mit Fehlerquote von bei 95% zu schätzen? (b) Warum nutzt das IBGE ein viel größeres ?
- Ex. 101.26ModelingAnswer key
Eine Bank möchte die durchschnittliche Ausfallquote in ihrem Kreditportfolio von 500.000 Kunden schätzen. Die Variabilität der Ausfallquote variiert stark nach Einkommensgruppe. Schlagen Sie einen effizienten Stichprobenplan vor und begründen Sie die Interview-Allokation nach Schicht.
- Ex. 101.27Modeling
Ein Finanzanalyst vergleicht die durchschnittliche historische Rendite aktiver Fonds und schlussfolgert, dass aktive Manager den Index schlagen. Die Daten enthalten nur Fonds, die noch heute existieren. Identifizieren Sie den Bias und erklären Sie, wie er die Schlussfolgerung beeinflusst.
- Ex. 101.28Modeling
Zeigen Sie algebraisch, dass erwartungstreu für ist. Warum ist der Divisor statt ?
- Ex. 101.29ChallengeAnswer key
Wenden Sie die Hoeffding-Ungleichung für an: . Für berechnen Sie die Schranke für und . Interpretieren Sie das Ergebnis.
- Ex. 101.30Proof
Beweisen Sie formal, dass der Stichprobenmittelwert (a) erwartungstreu und (b) konsistent für ist, mit Chebyshev-Ungleichung für Teil (b).
Quellen
- OpenIntro Statistics (4. Aufl.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA. Abschnitte §1.3–1.4 (Stichprobentypen und Bias) und §4.1–4.2 (Stichprobenverteilung).
- Statistics (OpenStax) — Illowsky, Dean · CC-BY. Kapitel 1 (Einführung in Stichprobenziehung) und Kapitel 7 (Stichprobenverteilung und ZGS).
- Statistical Thinking for the 21st Century — Russell Poldrack · CC-BY-NC. Kapitel 3–4 (Stichprobenbias und Stichprobenverteilung mit Simulationen).