Lição 101 — Amostragem: tipos, vieses e distribuição amostral
Amostragem aleatória simples, estratificada e por conglomerados. Vieses de seleção. Distribuição amostral da média e o Teorema Central do Limite.
Used in: 3.º ano do EM (17-18 anos) · Equiv. Stochastik LK alemão · Equiv. Math B japonês · H2 Statistics singapurense
Rigorous notation, full derivation, hypotheses
Definição rigorosa
Estrutura: população, amostra e parâmetros
"Uma amostra é o subconjunto da população. Uma estatística é um número calculado de uma amostra. Os parâmetros são números que resumem dados de uma população inteira." — OpenStax Statistics, §1.1
Tipos de amostragem
"Na amostragem estratificada, a população é dividida em grupos chamados estratos. Uma amostra aleatória é então selecionada de cada estrato." — OpenStax Statistics, §1.3
Propriedades desejáveis de estimadores
Distribuição amostral da média
Vieses comuns
Quatro fontes clássicas de viés amostral. Cada uma faz a amostra não representar a população-alvo.
Exemplos resolvidos
Exercise list
30 exercises · 7 with worked solution (25%)
- Ex. 101.1Application
Uma fábrica produz parafusos com peso médio e desvio padrão g. Uma amostra de parafusos é coletada. Calcule o erro padrão da média amostral.
- Ex. 101.2Application
Uma pesquisa começa com . Quantas vezes você precisa aumentar para reduzir o erro padrão à metade? Explique usando a fórmula.
- Ex. 101.3ApplicationAnswer key
O tempo de espera em uma agência bancária tem distribuição normal com s e s. Uma amostra de clientes é coletada. Qual a probabilidade de s?
- Ex. 101.4Application
Um hospital quer estimar a satisfação dos pacientes com o atendimento. A diretora sabe que gênero e faixa etária influenciam muito a percepção. Qual tipo de amostragem é mais adequado? Justifique.
- Ex. 101.5Application
Uma loja online envia um e-mail pedindo avaliação após cada compra. Apenas 12% dos clientes respondem. Identifique o tipo de viés mais provável e explique seu efeito na estimativa.
- Ex. 101.6Application
Uma pesquisa quer estimar a proporção de domicílios com acesso à internet na zona rural, com margem de erro de 4% a 95% de confiança. Qual o tamanho mínimo de amostra?
- Ex. 101.7Application
Um consultor analisa o crescimento médio de 50 startups fundadas há 5 anos e que ainda estão ativas, concluindo que "startups crescem em média 120% ao ano". Qual viés está presente?
- Ex. 101.8Application
Mostre que a média amostral é (a) não-viesada, (b) consistente e (c) eficiente para , na classe dos estimadores lineares.
- Ex. 101.9Application
Um estudo sobre gastos com transporte público coleta registros. O desvio padrão histórico é \sigma = R\,40$. Calcule o erro padrão e interprete seu significado.
- Ex. 101.10Application
O IBGE quer estimar a renda média das empresas brasileiras. Descreva como seriam uma AAS, uma estratificada por setor e uma por conglomerado. Qual seria mais eficiente? Por quê?
- Ex. 101.11UnderstandingAnswer key
Para a média amostral com fixo e população iid, qual afirmação é correta?
- Ex. 101.12UnderstandingAnswer key
Por que, em muitas pesquisas práticas, a média amostral tem distribuição aproximadamente normal, mesmo sem saber a distribuição exata da população?
- Ex. 101.13Understanding
Afirmação: "Na amostragem aleatória simples, cada indivíduo tem a mesma probabilidade de ser escolhido. Isso é equivalente a dizer que cada conjunto de indivíduos tem a mesma probabilidade de ser a amostra." A afirmação é correta?
- Ex. 101.14Application
A nota média histórica de um exame é com . Para uma turma de , qual a probabilidade de a média da turma ser menor que 3,2?
- Ex. 101.15Application
O IBGE precisa estimar o acesso ao saneamento básico em municípios de todo o Brasil, com orçamento limitado. A lista de domicílios não está disponível, mas a lista de municípios e de ruas sim. Proponha um plano amostral.
- Ex. 101.16Application
Uma pesquisa com eleitores encontrou de aprovação ao governo municipal. Calcule o erro padrão e a margem de erro a 95% de confiança.
- Ex. 101.17ApplicationAnswer key
Calcule os tamanhos mínimos de amostra para estimar uma proporção com margem de erro de (a) 5% e (b) 2,5%, ambos com 95% de confiança. Explique a relação entre os resultados.
- Ex. 101.18Application
Uma empresa tem 3000 clientes cadastrados em ordem de número de contrato. Quer selecionar 300 para uma pesquisa. Descreva o procedimento de amostragem sistemática e discuta quando ela pode introduzir viés.
- Ex. 101.19Application
O peso de pacotes de arroz tem kg e kg. Para uma amostra de , calcule .
- Ex. 101.20Understanding
Uma universidade faz pesquisa de satisfação com alunos atualmente matriculados. Qual é o viés mais relevante nesta abordagem?
- Ex. 101.21Application
Sem conhecimento prévio de , qual é o tamanho mínimo de amostra para estimar uma proporção com margem de erro de 2% a 95%?
- Ex. 101.22Application
Um pesquisador entrevista moradores de uma cidade batendo em portas entre 9h e 17h de dias úteis. Ele quer estimar a renda média familiar. Identifique o viés e descreva sua direção (subestima ou superestima a renda média?).
- Ex. 101.23ApplicationAnswer key
O tempo de consulta médica tem min. Calcule o erro padrão da média para e , e compare.
- Ex. 101.24Application
O consumo mensal de energia elétrica de uma cidade tem kWh e kWh. Para domicílios sorteados, calcule .
- Ex. 101.25Modeling
O IBGE usa cerca de 211 mil domicílios na PNAD Contínua. A taxa de desemprego nacional é de cerca de 12%. (a) Qual seria o mínimo teórico para estimar o desemprego com margem de a 95%? (b) Por que o IBGE usa um muito maior?
- Ex. 101.26ModelingAnswer key
Um banco quer estimar a inadimplência média em sua carteira de crédito de 500 mil clientes. A variabilidade de inadimplência varia muito por faixa de renda. Proponha um plano amostral eficiente e justifique a alocação de entrevistas por estrato.
- Ex. 101.27Modeling
Um analista financeiro compara o retorno médio histórico de fundos de investimento ativos e conclui que gestores ativos superam o índice. Os dados incluem apenas fundos que ainda existem hoje. Identifique o viés e explique como ele afeta a conclusão.
- Ex. 101.28Modeling
Mostre algebricamente que é não-viesado para . Por que o divisor é e não ?
- Ex. 101.29ChallengeAnswer key
Aplique a desigualdade de Hoeffding para : . Para , calcule o bound para e . Interprete o resultado.
- Ex. 101.30Proof
Prove formalmente que a média amostral é (a) não-viesada e (b) consistente para , usando a desigualdade de Chebyshev para a parte (b).
Fontes
- OpenIntro Statistics (4ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA. Seções §1.3–1.4 (tipos de amostragem e vieses) e §4.1–4.2 (distribuição amostral).
- Statistics (OpenStax) — Illowsky, Dean · CC-BY. Capítulo 1 (introdução a amostragem) e Capítulo 7 (distribuição amostral e TCL).
- Statistical Thinking for the 21st Century — Russell Poldrack · CC-BY-NC. Capítulos 3–4 (viés amostral e distribuição amostral com simulações).