v1 · padrão canônico

Lição 110 — Consolidação Trim 11: Inferência Estatística

Workshop de síntese do trim 11: IC para média, testes z e t, ANOVA, qui-quadrado, regressão simples e múltipla, e inferência bayesiana — todos os pilares da estatística inferencial em um mapa integrado.

Used in: 3.º ano do EM / Stochastik LK alemão · Math B japonês (Estatística) · H2 Mathematics (Singapura) — Statistics

\hat\theta \pm z_{\alpha/2}\frac{\sigma}{\sqrt{n}};\quad T = \frac{\bar X - \mu_0}{s/\sqrt{n}};\quad P(\theta \mid D) \propto P(D \mid \theta)\,P(\theta)

O trim 11 em três equações: intervalo de confiança para estimar, estatística $T$ para testar, e regra de Bayes para atualizar crenças. Toda inferência estatística é variação dessas três formas.

Choose your door

Rigorous notation, full derivation, hypotheses

Síntese formal do trim 11

Os três pilares da inferência estatística

Definition· Pilar 1 — Estimação por intervalo de confiança

Seja $X_1, \ldots, X_n \overset{iid}{\sim} N(\mu, \sigma^2)$ .

IC bilateral de nível $1-\alpha$ para $\mu$ ( $\sigma$ conhecido):

\bar X \pm z_{\alpha/2}\frac{\sigma}{\sqrt{n}}

what this means · Intervalo de confiança para média com desvio-padrão populacional conhecido.

IC com $\sigma$ desconhecido — usa distribuição t de Student com $n-1$ graus de liberdade:

\bar X \pm t_{\alpha/2;\,n-1}\frac{s}{\sqrt{n}}

what this means · Intervalo de confiança para média com desvio-padrão amostral (uso prático mais comum).

Tamanho amostral para margem de erro máxima $E$ :

n \geq \left(\frac{z_{\alpha/2}\,\sigma}{E}\right)^2

what this means · Fórmula do tamanho de amostra: quadrado de z vezes sigma, dividido por E ao quadrado.

"Um intervalo de confiança fornece uma faixa plausível de valores para o parâmetro da população. A interpretação correta: se repetirmos o procedimento muitas vezes, $(1-\alpha)100\%$ dos intervalos construídos conterão o verdadeiro parâmetro." — OpenIntro Statistics §5.2

Definition· Pilar 2 — Teste de hipótese (visão unificada)

Todo teste de hipótese segue o mesmo esquema:

Enunciar $H_0$ e $H_1$ .
Calcular a estatística de teste sob $H_0$ .
Calcular o p-valor = $P(\text{resultado tão ou mais extremo que o observado} \mid H_0)$ .
Se $p \leq \alpha$ , rejeitar $H_0$ .

Mapa de testes:

Cenário	Estatística	Distribuição
1 média, $\sigma$ conhecido	$Z = (\bar X - \mu_0)/(\sigma/\sqrt{n})$	$N(0,1)$
1 média, $\sigma$ desconhecido	$T = (\bar X - \mu_0)/(s/\sqrt{n})$	$t_{n-1}$
2 médias independentes	Welch $T$	$t_{\nu}$ (graus de liberdade de Welch)
$k$ médias	$F = MS_B/MS_W$	$F_{k-1,\,N-k}$
Tabela de contingência	$\chi^2 = \sum (O-E)^2/E$	$\chi^2_{(r-1)(c-1)}$
Proporção vs valor de referência	$Z = (\hat p - p_0)/\sqrt{p_0(1-p_0)/n}$	$N(0,1)$

Definition· Pilar 3 — Regressão e modelagem preditiva

Regressão linear simples $\hat Y = \hat\beta_0 + \hat\beta_1 X$ :

\hat\beta_1 = \frac{S_{xy}}{S_{xx}},\quad \hat\beta_0 = \bar Y - \hat\beta_1 \bar X

what this means · Estimadores de mínimos quadrados ordinárias para regressão simples.

Regressão múltipla $\hat{\mathbf{y}} = X\hat{\boldsymbol\beta}$ :

\hat{\boldsymbol\beta} = (X^\top X)^{-1} X^\top \mathbf{y}

what this means · Estimador vetorial de mínimos quadrados para regressão múltipla.

Coeficiente de determinação e sua versão ajustada:

R^2_{\text{adj}} = 1 - \frac{(1-R^2)(n-1)}{n-p-1}

what this means · R-quadrado ajustado penaliza preditores extras que não contribuem para o ajuste.

Theorem· Regra de Bayes para atualização de crenças

Seja $\theta$ o parâmetro de interesse, $D$ os dados observados:

P(\theta \mid D) = \frac{P(D \mid \theta)\,P(\theta)}{P(D)} \propto P(D \mid \theta)\,P(\theta)

what this means · A distribuição posterior é proporcional à verossimilhança vezes o prior.

Conjugada Beta-Binomial: se $\theta \sim \text{Beta}(\alpha, \beta)$ e $X \mid \theta \sim \text{Bin}(n, \theta)$ , então:

\theta \mid X \sim \text{Beta}(\alpha + X,\; \beta + n - X)

what this means · Distribuição posterior quando o prior é Beta e a verossimilhança é binomial — o prior se atualiza somando sucessos e fracassos.

Fluxo de decisão do trim 11 — cada pergunta estatística tem seu método.

Exemplos resolvidos

Example— 1· IC 95% para nota média do ENEM (desvio desconhecido)

Problema. Uma amostra de $n = 36$ candidatos do ENEM 2023 na disciplina de Matemática apresentou média $\bar X = 580$ pontos e desvio-padrão amostral $s = 90$ pontos. Construa um IC 95% para a nota média populacional $\mu$ .

Estratégia. Como $\sigma$ é desconhecido, usa-se a distribuição $t$ com $n - 1 = 35$ graus de liberdade. Localize $t_{0,025;\,35}$ em tabela.

Resolução.

$t_{0,025;\,35} = 2{,}030$ .

Margem de erro: $E = 2{,}030 \times \frac{90}{\sqrt{36}} = 2{,}030 \times 15 = 30{,}45$ .

IC 95%: $(580 - 30{,}45\;;\; 580 + 30{,}45) = (549{,}55\;;\; 610{,}45)$ .

Verificação. A margem cresce com $s$ e diminui com $\sqrt{n}$ . Para $n = 144$ , a margem seria $2{,}030 \times 90/12 = 15{,}2$ — metade, pois quadruplicamos o $n$ .

Fonte. OpenIntro Statistics §5.2 — Exercício 5.5, p. 222 · CC-BY-SA.

Example— 2· Teste t de uma amostra vs meta governamental

Problema. O governo afirma que o tempo médio de atendimento em UBSs é $\mu_0 = 20$ minutos. Uma auditoria amostra $n = 25$ atendimentos: $\bar X = 24{,}8$ min, $s = 7{,}2$ min. Ao nível $\alpha = 5\%$ , há evidência de que a média real supera 20 min?

Estratégia. Teste $t$ unilateral à direita ( $H_1: \mu > 20$ ), com $df = 24$ .

Resolução.

$T = \frac{24{,}8 - 20}{7{,}2/\sqrt{25}} = \frac{4{,}8}{1{,}44} = 3{,}33$ .

$t_{0,05;\,24} = 1{,}711$ (unilateral). Como $3{,}33 > 1{,}711$ , rejeita-se $H_0$ .

p-valor: $P(t_{24} \geq 3{,}33) \approx 0{,}001 < 0{,}05$ . Há evidência de que o tempo médio supera 20 minutos.

Verificação. IC 95% unilateral inferior: $24{,}8 - 1{,}711 \times 1{,}44 = 22{,}33$ min. O valor $\mu_0 = 20$ está abaixo desse limite, confirmando a rejeição.

Fonte. Statistics, OpenStax §9.4 — adaptado do exemplo 9.10, p. 476 · CC-BY.

Example— 3· ANOVA de um fator — produtividade com 3 adubos

Problema. Três adubos foram testados em grupos de $n_i = 10$ plantas cada. Produtividade (kg): $\bar X_1 = 12{,}0$ , $\bar X_2 = 14{,}5$ , $\bar X_3 = 13{,}2$ . Média geral $\bar X = 13{,}23$ . $SS_W = 162$ (soma dos quadrados intra-grupos). Ao nível 5%, há diferença entre adubos?

Estratégia. ANOVA: calcule $SS_B$ , obtenha $F$ , compare com $F_{0,05;\,2,\,27}$ .

Resolução.

$SS_B = 10[(12{,}0 - 13{,}23)^2 + (14{,}5 - 13{,}23)^2 + (13{,}2 - 13{,}23)^2]$ $= 10[1{,}513 + 1{,}613 + 0{,}001] = 31{,}27$ .

$MS_B = 31{,}27/2 = 15{,}64$ ; $MS_W = 162/27 = 6{,}00$ .

$F = 15{,}64 / 6{,}00 = 2{,}61$ .

$F_{0,05;\,2,\,27} \approx 3{,}35$ . Como $2{,}61 < 3{,}35$ , não se rejeita $H_0$ — não há evidência de diferença entre os adubos ao nível 5%.

Verificação. p-valor $\approx 0{,}092 > 0{,}05$ . Resultado consistente. Com $n_i = 20$ por grupo, o poder seria maior e poderia haver rejeição.

Fonte. OpenIntro Statistics §7.5 — estrutura baseada no exemplo de ANOVA, p. 319 · CC-BY-SA.

Example— 4· Regressão linear simples — salário vs anos de experiência

Problema. Com $n = 20$ profissionais: $\bar X = 8$ anos, salário médio R$ 6.200 ( $\bar Y = 6.200$ ), $S_{xx} = 180$ , $S_{xy} = 54.000$ . Ajuste o modelo de regressão e interprete os coeficientes.

Estratégia. Calcule $\hat\beta_1$ e $\hat\beta_0$ pelas fórmulas de mínimos quadrados; interprete no contexto.

Resolução.

$\hat\beta_1 = S_{xy}/S_{xx} = 54.000/180 = 300$ .

$\hat\beta_0 = \bar Y - \hat\beta_1 \bar X = 6.200 - 300 \times 8 = 3.800$ .

Modelo: $\hat Y = 3.800 + 300\,X$ (em reais, $X$ em anos).

Interpretação. Cada ano adicional de experiência está associado a um aumento médio de R$ 300 no salário. O intercepto R$ 3.800 é o salário estimado para 0 anos de experiência (extrapolação — use com cautela).

Verificação. Para $X = 10$ anos: $\hat Y = 3.800 + 3.000 = 6.800$ reais (R$ 6.800). Plausível dado $\bar Y = 6.200$ para $\bar X = 8$ .

Fonte. OpenIntro Statistics §8.2 — baseado no Exercício 8.13 (dados de salários), p. 360 · CC-BY-SA.

Example— 5· Atualização bayesiana — proporção de defeitos em linha de produção

Problema. Um engenheiro de qualidade acredita a priori que a proporção de defeitos $\theta$ em uma linha tem distribuição $\text{Beta}(3, 17)$ (média prior $= 3/20 = 15\%$ ). Inspeciona $n = 40$ peças e encontra $X = 4$ defeitos. Qual é a distribuição posterior e qual é a nova estimativa pontual para $\theta$ ?

Estratégia. Usar conjugada Beta-Binomial: posterior $= \text{Beta}(\alpha + X, \beta + n - X)$ .

Resolução.

Posterior: $\text{Beta}(3 + 4,\; 17 + 40 - 4) = \text{Beta}(7, 53)$ .

Média posterior: $7/(7+53) = 7/60 \approx 11{,}7\%$ .

IC credível 95%: quantis 2,5% e 97,5% da $\text{Beta}(7, 53)$ , aproximadamente $[0{,}049;\; 0{,}221]$ .

Verificação. Antes: média prior 15%. Depois de ver 4 defeitos em 40 (MLE = 10%), a posterior desloca para 11,7% — média ponderada entre prior e dados. Com amostras maiores, a posterior se aproximaria cada vez mais do MLE.

Fonte. Statistical Thinking for the 21st Century, Ch. 15 — estrutura do exemplo Beta-Binomial, §15.3 · CC-BY-NC.

Exercise list

42 exercises · 10 with worked solution (25%)

Application 17Understanding 14Modeling 5Challenge 2Proof 4

Fontes

OpenIntro Statistics (4ª ed) — Diez, Çetinkaya-Rundel, Barr · 2019 · CC-BY-SA. Fonte primária para IC, testes, ANOVA, qui-quadrado e regressão (§5–9).
Statistics (OpenStax) — Illowsky, Dean · CC-BY. Fonte para exemplos práticos de IC, testes $z$ e $t$ , tabelas de distribuição (§8–13).
Statistical Thinking for the 21st Century — Russell Poldrack · CC-BY-NC. Fonte para inferência bayesiana, tamanho de efeito, reprodutibilidade e crise de replicação (Ch. 9, 15).