Math ClubMath Club
v1 · padrão canônico

Lição 108 — Teste qui-quadrado: aderência e independência

Estatística chi-quadrado: distribuição assintótica, graus de liberdade, teste de aderência (goodness of fit) e teste de independência em tabelas de contingência. Correção de Yates, V de Cramér.

Used in: 3.º ano EM · Stochastik LK alemão · H2 Statistics singapurense · Math B japonês — estatística inferencial

χ2=i=1k(OiEi)2Ei\chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i}

A estatística qui-quadrado mede a discrepância total entre contagens observadas OiO_i e contagens esperadas EiE_i sob H0H_0. Quanto maior χ2\chi^2, mais evidência contra a hipótese nula. Para aderência, testa se os dados seguem uma distribuição prescrita; para independência, testa se duas variáveis categóricas são independentes em uma tabela r×cr \times c.

Choose your door

Rigorous notation, full derivation, hypotheses

Definição rigorosa

Distribuição qui-quadrado

"As distribuições qui-quadrado têm uma propriedade de aditividade: se X1χn12X_1 \sim \chi^2_{n_1} e X2χn22X_2 \sim \chi^2_{n_2} são independentes, então X1+X2χn1+n22X_1 + X_2 \sim \chi^2_{n_1 + n_2}." — OpenStax Statistics, §11.1

Teste de aderência (goodness of fit)

Teste de independência em tabela r×cr \times c

"As frequências esperadas para um teste de independência são calculadas assumindo que as proporções da linha são iguais em todas as colunas. Se a hipótese nula for verdadeira (variáveis independentes), esse pressuposto é satisfeito." — OpenIntro Statistics, §6.4

Suposições de validade (regra de Cochran)

Correção de Yates (tabela 2×22 \times 2)

Tamanho de efeito: V de Cramér

xf(x)região críticavalor críticochi-quadrado df=5

Curva qui-quadrado com df = 5. A região amarela à direita do valor crítico é a área de rejeição de H0 ao nível alpha = 5%.

Exemplos resolvidos

Exercise list

42 exercises · 10 with worked solution (25%)

Application 23Understanding 8Modeling 7Challenge 2Proof 2
  1. Ex. 108.1Application

    Um dado de seis faces é lançado 60 vezes. Qual é o número de graus de liberdade no teste de aderência à distribuição uniforme?

    Show solution
    df=k1=61=5df = k - 1 = 6 - 1 = 5. Para 6 categorias sem nenhum parâmetro estimado, perdemos 1 grau de liberdade pela restrição Oi=n\sum O_i = n.
  2. Ex. 108.2Application

    Para o dado do exercício anterior lançado 60 vezes, qual é a frequência esperada por face?

    Show solution
    Ei=npi0=60×(1/6)=10E_i = n \cdot p_i^0 = 60 \times (1/6) = 10 para cada face.
    Show step-by-step (with the why)
    1. Identificar n=60n = 60 e pi0=1/6p_i^0 = 1/6 para cada face. Por quê: sob H0H_0 de dado honesto, cada face tem probabilidade igual.
    2. Calcular Ei=npi0=60×1/6=10E_i = n \cdot p_i^0 = 60 \times 1/6 = 10.

    Macete: em distribuições uniformes discretas, EiE_i é simplesmente n/kn/k.

  3. Ex. 108.3Application

    Um dado é lançado 60 vezes: observa-se 12, 8, 11, 9, 13, 7 para as faces 1 a 6. Calcule χ2\chi^2 e conclua a 5%.

    Show solution
    χ2=(1210)2/10+(810)2/10+(1110)2/10+(910)2/10+(1310)2/10+(710)2/10=(4+4+1+1+9+9)/10=28/10=2,8\chi^2 = (12-10)^2/10 + (8-10)^2/10 + (11-10)^2/10 + (9-10)^2/10 + (13-10)^2/10 + (7-10)^2/10 = (4+4+1+1+9+9)/10 = 28/10 = 2,8. Valor crítico a 5% com df=5df=5: 11,07. Não rejeita H0H_0.
  4. Ex. 108.4Application

    Calcule os graus de liberdade para o teste de independência em uma tabela de contingência 3×43 \times 4.

    Show solution
    Tabela 3×43 \times 4: df=(31)(41)=2×3=6df = (3-1)(4-1) = 2 \times 3 = 6.
  5. Ex. 108.5Application

    Em uma tabela de contingência com R1=80R_1 = 80, C1=120C_1 = 120, n=300n = 300, calcule E11E_{11}.

    Show solution
    E11=R1×C1/n=80×120/300=32E_{11} = R_1 \times C_1 / n = 80 \times 120 / 300 = 32. Sob independência, a frequência esperada é o produto das marginais dividido pelo total.
    Show step-by-step (with the why)
    1. Identificar os marginais: total da linha R1=80R_1 = 80, total da coluna C1=120C_1 = 120, total geral n=300n = 300.
    2. Aplicar a fórmula: E11=R1C1/n=80×120/300=32E_{11} = R_1 C_1 / n = 80 \times 120 / 300 = 32. Por quê: sob independência, P(A1B1)=P(A1)P(B1)=(80/300)(120/300)P(A_1 \cap B_1) = P(A_1) \cdot P(B_1) = (80/300)(120/300), e E11=nP(A1B1)E_{11} = n \cdot P(A_1 \cap B_1).

    Macete: Eij=total da linha×total da coluna/total geralE_{ij} = \text{total da linha} \times \text{total da coluna} / \text{total geral}.

  6. Ex. 108.6Application

    Em um teste de independência, obteve-se χ2=8\chi^2 = 8 com df=2df = 2. O valor crítico a 5% é 5,99. Qual é a conclusão?

    Show solution
    χ2=8>χ0,05;22=5,99\chi^2 = 8 > \chi^2_{0,05;\,2} = 5,99. Rejeitamos H0H_0: há associação significativa entre as variáveis ao nível 5%.
  7. Ex. 108.7ApplicationAnswer key

    Calcule o V de Cramér: χ2=20\chi^2 = 20, n=200n = 200, tabela 3×43 \times 4 (logo min(r1,c1)=2\min(r-1,c-1) = 2).

    Show solution
    V=χ2/(nmin(r1,c1))=20/(200×2)=0,050,224V = \sqrt{\chi^2 / (n \cdot \min(r-1, c-1))} = \sqrt{20 / (200 \times 2)} = \sqrt{0,05} \approx 0,224. Efeito pequeno a médio.
  8. Ex. 108.8ApplicationAnswer key

    Em quais situações deve-se aplicar a correção de Yates no teste qui-quadrado?

    Show solution
    A correção de Yates aplica-se a tabelas 2×22 \times 2 quando as frequências esperadas são pequenas (próximas de 5). Ela subtrai 0,50,5 de cada OijEij\lvert O_{ij} - E_{ij} \rvert antes de elevar ao quadrado, tornando o teste mais conservador.
  9. Ex. 108.9ApplicationAnswer key

    Um pesquisador tem Ei=3E_i = 3 em duas das cinco células de uma tabela. O teste qui-quadrado é apropriado? Justifique.

    Show solution
    Quando Ei<5E_i < 5 em mais de 20% das células (ou qualquer Ei<1E_i < 1), a aproximação qui-quadrado é inadequada. Nesse caso usa-se o Teste Exato de Fisher para tabelas 2×22 \times 2, ou fusão de categorias para reduzir o número de células com Ei<5E_i < 5.
  10. Ex. 108.10Application

    Observa-se O=(45,35,20)O = (45, 35, 20) em n=100n = 100 observações com proporcões esperadas (0,5;  0,3;  0,2)(0,5;\; 0,3;\; 0,2). Calcule χ2\chi^2.

    Show solution
    O=(45,35,20)O = (45, 35, 20), E=(50,30,20)E = (50, 30, 20) pois n=100n = 100 e p0=(0,5,0,3,0,2)p^0 = (0,5,\, 0,3,\, 0,2). χ2=(4550)2/50+(3530)2/30+(2020)2/20=25/50+25/30+0=0,5+0,833=1,333\chi^2 = (45-50)^2/50 + (35-30)^2/30 + (20-20)^2/20 = 25/50 + 25/30 + 0 = 0,5 + 0,833 = 1,333.
    Show step-by-step (with the why)
    1. Calcular esperados: E1=100×0,5=50E_1 = 100 \times 0,5 = 50; E2=100×0,3=30E_2 = 100 \times 0,3 = 30; E3=100×0,2=20E_3 = 100 \times 0,2 = 20.
    2. Calcular cada parcela: (4550)2/50=25/50=0,5(45-50)^2/50 = 25/50 = 0,5; (3530)2/30=25/300,833(35-30)^2/30 = 25/30 \approx 0,833; (2020)2/20=0(20-20)^2/20 = 0.
    3. Somar: χ21,333\chi^2 \approx 1,333. df=31=2df = 3 - 1 = 2. Crítico a 5%: 5,99. Não rejeita H0H_0.

    Curiosidade: a terceira categoria não contribui nada para χ2\chi^2 pois O3=E3O_3 = E_3.

  11. Ex. 108.11Application

    Para o exercício anterior (3 categorias, distribuição completamente especificada), qual é o número de graus de liberdade?

    Show solution
    df=k1=31=2df = k - 1 = 3 - 1 = 2.
  12. Ex. 108.12Application

    Um estudo mede pressão arterial (alta/normal) no mesmo grupo de pacientes antes e depois de um programa de exercícios. Por que o teste qui-quadrado de independência não é adequado?

    Show solution
    Dados pareados (mesmo voluntário medido antes e depois) requerem o teste de McNemar, não o qui-quadrado padrão. O qui-quadrado assume independência entre linhas, o que é violado quando as observações são pareadas.
  13. Ex. 108.13Application

    Qual é o valor crítico χ0,05;12\chi^2_{0,05;\,1} (qui-quadrado com 1 grau de liberdade ao nível 5%)?

    Show solution
    O valor crítico χ0,05;12=3,841\chi^2_{0,05;\,1} = 3,841. Este valor é fundamental: qualquer χ2>3,84\chi^2 > 3,84 em tabela 2×22 \times 2 (com df=1df = 1) é significativo a 5%.
  14. Ex. 108.14Application

    Calcule as frequências esperadas para a tabela 2×22 \times 2 com células a=80a = 80, b=20b = 20, c=60c = 60, d=40d = 40.

    Show solution
    Tabela 2×22 \times 2: a=80,b=20,c=60,d=40a=80, b=20, c=60, d=40. R1=100R_1 = 100, R2=100R_2 = 100, C1=140C_1 = 140, C2=60C_2 = 60, n=200n = 200. E11=100×140/200=70E_{11} = 100 \times 140/200 = 70; E12=100×60/200=30E_{12} = 100 \times 60/200 = 30; E21=70E_{21} = 70; E22=30E_{22} = 30.
  15. Ex. 108.15Application

    Com os esperados do exercício anterior, calcule χ2\chi^2 e conclua a 5%.

    Show solution
    Usando os esperados do exercício anterior: χ2=(8070)2/70+(2030)2/30+(6070)2/70+(4030)2/30=100/70+100/30+100/70+100/30=1,429+3,333+1,429+3,333=9,524\chi^2 = (80-70)^2/70 + (20-30)^2/30 + (60-70)^2/70 + (40-30)^2/30 = 100/70 + 100/30 + 100/70 + 100/30 = 1,429 + 3,333 + 1,429 + 3,333 = 9,524. df=1df=1. Crítico 5%: 3,84. Rejeita H0H_0.
    Show step-by-step (with the why)
    1. Usar EijE_{ij} calculados no exercício anterior: 70, 30, 70, 30.
    2. Calcular cada parcela: (8070)2/70=100/701,43(80-70)^2/70 = 100/70 \approx 1,43; (2030)2/30=100/303,33(20-30)^2/30 = 100/30 \approx 3,33; idem para linha 2.
    3. Somar: χ29,52>3,84\chi^2 \approx 9,52 > 3,84. Rejeitar H0H_0.

    Macete: em tabela 2×22 \times 2, as quatro contribuições são simétricas duas a duas.

  16. Ex. 108.16ApplicationAnswer key

    Por que df=1df = 1 em toda tabela de contingência 2×22 \times 2? Explique geometricamente ou algebricamente.

    Show solution
    df=(r1)(c1)=(21)(21)=1df = (r-1)(c-1) = (2-1)(2-1) = 1. Em tabela 2×22 \times 2, há 4 células mas 3 restrições (total por linha 1, total por coluna 1, e total geral — mas total geral é consequência das outras duas, portanto apenas r1+c1=2r - 1 + c - 1 = 2 restrições independentes, deixando 421=14 - 2 - 1 = 1 grau de liberdade). Na fórmula: (21)(21)=1(2-1)(2-1) = 1.
  17. Ex. 108.17Application

    Quais são a média e a variância de χk2\chi^2_k? Para k=20k = 20, a distribuição é aproximadamente simétrica?

    Show solution
    A distribuição χk2\chi^2_k tem média kk e variância 2k2k. Para kk grande, pelo TCL, χk2\chi^2_k aproxima N(k,2k)\mathcal{N}(k, 2k). A distribuição é assimétrica à direita (positivamente assimétrica), não simétrica.
  18. Ex. 108.18Application

    Em teste de aderência com kk categorias, como os graus de liberdade mudam quando estimamos rr parâmetros da distribuição a partir dos próprios dados?

    Show solution
    Ao estimar rr parâmetros a partir dos dados, perde-se rr graus de liberdade adicionais. Portanto df=k1rdf = k - 1 - r. Exemplo: aderência a Poisson com λ\lambda estimado: df=k11=k2df = k - 1 - 1 = k - 2.
  19. Ex. 108.19Application

    Mostre que a estatística qui-quadrado χ2=(OiEi)2/Ei\chi^2 = \sum (O_i - E_i)^2 / E_i é sempre não-negativa.

    Show solution
    A estatística qui-quadrado é sempre não-negativa: cada parcela (OiEi)2/Ei0(O_i - E_i)^2 / E_i \geq 0 pois é um quadrado dividido por número positivo. Portanto χ2=0\chi^2 = \sum \geq 0.
  20. Ex. 108.20ApplicationAnswer key

    O teste qui-quadrado de aderência é unilateral (cauda direita) ou bilateral? Por quê?

    Show solution
    O qui-quadrado é unilateral (cauda direita): rejeita-se H0H_0 apenas quando χ2\chi^2 é grande. Discrepâncias tanto positivas quanto negativas contribuem com parcelas positivas ao somatório — não há distinção de direção na estatística de teste.
  21. Ex. 108.21Application

    O=(10,20,30,40)O = (10, 20, 30, 40) em n=100n = 100 com distribuição uniforme esperada. Calcule χ2\chi^2 e conclua a 1%.

    Show solution
    O=(10,20,30,40)O = (10, 20, 30, 40), E=25E = 25 cada (uniforme, n=100n = 100). χ2=(1025)2/25+(2025)2/25+(3025)2/25+(4025)2/25=(225+25+25+225)/25=500/25=20\chi^2 = (10-25)^2/25 + (20-25)^2/25 + (30-25)^2/25 + (40-25)^2/25 = (225 + 25 + 25 + 225)/25 = 500/25 = 20. df=3df = 3. Crítico 1%: 11,34. Rejeita H0H_0.
    Show step-by-step (with the why)
    1. Ei=100/4=25E_i = 100/4 = 25 para cada categoria.
    2. (1025)2/25=225/25=9(10-25)^2/25 = 225/25 = 9; (2025)2/25=1(20-25)^2/25 = 1; (3025)2/25=1(30-25)^2/25 = 1; (4025)2/25=9(40-25)^2/25 = 9.
    3. χ2=9+1+1+9=20\chi^2 = 9 + 1 + 1 + 9 = 20. df=3df = 3. Valor crítico a 1%: 11,34. Rejeita-se H0H_0.

    Curiosidade: a distribuição observada é crescente, enquanto H0H_0 postula uniformidade — as caudas (extremos) contribuem muito mais para χ2\chi^2.

  22. Ex. 108.22Application

    Qual é a diferença conceitual entre teste de homogeneidade e teste de independência? A fórmula de χ2\chi^2 muda?

    Show solution
    O teste de homogeneidade testa se kk populações têm a mesma distribuição categórica (amostras independentes retiradas de cada população). O teste de independência testa se duas variáveis são independentes numa única amostra aleatória. A matemática é idêntica (dfdf, EijE_{ij}, χ2\chi^2), mas a interpretação e o delineamento são diferentes.
  23. Ex. 108.23Application

    χ2=14,5\chi^2 = 14,5 com df=5df = 5. Qual é a conclusão a 5% e a 1%? (Críticos: 11,07 e 15,09 respectivamente.)

    Show solution
    Para χ2=14,5\chi^2 = 14,5 e df=5df = 5: valor crítico a 5% é 11,07. Como 14,5>11,0714,5 > 11,07, rejeitamos H0H_0 a 5%. A 1%, crítico é 15,09; como 14,5<15,0914,5 < 15,09, não rejeitamos a 1%. O p-valor está entre 1% e 5%.
  24. Ex. 108.24Understanding

    O que significaria obter χ2=0\chi^2 = 0 num teste de aderência? É isso possível em dados reais?

    Show solution
    Quando χ2=0\chi^2 = 0, todos os Oi=EiO_i = E_i exatamente — os dados encaixam perfeitamente na hipótese nula. Isso é raro em dados reais (flutuação amostral sempre produz alguma discrepância). Um χ2=0\chi^2 = 0 exato indica erro de entrada ou dados fabricados.
  25. Ex. 108.25Understanding

    Por que amostras muito grandes tornam o χ2\chi^2 uma medida problemática? Qual alternativa usar?

    Show solution
    Com nn muito grande, mesmo uma discrepância mínima (como V=0,02V = 0,02) gera χ2=nV2min(r1,c1)\chi^2 = n V^2 \cdot \min(r-1,c-1) enorme e altamente significativo. O p-valor vira irrelevante — qualquer modelo é "rejeitado". A solução é reportar e interpretar o V de Cramér como tamanho de efeito, que não depende de nn.
  26. Ex. 108.26UnderstandingAnswer key

    Descreva a forma da curva qui-quadrado para dfdf pequeno (ex. df=2df = 2) vs. dfdf grande (ex. df=20df = 20). Como isso se relaciona com a origem da distribuição como soma de quadrados?

    Show solution
    A distribuição qui-quadrado é assimétrica à direita e sempre positiva. Ela é a distribuição de somas de quadrados de normais padrão independentes. A assimetria à direita diminui à medida que dfdf cresce (para dfdf grande ela se aproxima da normal). Isso justifica o uso de valores críticos maiores para mais graus de liberdade.
  27. Ex. 108.27UnderstandingAnswer key

    Qual das fórmulas abaixo é a estatística qui-quadrado de Pearson?

    Select the correct option
    Select an option first
    Show solution
    A alternativa B é a fórmula correta de Pearson. A alternativa A omitiria o quadrado, perdendo sinal e não seguindo distribuição qui-quadrado. A alternativa C usaria OiO_i no denominador em vez de EiE_i — formula incorreta. A alternativa D usa valor absoluto em vez de quadrado — também incorreta e de mais difícil análise assintótica.
  28. Ex. 108.28Understanding

    Explique por que a regra de Cochran (Ei5E_i \geq 5) é necessária para a validade do teste qui-quadrado.

    Show solution
    A regra de Cochran exige Ei5E_i \geq 5 para garantir que a aproximação da distribuição discreta pela qui-quadrado contínua seja boa. Com Ei<5E_i < 5, a aproximação pode superestimar o p-valor (conservadora) ou subestimá-lo (liberal) dependendo do cenário. A fusão de categorias adjacentes é a solução prática.
  29. Ex. 108.29ModelingAnswer key

    Cruzamento dihíbrido de ervilhas prevê fenótipos na proporção 9:3:3:1. Em 160 descendentes observa-se 95, 30, 27, 8. Teste aderência a 5%.

    Show solution
    Proporções esperadas: Liso-amarelo p1=9/16p_1 = 9/16, Liso-verde p2=3/16p_2 = 3/16, Rugoso-amarelo p3=3/16p_3 = 3/16, Rugoso-verde p4=1/16p_4 = 1/16. Em n=160n = 160: E1=90E_1 = 90, E2=30E_2 = 30, E3=30E_3 = 30, E4=10E_4 = 10. χ2=(9590)2/90+(3030)2/30+(2730)2/30+(810)2/10=0,278+0+0,3+0,4=0,978\chi^2 = (95-90)^2/90 + (30-30)^2/30 + (27-30)^2/30 + (8-10)^2/10 = 0,278 + 0 + 0,3 + 0,4 = 0,978. df=3df = 3. Crítico 5%: 7,81. Não rejeita — compatível com Mendel.
    Show step-by-step (with the why)
    1. Calcular as proporções esperadas de Mendel: 9/169/16, 3/163/16, 3/163/16, 1/161/16.
    2. Multiplicar por n=160n = 160: E=(90,30,30,10)E = (90, 30, 30, 10). Todos 5\geq 5: OK.
    3. Calcular χ2\chi^2 parcela a parcela: 0,278+0+0,3+0,4=0,9780,278 + 0 + 0,3 + 0,4 = 0,978.
    4. df=41=3df = 4 - 1 = 3 (distribuição completamente especificada). Comparar com 7,81: não rejeita.

    Curiosidade: o próprio Mendel publicou resultados suspeita mente próximos aos esperados — pesquisas posteriores sugerem que ele (ou seus assistentes) talvez tenham descartado dados discrepantes.

  30. Ex. 108.30Modeling

    Em pesquisa com 400 estudantes universitários (200 homens, 200 mulheres), obteve-se a seguinte tabulação de opinião sobre cotas (Favorável/Neutro/Contrário): homens 70/60/70, mulheres 110/50/40. Teste independência a 5%.

    Show solution
    Tabela 2×32 \times 3: df=(21)(31)=2df = (2-1)(3-1) = 2. Calcule EijE_{ij} com os marginais fornecidos, depois χ2\chi^2. Se χ2>5,99\chi^2 > 5,99 (crítico 5%), há associação significativa entre gênero e opinião.
  31. Ex. 108.31Modeling

    Uma amostra de 200 M&M's de um pacote apresenta: 30 vermelhos, 35 laranjas, 22 amarelos, 40 verdes, 55 azuis, 18 marrons. Segundo a fabricante, as proporções são 13%, 20%, 14%, 16%, 24%, 13%. Teste aderência a 5%.

    Show solution
    Proporções esperadas para M&M's segundo a fabricante: vermelho 13%, laranja 20%, amarelo 14%, verde 16%, azul 24%, marrom 13% (soma 100%). Em n=200n = 200: Ei=(26,40,28,32,48,26)E_i = (26, 40, 28, 32, 48, 26). Calcule χ2=(OiEi)2/Ei\chi^2 = \sum (O_i - E_i)^2/E_i com df=5df = 5. Compare com 11,07 (5%) ou 15,09 (1%).
  32. Ex. 108.32Modeling

    Teste A/B/C em landing page: 200 visitantes por variação. Conversões: A = 24, B = 30, C = 40. Teste homogeneidade das taxas de conversão a 5%.

    Show solution
    Tabela de homogeneidade 3×23 \times 2: cada grupo (A, B, C) tem 200 visitantes, conversões (24, 30, 40) e não-conversões (176, 170, 160). df=(31)(21)=2df = (3-1)(2-1) = 2. EA,conv=600×94/600=94/331,33E_{A,conv} = 600 \times 94/600 = 94/3 \approx 31,33. Calcule χ2\chi^2 e compare com 5,99.
  33. Ex. 108.33Modeling

    Quatro máquinas produzem defeitos: 30, 40, 25, 35 defeitos respectivamente (total 130). Teste se a taxa de defeitos é uniforme entre máquinas ao nível 5%.

    Show solution
    4 máquinas, contagens de defeitos: 30, 40, 25, 35 (total 130). Sob H0H_0 de uniformidade: Ei=130/4=32,5E_i = 130/4 = 32,5. χ2=(3032,5)2/32,5+(4032,5)2/32,5+(2532,5)2/32,5+(3532,5)2/32,5=(6,25+56,25+56,25+6,25)/32,5=125/32,53,85\chi^2 = (30-32,5)^2/32,5 + (40-32,5)^2/32,5 + (25-32,5)^2/32,5 + (35-32,5)^2/32,5 = (6,25 + 56,25 + 56,25 + 6,25)/32,5 = 125/32,5 \approx 3,85. df=3df = 3. Crítico 5%: 7,81. Não rejeita — sem diferença significativa entre máquinas.
  34. Ex. 108.34ModelingAnswer key

    Ensaio clínico com 50 pacientes (25 por grupo): vacina resultou em 18 curas, placebo em 12 curas. Monte a tabela 2×22 \times 2 e aplique o teste qui-quadrado com correção de Yates a 5%.

    Show solution
    Tabela 2×22 \times 2. Aplicar correção de Yates se algum EijE_{ij} próximo de 5. Calcular χY2\chi^2_Y e comparar com χ0,05;12=3,84\chi^2_{0,05;\,1} = 3,84. Se rejeitamos, concluímos que o tratamento altera significativamente a proporção de curas.
  35. Ex. 108.35Modeling

    Dados de acidentes em rodovias do DNIT seguem distribuição de Poisson? Descreva o roteiro completo do teste de aderência, incluindo como tratar o parâmetro desconhecido.

    Show solution
    Dados mensais de acidentes em rodovias federais por estado categoriza-se em faixas (0-2, 3-5, 6-10, 11+). Ajusta-se média λ^\hat{\lambda} (Poisson) pelos dados, calcula EiE_i, verifica Ei5E_i \geq 5 (agrupa categorias se necessário), computa χ2\chi^2 com df=k2df = k - 2 (estimou λ\lambda). Compara com tabela.
  36. Ex. 108.36Understanding

    Qual das condições abaixo é necessária para a validade do teste qui-quadrado de independência?

    Select the correct option
    Select an option first
    Show solution
    A alternativa B resume as condições de Cochran. A: Ei1E_i \geq 1 é condição mínima relaxada de Cochran mas insuficiente sozinha. C: n>1000n > 1000 não é regra — amostras de 50 bastam com células adequadas. D: qui-quadrado é exclusivo para variáveis categóricas, não quantitativas contínuas.
  37. Ex. 108.37Understanding

    Em um estudo antes-depois, os mesmos 80 pacientes são classificados como hipertensos ou normais antes e depois de intervenção. Por que usar McNemar em vez do qui-quadrado padrão?

    Show solution
    O McNemar testa se bcb \neq c em tabela 2×22 \times 2 de dados pareados (onde bb e cc são as discordâncias). A estatística é χ2=(bc)2/(b+c)\chi^2 = (b-c)^2/(b+c) com df=1df = 1. O qui-quadrado padrão ignoraria a correlação entre medidas repetidas, violando o pressuposto de independência.
  38. Ex. 108.38Understanding

    Uma pesquisa com 500 brasileiros registra região (Norte, Sudeste, Sul) e preferência por pagamento (à vista vs. parcelado). Qual teste é mais adequado para verificar se preferência e região são independentes?

    Select the correct option
    Select an option first
    Show solution
    Duas variáveis categóricas (região: 3 categorias × preferência: 2 categorias) em uma única amostra aleatória → teste de independência com df=(31)(21)=2df = (3-1)(2-1) = 2. Não é aderência (não há distribuição teórica prescrita). Não é t pareado (não há pareamento). Não é regressão linear (resposta categórica).
  39. Ex. 108.39Challenge

    Um pronto-socorro registrou 210 atendimentos em uma semana (30 por dia esperado). Observou-se: Dom=18, Seg=40, Ter=28, Qua=25, Qui=29, Sex=42, Sáb=28. O fluxo é uniforme entre os dias? Teste a 5%.

    Show solution
    H0H_0: dias de semana são igualmente solicitados. n=210n = 210, k=7k = 7, Ei=30E_i = 30 cada. χ2=(Oi30)2/30\chi^2 = \sum (O_i - 30)^2/30. Dependendo das contagens observadas, compara-se com χ0,05;62=12,59\chi^2_{0,05;\,6} = 12,59. Se a rede preferir segunda e sexta (padrão comum de atendimento), espera-se χ2\chi^2 elevado e rejeição de H0H_0.
  40. Ex. 108.40Challenge

    Pesquisa eleitoral em 3 estados brasileiros (SP, RJ, MG) com 600 eleitores (200 por estado) registra preferência por candidato (A, B, C). Dados: SP=(80,70,50), RJ=(60,90,50), MG=(70,60,70). Teste independência entre estado e candidato a 5% e calcule V de Cramér.

    Show solution
    Tabela 3×33 \times 3 (3 candidatos × 3 estados). df=(31)(31)=4df = (3-1)(3-1) = 4. Calcule Eij=RiCj/nE_{ij} = R_i C_j / n para cada célula. Compute χ2\chi^2. Se χ2>χ0,05;42=9,49\chi^2 > \chi^2_{0,05;\,4} = 9,49, conclui-se que a preferência por candidato varia por estado. Reporte V=χ2/(n2)V = \sqrt{\chi^2/(n \cdot 2)} como tamanho de efeito.
    Show step-by-step (with the why)
    1. Organizar a tabela 3×33 \times 3 com contagens por estado × candidato.
    2. Calcular marginais por linha (RiR_i) e por coluna (CjC_j).
    3. Calcular cada Eij=RiCj/nE_{ij} = R_i C_j / n. Verificar Eij5E_{ij} \geq 5.
    4. Calcular χ2=(OijEij)2/Eij\chi^2 = \sum (O_{ij} - E_{ij})^2 / E_{ij}. df=4df = 4.
    5. Comparar com 9,49 e calcular VV para reportar o efeito.

    Macete: em tabelas r×cr \times c grandes, verificar quais células têm residuos padronizados maiores que 1,96 para identificar onde a associação é mais forte.

  41. Ex. 108.41ProofAnswer key

    Mostre que para k=2k = 2 categorias, χ2=Z2\chi^2 = Z^2 onde ZZ é o estatístico zz do teste bilateral para proporção. Isso explica por que χ0,05;12=(1,96)23,84\chi^2_{0,05;\,1} = (1,96)^2 \approx 3,84.

    Show solution
    Para k=2k = 2 categorias com probabilidades pp e 1p1-p: O1+O2=nO_1 + O_2 = n, E1=npE_1 = np, E2=n(1p)E_2 = n(1-p). χ2=(O1np)2/(np)+(O2n(1p))2/(n(1p))\chi^2 = (O_1 - np)^2/(np) + (O_2 - n(1-p))^2/(n(1-p)). Como O2E2=(O1E1)O_2 - E_2 = -(O_1 - E_1), cada parcela é (O1np)2×(1/(np)+1/(n(1p)))=(O1np)2/(np(1p))(O_1 - np)^2 \times (1/(np) + 1/(n(1-p))) = (O_1 - np)^2/(np(1-p)). Isso é exatamente Z2Z^2 onde Z=(O1np)/np(1p)Z = (O_1 - np)/\sqrt{np(1-p)} é o estatístico de teste para proporção binomial — mostrando a equivalência entre qui-quadrado com df=1df=1 e o teste zz bilateral para proporção.
  42. Ex. 108.42Proof

    Demonstre a fórmula df=(r1)(c1)df = (r-1)(c-1) para o teste de independência em tabela r×cr \times c, explicando quantas restrições independentes os marginais impõem ao vetor de contagens.

    Show solution
    Para tabela r×cr \times c: há rcrc células, com rr restrições de linha (jOij=Ri\sum_j O_{ij} = R_i) e cc restrições de coluna (iOij=Cj\sum_i O_{ij} = C_j), mas as rr restrições de linha e cc restrições de coluna compartilham a restrição global ijOij=n\sum_{ij} O_{ij} = n, totalizando r+c1r + c - 1 restrições independentes. Portanto df=rc(r+c1)=rcrc+1=(r1)(c1)df = rc - (r + c - 1) = rc - r - c + 1 = (r-1)(c-1). Cada restrição imposta "gasta" um grau de liberdade porque fixa uma dimensão do espaço dos vetores de contagem.

Fontes

  • OpenStax Statistics — Illowsky, Dean · CC-BY · Capítulo 11 (§11.1–11.5). Fonte primária dos exercícios e exemplos.
  • OpenIntro Statistics (4ª ed) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA · §6.3–6.4. Abordagem conceitual e exercícios de contexto.
  • Introduction to Modern Statistics — Çetinkaya-Rundel, Hardin · CC-BY-SA · §18–19. Perspectiva via simulação e inferência moderna.

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.