Lição 108 — Teste qui-quadrado: aderência e independência
Estatística chi-quadrado: distribuição assintótica, graus de liberdade, teste de aderência (goodness of fit) e teste de independência em tabelas de contingência. Correção de Yates, V de Cramér.
Used in: 3.º ano EM · Stochastik LK alemão · H2 Statistics singapurense · Math B japonês — estatística inferencial
A estatística qui-quadrado mede a discrepância total entre contagens observadas e contagens esperadas sob . Quanto maior , mais evidência contra a hipótese nula. Para aderência, testa se os dados seguem uma distribuição prescrita; para independência, testa se duas variáveis categóricas são independentes em uma tabela .
Rigorous notation, full derivation, hypotheses
Definição rigorosa
Distribuição qui-quadrado
"As distribuições qui-quadrado têm uma propriedade de aditividade: se e são independentes, então ." — OpenStax Statistics, §11.1
Teste de aderência (goodness of fit)
Teste de independência em tabela
"As frequências esperadas para um teste de independência são calculadas assumindo que as proporções da linha são iguais em todas as colunas. Se a hipótese nula for verdadeira (variáveis independentes), esse pressuposto é satisfeito." — OpenIntro Statistics, §6.4
Suposições de validade (regra de Cochran)
Correção de Yates (tabela )
Tamanho de efeito: V de Cramér
Curva qui-quadrado com df = 5. A região amarela à direita do valor crítico é a área de rejeição de H0 ao nível alpha = 5%.
Exemplos resolvidos
Exercise list
42 exercises · 10 with worked solution (25%)
- Ex. 108.1Application
Um dado de seis faces é lançado 60 vezes. Qual é o número de graus de liberdade no teste de aderência à distribuição uniforme?
Show solution
. Para 6 categorias sem nenhum parâmetro estimado, perdemos 1 grau de liberdade pela restrição . - Ex. 108.2Application
Para o dado do exercício anterior lançado 60 vezes, qual é a frequência esperada por face?
Show solution
para cada face.Show step-by-step (with the why)
- Identificar e para cada face. Por quê: sob de dado honesto, cada face tem probabilidade igual.
- Calcular .
Macete: em distribuições uniformes discretas, é simplesmente .
- Ex. 108.3Application
Um dado é lançado 60 vezes: observa-se 12, 8, 11, 9, 13, 7 para as faces 1 a 6. Calcule e conclua a 5%.
Show solution
. Valor crítico a 5% com : 11,07. Não rejeita . - Ex. 108.4Application
Calcule os graus de liberdade para o teste de independência em uma tabela de contingência .
Show solution
Tabela : . - Ex. 108.5Application
Em uma tabela de contingência com , , , calcule .
Show solution
. Sob independência, a frequência esperada é o produto das marginais dividido pelo total.Show step-by-step (with the why)
- Identificar os marginais: total da linha , total da coluna , total geral .
- Aplicar a fórmula: . Por quê: sob independência, , e .
Macete: .
- Ex. 108.6Application
Em um teste de independência, obteve-se com . O valor crítico a 5% é 5,99. Qual é a conclusão?
Show solution
. Rejeitamos : há associação significativa entre as variáveis ao nível 5%. - Ex. 108.7ApplicationAnswer key
Calcule o V de Cramér: , , tabela (logo ).
Show solution
. Efeito pequeno a médio. - Ex. 108.8ApplicationAnswer key
Em quais situações deve-se aplicar a correção de Yates no teste qui-quadrado?
Show solution
A correção de Yates aplica-se a tabelas quando as frequências esperadas são pequenas (próximas de 5). Ela subtrai de cada antes de elevar ao quadrado, tornando o teste mais conservador. - Ex. 108.9ApplicationAnswer key
Um pesquisador tem em duas das cinco células de uma tabela. O teste qui-quadrado é apropriado? Justifique.
Show solution
Quando em mais de 20% das células (ou qualquer ), a aproximação qui-quadrado é inadequada. Nesse caso usa-se o Teste Exato de Fisher para tabelas , ou fusão de categorias para reduzir o número de células com . - Ex. 108.10Application
Observa-se em observações com proporcões esperadas . Calcule .
Show solution
, pois e . .Show step-by-step (with the why)
- Calcular esperados: ; ; .
- Calcular cada parcela: ; ; .
- Somar: . . Crítico a 5%: 5,99. Não rejeita .
Curiosidade: a terceira categoria não contribui nada para pois .
- Ex. 108.11Application
Para o exercício anterior (3 categorias, distribuição completamente especificada), qual é o número de graus de liberdade?
Show solution
. - Ex. 108.12Application
Um estudo mede pressão arterial (alta/normal) no mesmo grupo de pacientes antes e depois de um programa de exercícios. Por que o teste qui-quadrado de independência não é adequado?
Show solution
Dados pareados (mesmo voluntário medido antes e depois) requerem o teste de McNemar, não o qui-quadrado padrão. O qui-quadrado assume independência entre linhas, o que é violado quando as observações são pareadas. - Ex. 108.13Application
Qual é o valor crítico (qui-quadrado com 1 grau de liberdade ao nível 5%)?
Show solution
O valor crítico . Este valor é fundamental: qualquer em tabela (com ) é significativo a 5%. - Ex. 108.14Application
Calcule as frequências esperadas para a tabela com células , , , .
Show solution
Tabela : . , , , , . ; ; ; . - Ex. 108.15Application
Com os esperados do exercício anterior, calcule e conclua a 5%.
Show solution
Usando os esperados do exercício anterior: . . Crítico 5%: 3,84. Rejeita .Show step-by-step (with the why)
- Usar calculados no exercício anterior: 70, 30, 70, 30.
- Calcular cada parcela: ; ; idem para linha 2.
- Somar: . Rejeitar .
Macete: em tabela , as quatro contribuições são simétricas duas a duas.
- Ex. 108.16ApplicationAnswer key
Por que em toda tabela de contingência ? Explique geometricamente ou algebricamente.
Show solution
. Em tabela , há 4 células mas 3 restrições (total por linha 1, total por coluna 1, e total geral — mas total geral é consequência das outras duas, portanto apenas restrições independentes, deixando grau de liberdade). Na fórmula: . - Ex. 108.17Application
Quais são a média e a variância de ? Para , a distribuição é aproximadamente simétrica?
Show solution
A distribuição tem média e variância . Para grande, pelo TCL, aproxima . A distribuição é assimétrica à direita (positivamente assimétrica), não simétrica. - Ex. 108.18Application
Em teste de aderência com categorias, como os graus de liberdade mudam quando estimamos parâmetros da distribuição a partir dos próprios dados?
Show solution
Ao estimar parâmetros a partir dos dados, perde-se graus de liberdade adicionais. Portanto . Exemplo: aderência a Poisson com estimado: . - Ex. 108.19Application
Mostre que a estatística qui-quadrado é sempre não-negativa.
Show solution
A estatística qui-quadrado é sempre não-negativa: cada parcela pois é um quadrado dividido por número positivo. Portanto . - Ex. 108.20ApplicationAnswer key
O teste qui-quadrado de aderência é unilateral (cauda direita) ou bilateral? Por quê?
Show solution
O qui-quadrado é unilateral (cauda direita): rejeita-se apenas quando é grande. Discrepâncias tanto positivas quanto negativas contribuem com parcelas positivas ao somatório — não há distinção de direção na estatística de teste. - Ex. 108.21Application
em com distribuição uniforme esperada. Calcule e conclua a 1%.
Show solution
, cada (uniforme, ). . . Crítico 1%: 11,34. Rejeita .Show step-by-step (with the why)
- para cada categoria.
- ; ; ; .
- . . Valor crítico a 1%: 11,34. Rejeita-se .
Curiosidade: a distribuição observada é crescente, enquanto postula uniformidade — as caudas (extremos) contribuem muito mais para .
- Ex. 108.22Application
Qual é a diferença conceitual entre teste de homogeneidade e teste de independência? A fórmula de muda?
Show solution
O teste de homogeneidade testa se populações têm a mesma distribuição categórica (amostras independentes retiradas de cada população). O teste de independência testa se duas variáveis são independentes numa única amostra aleatória. A matemática é idêntica (, , ), mas a interpretação e o delineamento são diferentes. - Ex. 108.23Application
com . Qual é a conclusão a 5% e a 1%? (Críticos: 11,07 e 15,09 respectivamente.)
Show solution
Para e : valor crítico a 5% é 11,07. Como , rejeitamos a 5%. A 1%, crítico é 15,09; como , não rejeitamos a 1%. O p-valor está entre 1% e 5%. - Ex. 108.24Understanding
O que significaria obter num teste de aderência? É isso possível em dados reais?
Show solution
Quando , todos os exatamente — os dados encaixam perfeitamente na hipótese nula. Isso é raro em dados reais (flutuação amostral sempre produz alguma discrepância). Um exato indica erro de entrada ou dados fabricados. - Ex. 108.25Understanding
Por que amostras muito grandes tornam o uma medida problemática? Qual alternativa usar?
Show solution
Com muito grande, mesmo uma discrepância mínima (como ) gera enorme e altamente significativo. O p-valor vira irrelevante — qualquer modelo é "rejeitado". A solução é reportar e interpretar o V de Cramér como tamanho de efeito, que não depende de . - Ex. 108.26UnderstandingAnswer key
Descreva a forma da curva qui-quadrado para pequeno (ex. ) vs. grande (ex. ). Como isso se relaciona com a origem da distribuição como soma de quadrados?
Show solution
A distribuição qui-quadrado é assimétrica à direita e sempre positiva. Ela é a distribuição de somas de quadrados de normais padrão independentes. A assimetria à direita diminui à medida que cresce (para grande ela se aproxima da normal). Isso justifica o uso de valores críticos maiores para mais graus de liberdade. - Ex. 108.27UnderstandingAnswer key
Qual das fórmulas abaixo é a estatística qui-quadrado de Pearson?
Show solution
A alternativa B é a fórmula correta de Pearson. A alternativa A omitiria o quadrado, perdendo sinal e não seguindo distribuição qui-quadrado. A alternativa C usaria no denominador em vez de — formula incorreta. A alternativa D usa valor absoluto em vez de quadrado — também incorreta e de mais difícil análise assintótica. - Ex. 108.28Understanding
Explique por que a regra de Cochran () é necessária para a validade do teste qui-quadrado.
Show solution
A regra de Cochran exige para garantir que a aproximação da distribuição discreta pela qui-quadrado contínua seja boa. Com , a aproximação pode superestimar o p-valor (conservadora) ou subestimá-lo (liberal) dependendo do cenário. A fusão de categorias adjacentes é a solução prática. - Ex. 108.29ModelingAnswer key
Cruzamento dihíbrido de ervilhas prevê fenótipos na proporção 9:3:3:1. Em 160 descendentes observa-se 95, 30, 27, 8. Teste aderência a 5%.
Show solution
Proporções esperadas: Liso-amarelo , Liso-verde , Rugoso-amarelo , Rugoso-verde . Em : , , , . . . Crítico 5%: 7,81. Não rejeita — compatível com Mendel.Show step-by-step (with the why)
- Calcular as proporções esperadas de Mendel: , , , .
- Multiplicar por : . Todos : OK.
- Calcular parcela a parcela: .
- (distribuição completamente especificada). Comparar com 7,81: não rejeita.
Curiosidade: o próprio Mendel publicou resultados suspeita mente próximos aos esperados — pesquisas posteriores sugerem que ele (ou seus assistentes) talvez tenham descartado dados discrepantes.
- Ex. 108.30Modeling
Em pesquisa com 400 estudantes universitários (200 homens, 200 mulheres), obteve-se a seguinte tabulação de opinião sobre cotas (Favorável/Neutro/Contrário): homens 70/60/70, mulheres 110/50/40. Teste independência a 5%.
Show solution
Tabela : . Calcule com os marginais fornecidos, depois . Se (crítico 5%), há associação significativa entre gênero e opinião. - Ex. 108.31Modeling
Uma amostra de 200 M&M's de um pacote apresenta: 30 vermelhos, 35 laranjas, 22 amarelos, 40 verdes, 55 azuis, 18 marrons. Segundo a fabricante, as proporções são 13%, 20%, 14%, 16%, 24%, 13%. Teste aderência a 5%.
Show solution
Proporções esperadas para M&M's segundo a fabricante: vermelho 13%, laranja 20%, amarelo 14%, verde 16%, azul 24%, marrom 13% (soma 100%). Em : . Calcule com . Compare com 11,07 (5%) ou 15,09 (1%). - Ex. 108.32Modeling
Teste A/B/C em landing page: 200 visitantes por variação. Conversões: A = 24, B = 30, C = 40. Teste homogeneidade das taxas de conversão a 5%.
Show solution
Tabela de homogeneidade : cada grupo (A, B, C) tem 200 visitantes, conversões (24, 30, 40) e não-conversões (176, 170, 160). . . Calcule e compare com 5,99. - Ex. 108.33Modeling
Quatro máquinas produzem defeitos: 30, 40, 25, 35 defeitos respectivamente (total 130). Teste se a taxa de defeitos é uniforme entre máquinas ao nível 5%.
Show solution
4 máquinas, contagens de defeitos: 30, 40, 25, 35 (total 130). Sob de uniformidade: . . . Crítico 5%: 7,81. Não rejeita — sem diferença significativa entre máquinas. - Ex. 108.34ModelingAnswer key
Ensaio clínico com 50 pacientes (25 por grupo): vacina resultou em 18 curas, placebo em 12 curas. Monte a tabela e aplique o teste qui-quadrado com correção de Yates a 5%.
Show solution
Tabela . Aplicar correção de Yates se algum próximo de 5. Calcular e comparar com . Se rejeitamos, concluímos que o tratamento altera significativamente a proporção de curas. - Ex. 108.35Modeling
Dados de acidentes em rodovias do DNIT seguem distribuição de Poisson? Descreva o roteiro completo do teste de aderência, incluindo como tratar o parâmetro desconhecido.
Show solution
Dados mensais de acidentes em rodovias federais por estado categoriza-se em faixas (0-2, 3-5, 6-10, 11+). Ajusta-se média (Poisson) pelos dados, calcula , verifica (agrupa categorias se necessário), computa com (estimou ). Compara com tabela. - Ex. 108.36Understanding
Qual das condições abaixo é necessária para a validade do teste qui-quadrado de independência?
Show solution
A alternativa B resume as condições de Cochran. A: é condição mínima relaxada de Cochran mas insuficiente sozinha. C: não é regra — amostras de 50 bastam com células adequadas. D: qui-quadrado é exclusivo para variáveis categóricas, não quantitativas contínuas. - Ex. 108.37Understanding
Em um estudo antes-depois, os mesmos 80 pacientes são classificados como hipertensos ou normais antes e depois de intervenção. Por que usar McNemar em vez do qui-quadrado padrão?
Show solution
O McNemar testa se em tabela de dados pareados (onde e são as discordâncias). A estatística é com . O qui-quadrado padrão ignoraria a correlação entre medidas repetidas, violando o pressuposto de independência. - Ex. 108.38Understanding
Uma pesquisa com 500 brasileiros registra região (Norte, Sudeste, Sul) e preferência por pagamento (à vista vs. parcelado). Qual teste é mais adequado para verificar se preferência e região são independentes?
Show solution
Duas variáveis categóricas (região: 3 categorias × preferência: 2 categorias) em uma única amostra aleatória → teste de independência com . Não é aderência (não há distribuição teórica prescrita). Não é t pareado (não há pareamento). Não é regressão linear (resposta categórica). - Ex. 108.39Challenge
Um pronto-socorro registrou 210 atendimentos em uma semana (30 por dia esperado). Observou-se: Dom=18, Seg=40, Ter=28, Qua=25, Qui=29, Sex=42, Sáb=28. O fluxo é uniforme entre os dias? Teste a 5%.
Show solution
: dias de semana são igualmente solicitados. , , cada. . Dependendo das contagens observadas, compara-se com . Se a rede preferir segunda e sexta (padrão comum de atendimento), espera-se elevado e rejeição de . - Ex. 108.40Challenge
Pesquisa eleitoral em 3 estados brasileiros (SP, RJ, MG) com 600 eleitores (200 por estado) registra preferência por candidato (A, B, C). Dados: SP=(80,70,50), RJ=(60,90,50), MG=(70,60,70). Teste independência entre estado e candidato a 5% e calcule V de Cramér.
Show solution
Tabela (3 candidatos × 3 estados). . Calcule para cada célula. Compute . Se , conclui-se que a preferência por candidato varia por estado. Reporte como tamanho de efeito.Show step-by-step (with the why)
- Organizar a tabela com contagens por estado × candidato.
- Calcular marginais por linha () e por coluna ().
- Calcular cada . Verificar .
- Calcular . .
- Comparar com 9,49 e calcular para reportar o efeito.
Macete: em tabelas grandes, verificar quais células têm residuos padronizados maiores que 1,96 para identificar onde a associação é mais forte.
- Ex. 108.41ProofAnswer key
Mostre que para categorias, onde é o estatístico do teste bilateral para proporção. Isso explica por que .
Show solution
Para categorias com probabilidades e : , , . . Como , cada parcela é . Isso é exatamente onde é o estatístico de teste para proporção binomial — mostrando a equivalência entre qui-quadrado com e o teste bilateral para proporção. - Ex. 108.42Proof
Demonstre a fórmula para o teste de independência em tabela , explicando quantas restrições independentes os marginais impõem ao vetor de contagens.
Show solution
Para tabela : há células, com restrições de linha () e restrições de coluna (), mas as restrições de linha e restrições de coluna compartilham a restrição global , totalizando restrições independentes. Portanto . Cada restrição imposta "gasta" um grau de liberdade porque fixa uma dimensão do espaço dos vetores de contagem.
Fontes
- OpenStax Statistics — Illowsky, Dean · CC-BY · Capítulo 11 (§11.1–11.5). Fonte primária dos exercícios e exemplos.
- OpenIntro Statistics (4ª ed) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA · §6.3–6.4. Abordagem conceitual e exercícios de contexto.
- Introduction to Modern Statistics — Çetinkaya-Rundel, Hardin · CC-BY-SA · §18–19. Perspectiva via simulação e inferência moderna.