Lição 107 — ANOVA one-way
Análise de variância (ANOVA one-way): decomposição SST = SSB + SSW, estatística F, tabela ANOVA, verificação de suposições, post-hoc de Tukey, tamanho de efeito eta².
Used in: 3.º ano EM — Estatística Inferencial · Stochastik LK alemão · H2 Math singapurense (estatística) · Math B japonês
A ANOVA one-way compara médias de grupos com um único teste. A estatística F é a razão entre a variância entre grupos e a variância dentro dos grupos. Sob (todas as médias iguais), . Quando alguma média difere, cresce — e rejeitamos .
Rigorous notation, full derivation, hypotheses
Definição rigorosa
O problema: comparar k médias com um único teste
Suponha que você tem grupos independentes e quer saber se as médias populacionais são iguais. Fazer testes separados inflaciona o erro do tipo I. A ANOVA resolve isso com um único teste global.
"In a one-way analysis of variance problem, we are interested in comparing the means of populations. If the means are all equal, we say the treatments, or factor levels, are not different from one another. If at least one mean differs, we say the treatments are different." — OpenStax Statistics §13.1
Decomposição da variância total
Três grupos com médias distintas. Linha sólida tracejada colorida = média do grupo (). Linha cinza pontilhada = grande média (). SSB mede quanto as médias coloridas se afastam da cinza; SSW mede a dispersão dos pontos em torno de suas próprias médias.
Estatística F e tabela ANOVA
"The one-way ANOVA test statistic is the ratio of two independent chi-square variables divided by their respective degrees of freedom... Under the null hypothesis, follows an distribution with and degrees of freedom." — OpenStax Statistics §13.2
Suposições do modelo
Tamanho de efeito
Exemplos resolvidos
Exercise list
42 exercises · 10 with worked solution (25%)
- Ex. 107.1Application
Um experimento compara 3 grupos com 10 observações cada. Determine e .
Show solution
Com grupos e observações totais: e . Conferência: ✓Show step-by-step (with the why)
- Identifique (número de grupos) e (total de observações). Por quê: os graus de liberdade derivam diretamente dessas duas quantidades.
- Calcule . Por quê: entre grupos, "perde" 1 grau ao estimar a grande média.
- Calcule . Por quê: dentro de cada grupo estima-se a média local, perdendo 1 gl por grupo.
- Confira: . Se não fechar, há erro.
Macete: "Entre = grupos menos 1; Dentro = total menos grupos."
- Ex. 107.2ApplicationAnswer key
Um pesquisador usa 5 grupos com 10 participantes cada. Determine e .
Show solution
, . . . Conferência: ✓ - Ex. 107.3Application
Em um experimento com 3 grupos, () e (). Calcule e .
Show solution
. . - Ex. 107.4ApplicationAnswer key
A partir dos valores do exercício 107.3, calcule a estatística .
Show solution
. Usando os valores do exercício anterior. - Ex. 107.5Application
O valor com e (crítico ). Qual é a conclusão correta?
Show solution
Com e crítico , temos — rejeita-se . A opção B erra o sentido da comparação; C confunde com o valor limite; D é irrelevante pois F não depende de SST diretamente. - Ex. 107.6Application
e . Calcule e classifique o tamanho do efeito.
Show solution
. Efeito grande (convenção Cohen: ). - Ex. 107.7Application
Usando os dados do exercício 107.6 (, ), determine .
Show solution
. A decomposição é exata (sem resto). - Ex. 107.8ApplicationAnswer key
Por que, sob , espera-se que ? Explique em termos do que e estimam.
Show solution
Sob , e estimam a mesma variância , portanto para grande. Se vale, , então . - Ex. 107.9Application
Três grupos com cada. Médias dos grupos: 9, 11 e 13. Calcule a grande média .
Show solution
Para grupos balanceados ( iguais), a grande média é a média das médias dos grupos: . - Ex. 107.10Application
Usando os dados do exercício 107.9, calcule .
Show solution
Com (exercício anterior): . Corrigindo: . (Resp: 120.) - Ex. 107.11Understanding
Por que não fazer múltiplos testes para comparar 4 grupos? Calcule a probabilidade de ao menos um falso positivo com .
Show solution
Com grupos, seriam testes t. Se cada um tem , a probabilidade de pelo menos um erro tipo I é . A ANOVA mantém global.Show step-by-step (with the why)
- Conte o número de pares: comparações.
- Compute a probabilidade de ao menos 1 erro: .
- Conclua: 26% de chance de falso positivo mesmo sem diferença real — inaceitável para decisão científica.
Observação: Esse problema se chama "inflação do erro família" (family-wise error rate, FWER). A ANOVA resolve na raiz.
- Ex. 107.12Understanding
Liste as três suposições da ANOVA one-way. Com por grupo e desvios-padrão , , , qual suposição é mais suspeita?
Show solution
Suposição de normalidade: distribuição aproximadamente normal dentro de cada grupo. Suposição de homocedasticidade: variâncias iguais entre grupos. Independência: observações independentes entre e dentro dos grupos. Com , normalidade é crítica (TLC não ajuda muito); razão de variâncias 9 indica heterocedasticidade séria. - Ex. 107.13Understanding
Um estudo tem grupos com . Shapiro-Wilk rejeita normalidade em um grupo (). Razão das variâncias: 9:1. Que teste usar?
Show solution
Com heterocedasticidade severa (, razão de variâncias 9) E não-normalidade em pequeno, nenhuma versão paramétrica é segura. Kruskal-Wallis (baseado em ranks) é a alternativa correta. Welch ajuda só para heterocedasticidade quando a normalidade é ok. - Ex. 107.14UnderstandingAnswer key
Para que serve o teste de Levene antes da ANOVA? Que conclusão tirar de ?
Show solution
O teste de Levene verifica a hipótese . Se , não há evidência contra homocedasticidade e a ANOVA clássica é indicada. Se , use Welch's ANOVA. - Ex. 107.15Understanding
A ANOVA rejeita em um experimento com 5 grupos. O que isso significa? O que fazer a seguir?
Show solution
ANOVA rejeitada diz apenas "pelo menos um grupo difere". Para identificar quais pares de grupos diferem, aplica-se post-hoc com correção de erro família: Tukey HSD para comparações pareadas, Bonferroni para qualquer contraste, Scheffé para contrastes lineares gerais. - Ex. 107.16UnderstandingAnswer key
Compare Tukey HSD e Bonferroni: qual é mais conservador? Quando usar cada um?
Show solution
Tukey HSD controla FWER apenas para comparações pareadas e é mais poderoso que Bonferroni nesse caso. Bonferroni é mais geral (funciona para qualquer conjunto de testes) mas mais conservador. Para comparações planejadas pareadas, Tukey é preferível; para contrastes ad hoc, Bonferroni é a escolha segura. - Ex. 107.17Understanding
Para grupos, como se relacionam da ANOVA e do teste de duas amostras? Os p-valores coincidem?
Show solution
Para : onde é a estatística t pooled de duas amostras. Os dois testes são equivalentes: . O valor-p é idêntico (teste bilateral). - Ex. 107.18UnderstandingAnswer key
Descreva a forma da distribuição com graus de liberdade pequenos. Por que nunca é negativo?
Show solution
A distribuição F é assimétrica à direita e assume apenas valores não-negativos (é razão de variâncias). Para valores pequenos de gl, a cauda direita é muito pesada. Quando e crescem, a distribuição F se aproxima da normal. Sempre . - Ex. 107.19Understanding
Converta para Cohen's e classifique o tamanho do efeito.
Show solution
Cohen's . Para : . Pela convenção de Cohen ( pequeno; médio; grande), este é um efeito próximo do grande. - Ex. 107.20Understanding
Por que mesmo sob , mas sob ?
Show solution
sempre — é estimador não-viesado de tanto sob quanto sob . Já , que é somente quando todos os (i.e., sob ). Essa assimetria é o que faz F ser sensível ao efeito do tratamento. - Ex. 107.21Application
Três grupos com cada. Médias: 12, 15 e 18. Calcule e .
Show solution
Grande média: . . . . - Ex. 107.22ApplicationAnswer key
Continuação do exercício 107.21: e . Calcule e decida a (crítico ).
Show solution
. . Com e crítico : — rejeita . - Ex. 107.23Application
Usando os dados dos exercícios 107.21–107.22 (, ), calcule .
Show solution
. . Efeito grande (acima de 0,14). - Ex. 107.24Application
4 grupos com cada. e . Conduza a ANOVA completa a (crítico ) e calcule .
Show solution
4 grupos balanceados: . , . . . . Crítico : rejeita . .Show step-by-step (with the why)
- Calcule e os gl: , .
- Médias quadráticas: ; .
- Estatística: .
- Decisão: — rejeita .
- Tamanho de efeito: — grande.
Macete: Sempre some SS e confira gl antes de calcular F. Erro nos gl contamina tudo.
- Ex. 107.25Application
Complete a tabela ANOVA: , . Calcule .
Show solution
. - Ex. 107.26ModelingAnswer key
Um professor quer comparar três métodos de ensino (A, B, C) com 20 alunos cada, avaliados por prova. Formalize o modelo ANOVA, as hipóteses e as suposições necessárias.
Show solution
Modelo: com , . . Variável resposta: resultado na prova (0–100). Suposições: notas aproximadamente normais em cada método, variâncias similares, grupos independentes. - Ex. 107.27Modeling
Um estudo clínico compara 4 dietas para perda de peso com 40 participantes cada. Descreva como verificar as suposições da ANOVA antes de conduzir o teste.
Show solution
Independência: cada paciente aparece em uma única dieta (grupos separados — ok). Normalidade: com , TLC garante robustez. Homocedasticidade: boxplots das perdas por dieta — se amplitudes similares, suposição plausível. Verificar com Levene ou razão das variâncias amostrais. - Ex. 107.28Modeling
Um pesquisador compara 3 algoritmos de ML testados nos mesmos 30 datasets. É adequado usar ANOVA one-way? Justifique.
Show solution
Não é diretamente adequado. Algoritmos testados nos mesmos 30 datasets não são independentes entre si — o desempenho em um dataset pode estar correlacionado. A estrutura correta é ANOVA de medidas repetidas (ou modelos mistos) com dataset como bloco. ANOVA one-way clássica assumiria independência, o que viola o delineamento. - Ex. 107.29Modeling
Cinco lojas têm vendas semanais monitoradas por 30 semanas. Você quer usar ANOVA. Esboce: , , e se é suficiente para detectar efeito médio (Cohen's , poder 80%).
Show solution
5 grupos, cada, . , . Para detectar (médio), poder 80%, , : precisam-se aprox. 52 por grupo — logo 30 pode ser insuficiente. Consultar tabelas de poder ou software. - Ex. 107.30Modeling
Um laboratório de química compara quatro concentrações de catalisador (0, 5, 10, 20 g/L) no rendimento de uma reação, com 10 replicações cada. Justifique o uso de ANOVA one-way e liste as suposições a verificar.
Show solution
O ensaio compara quatro concentrações de catalisador — k = 4 grupos. Variável resposta: rendimento (%). Se grupos são independentes (cada reação usa só um catalisador), normalidade plausível para rendimento químico, homocedasticidade a verificar com Levene: ANOVA one-way é o teste adequado. - Ex. 107.31Application
4 dietas, 25 pessoas cada. Perdas de peso (kg) — médias por dieta: 3, 4, 5 e 4,5. Calcule .
Show solution
Grupos balanceados: . . - Ex. 107.32ApplicationAnswer key
e . Determine e .
Show solution
. . - Ex. 107.33ChallengeAnswer key
Derive algebricamente a decomposição . Mostre explicitamente por que os termos cruzados cancelam.
Show solution
Partindo de , eleve ao quadrado e some sobre . O termo cruzado é . Como para cada , os termos cruzados cancelam, restando . - Ex. 107.34Challenge
Mostre que, para grupos balanceados, a estatística da ANOVA é igual ao quadrado da estatística do teste de duas amostras com variância pooled.
Show solution
Para grupos com , . . . O teste t pooled tem . Como , temos . - Ex. 107.35Challenge
Argumente (sem demonstração completa) por que, sob , e são independentes. Como isso implica que ?
Show solution
Sob , (combinação quadrática de desvios normais independentes da grande média) e (combinação dentro de grupos, cada um com gl). Independência por ortogonalidade da projeção ortogonal em subespaços complementares. Logo . - Ex. 107.36Challenge
O que acontece com a ANOVA quando os grupos têm tamanhos muito diferentes (desbalanceamento extremo)? O teste ainda é válido?
Show solution
Desbalanceamento não invalida a ANOVA (a fórmula geral continua válida). O problema é interpretativo e de poder: grupos grandes têm mais peso na grande média, e a estimativa pooled de pode ser dominada por grupos com muitas observações. Em desbalanceamento extremo (), a robustez à heterocedasticidade diminui. Prefira Welch nesse caso. - Ex. 107.37Challenge
Para detectar efeito médio () entre 4 grupos a com poder 80%, quantos sujeitos por grupo são necessários (aproximadamente)? Com por grupo, o estudo está adequadamente dimensionado?
Show solution
4 grupos, cada, . Para detectar , poder 80%, , : precisam-se aprox. 45 por grupo (tabelas de poder ou `pwr` em R). Com o poder é aproximadamente 55–60% — insuficiente. Recomenda-se aumentar para por grupo. - Ex. 107.38Challenge
O que é o fator de Bayes na ANOVA bayesiana? Como interpretar versus ?
Show solution
A ANOVA bayesiana computa o fator de Bayes = razão de verossimilhanças marginais entre o modelo com efeito do grupo e o modelo nulo. é evidência forte para ; é evidência forte para . Vantagem: quantifica evidência em ambas as direções, ao contrário do p-valor que só rejeita ou não rejeita . - Ex. 107.39Proof
Demonstre que , mostrando que os termos cruzados cancelam ao somar sobre para cada fixo.
Show solution
Escreva . Eleve ao quadrado: . Somando sobre para fixo: o terceiro termo fica . Somando sobre : . ∎ - Ex. 107.40Proof
Mostre que sob (para grupos balanceados, ).
Show solution
Sob , aproximadamente. . Calculando via com sob : , portanto . ∎ - Ex. 107.41Proof
Derive a estatística do teste de Kruskal-Wallis e explique por que ela é o análogo não-paramétrico da ANOVA one-way.
Show solution
Kruskal-Wallis: ranqueia todas as observações conjuntamente, calcula soma de ranks por grupo , e computa . Sob , . Não assume normalidade — adequado quando a suposição falha. Perde poder se a normalidade de fato vale (comparado à ANOVA). - Ex. 107.42Proof
Derive a estatística da Welch's ANOVA para variâncias desiguais. Explique como os graus de liberdade do denominador são ajustados.
Show solution
A Welch's ANOVA não assume . Define pesos , média ponderada , e statística . O denominador corrige os graus de liberdade do denominador (fórmula de Welch-Satterthwaite generalizada). Sob , aproxima com fracionário.
Fontes
-
OpenStax — Statistics — Illowsky, Dean · CC-BY 4.0 · §13.1–13.4. Fonte primária desta lição. Definição do modelo, estatística F, tabela ANOVA, exercícios aplicados.
-
OpenIntro Statistics (4.ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA 3.0 · §7.5. Suposições do modelo, homocedasticidade, post-hoc de Tukey e Bonferroni.
-
Learning Statistics with R — Navarro · CC-BY-SA 4.0 · cap. 14. Intuição geométrica para F, tamanho de efeito , Welch's ANOVA, ANOVA bayesiana.