v1 · padrão canônico

Lição 107 — ANOVA one-way

Análise de variância (ANOVA one-way): decomposição SST = SSB + SSW, estatística F, tabela ANOVA, verificação de suposições, post-hoc de Tukey, tamanho de efeito eta².

Used in: 3.º ano EM — Estatística Inferencial · Stochastik LK alemão · H2 Math singapurense (estatística) · Math B japonês

F = \frac{MS_{\text{entre}}}{MS_{\text{dentro}}} = \frac{SSB/(k-1)}{SSW/(N-k)}

A ANOVA one-way compara $k$ médias de grupos com um único teste. A estatística F é a razão entre a variância entre grupos e a variância dentro dos grupos. Sob $H_0$ (todas as médias iguais), $F \approx 1$ . Quando alguma média difere, $F$ cresce — e rejeitamos $H_0$ .

Choose your door

Rigorous notation, full derivation, hypotheses

Definição rigorosa

O problema: comparar k médias com um único teste

Suponha que você tem $k \geq 2$ grupos independentes e quer saber se as médias populacionais $\mu_1, \ldots, \mu_k$ são iguais. Fazer $\binom{k}{2}$ testes $t$ separados inflaciona o erro do tipo I. A ANOVA resolve isso com um único teste global.

Definition· Modelo ANOVA one-way (efeitos fixos)

Cada observação $Y_{ij}$ (sujeito $j$ no grupo $i$ ) segue:

$Y_{ij} = \mu + \alpha_i + \varepsilon_{ij}, \quad i = 1, \ldots, k;\; j = 1, \ldots, n_i$

onde:

$\mu$ é a média geral (grande média)
$\alpha_i$ é o efeito do grupo $i$ , com restrição $\sum_{i=1}^k n_i \alpha_i = 0$
$\varepsilon_{ij} \sim \mathcal{N}(0, \sigma^2)$ i.i.d. — erros normais com variância comum

As hipóteses são:

$H_0: \alpha_1 = \alpha_2 = \cdots = \alpha_k = 0 \quad \Leftrightarrow \quad \mu_1 = \mu_2 = \cdots = \mu_k$ $H_1: \text{existe pelo menos um } i \text{ tal que } \alpha_i \neq 0$

"In a one-way analysis of variance problem, we are interested in comparing the means of $k$ populations. If the means are all equal, we say the treatments, or factor levels, are not different from one another. If at least one mean differs, we say the treatments are different." — OpenStax Statistics §13.1

Decomposição da variância total

Definition· Soma de quadrados: SST = SSB + SSW

Seja $\bar{Y} = \frac{1}{N}\sum_{i,j} Y_{ij}$ a grande média e $\bar{Y}_i = \frac{1}{n_i}\sum_j Y_{ij}$ a média do grupo $i$ . Define-se:

$SST = \sum_{i=1}^k \sum_{j=1}^{n_i} (Y_{ij} - \bar{Y})^2 \quad \text{(soma de quadrados total)}$

$SSB = \sum_{i=1}^k n_i (\bar{Y}_i - \bar{Y})^2 \quad \text{(entre grupos — Between)}$

$SSW = \sum_{i=1}^k \sum_{j=1}^{n_i} (Y_{ij} - \bar{Y}_i)^2 \quad \text{(dentro dos grupos — Within)}$

Teorema (decomposição): $SST = SSB + SSW$ . A prova resulta da identidade algébrica

$Y_{ij} - \bar{Y} = \underbrace{(\bar{Y}_i - \bar{Y})}_{\text{efeito do grupo}} + \underbrace{(Y_{ij} - \bar{Y}_i)}_{\text{erro intra-grupo}}$

ao elevar ao quadrado e somar — os termos cruzados cancelam porque $\sum_j (Y_{ij} - \bar{Y}_i) = 0$ .

Três grupos com médias distintas. Linha sólida tracejada colorida = média do grupo ( $\bar Y_i$ ). Linha cinza pontilhada = grande média ( $\bar Y$ ). SSB mede quanto as médias coloridas se afastam da cinza; SSW mede a dispersão dos pontos em torno de suas próprias médias.

Estatística F e tabela ANOVA

Definition· Médias quadráticas e estatística F

Dividindo cada SS pelo respectivo grau de liberdade obtemos as médias quadráticas (mean squares):

$MS_B = \frac{SSB}{k-1}, \qquad MS_W = \frac{SSW}{N-k}$

onde $N = \sum_{i=1}^k n_i$ e $k - 1$ e $N - k$ são os graus de liberdade entre e dentro.

A estatística do teste é:

$F = \frac{MS_B}{MS_W}$

Sob $H_0$ , $F \sim F_{k-1,\, N-k}$ (distribuição F de Snedecor). Rejeitamos $H_0$ se $F > F_{\alpha;\, k-1,\, N-k}$ .

Fonte	SS	gl	MS	F
Entre grupos	$SSB$	$k-1$	$MS_B = SSB/(k-1)$	$MS_B / MS_W$
Dentro dos grupos	$SSW$	$N-k$	$MS_W = SSW/(N-k)$	—
Total	$SST$	$N-1$	—	—

"The one-way ANOVA test statistic $F$ is the ratio of two independent chi-square variables divided by their respective degrees of freedom... Under the null hypothesis, $F$ follows an $F$ distribution with $k-1$ and $N-k$ degrees of freedom." — OpenStax Statistics §13.2

Suposições do modelo

Tamanho de efeito

Exemplos resolvidos

Example— 1· Graus de liberdade e tabela ANOVA (aplicacao)

Problema: Um pesquisador compara 4 dietas. Cada grupo tem 15 participantes. Preencha os graus de liberdade na tabela ANOVA.

Estratégia: Os graus de liberdade seguem diretamente das fórmulas: $df_B = k - 1$ , $df_W = N - k$ , $df_T = N - 1$ .

Resolução:

$k = 4$ grupos, $n_i = 15$ cada, $N = 4 \times 15 = 60$ .

Fonte	SS	gl	MS	F
Entre	$SSB$	$4 - 1 = 3$	$SSB/3$	$MS_B/MS_W$
Dentro	$SSW$	$60 - 4 = 56$	$SSW/56$	—
Total	$SST$	$60 - 1 = 59$	—	—

Conferência: $3 + 56 = 59$ ✓

Verificação: $df_T = df_B + df_W$ . Sempre se verifica $3 + 56 = 59$ . Se não fechar, há erro de cálculo.

Fonte. OpenStax — Statistics §13.2 — CC-BY 4.0.

Example— 2· Calcular F e decidir (aplicacao)

Problema: Três grupos com $n_1 = n_2 = n_3 = 10$ . $SSB = 60$ e $SSW = 135$ . Calcule $F$ e decida a $\alpha = 0{,}05$ (crítico $F_{2,\, 27} \approx 3{,}35$ ).

Estratégia: Calcular $MS_B = SSB/df_B$ e $MS_W = SSW/df_W$ , depois $F = MS_B/MS_W$ .

Resolução:

$k = 3$ , $N = 30$ . $df_B = 2$ , $df_W = 27$ .
$MS_B = 60/2 = 30$ .
$MS_W = 135/27 = 5$ .
$F = 30/5 = 6{,}0$ .
$6{,}0 > 3{,}35$ — rejeita $H_0$ . Evidência de que pelo menos uma média difere.

Verificação: $SST = 60 + 135 = 195$ . $\eta^2 = 60/195 \approx 0{,}31$ — efeito grande. Faz sentido com $F$ alto.

Fonte. OpenStax — Statistics §13.3 — CC-BY 4.0.

Example— 3· Calcular SSB a partir das medias dos grupos (intermediario)

Problema: Quatro grupos com $n = 20$ cada. Médias: $\bar{Y}_1 = 8$ , $\bar{Y}_2 = 10$ , $\bar{Y}_3 = 12$ , $\bar{Y}_4 = 10$ . Calcule $SSB$ .

Estratégia: Calcular a grande média $\bar{Y}$ e usar $SSB = \sum_i n_i(\bar{Y}_i - \bar{Y})^2$ .

Resolução:

Grande média: $\bar{Y} = (8 + 10 + 12 + 10)/4 = 40/4 = 10$ (grupos balanceados: média das médias).
Desvios ao quadrado ponderados:
- Grupo 1: $20 \cdot (8 - 10)^2 = 20 \cdot 4 = 80$
- Grupo 2: $20 \cdot (10 - 10)^2 = 0$
- Grupo 3: $20 \cdot (12 - 10)^2 = 20 \cdot 4 = 80$
- Grupo 4: $20 \cdot (10 - 10)^2 = 0$
$SSB = 80 + 0 + 80 + 0 = 160$ .

Verificação: Os grupos 2 e 4 têm médias iguais à grande média, contribuindo zero para SSB. Grupos 1 e 3, simétricos, contribuem igualmente. Faz sentido estrutural.

Fonte. OpenIntro Statistics §7.5 — CC-BY-SA 3.0.

Example— 4· Verificar suposicoes e decidir sobre teste alternativo (intermediario)

Problema: Um pesquisador tem 3 grupos com $n = 8$ cada. Os desvios-padrão são $s_1 = 3$ , $s_2 = 3{,}2$ , $s_3 = 9{,}5$ . O Shapiro-Wilk em um dos grupos dá $p = 0{,}012$ . Que teste usar?

Estratégia: Verificar as duas suposições críticas: normalidade e homocedasticidade. Se ambas ou uma delas falha seriamente com $n$ pequeno, escolher alternativa.

Resolução:

Normalidade: Shapiro-Wilk $p = 0{,}012 < 0{,}05$ — evidência de não-normalidade. Com $n = 8$ , o TLC não ajuda.
Homocedasticidade: razão das variâncias $s_3^2/s_1^2 = 9{,}5^2/3^2 = 90{,}25/9 \approx 10$ — muito acima do limite tolerável de 4:1.
Decisão: Duas suposições violadas com $n$ pequeno. A ANOVA paramétrica não é adequada.
Alternativa: Kruskal-Wallis — teste não-paramétrico análogo à ANOVA one-way, baseado em ranks. Não assume normalidade nem homocedasticidade.

Verificação: Se apenas a homocedasticidade falhasse (normalidade ok), Welch's ANOVA seria suficiente. Com não-normalidade adicional e $n$ pequeno, o não-paramétrico é a escolha correta.

Fonte. OpenIntro Statistics §7.5 — CC-BY-SA 3.0.

Example— 5· Analise completa: tres marcas de pilhas (modelagem real)

Problema: Um engenheiro de qualidade testa a duração (em horas) de três marcas de pilha AA. Cada marca é testada em 12 aparelhos idênticos. Médias: marca P = 18,5 h, marca Q = 22,0 h, marca R = 19,8 h. $SSB = 183{,}6$ e $SSW = 396{,}0$ . Conduza a ANOVA completa a $\alpha = 0{,}05$ e interprete.

Estratégia: Calcular gl, MS, F; comparar com crítico; se rejeitar, identificar qual marca difere usando as médias.

Resolução:

$k = 3$ , $n_i = 12$ , $N = 36$ . $df_B = 2$ , $df_W = 33$ .
$MS_B = 183{,}6 / 2 = 91{,}8$ .
$MS_W = 396{,}0 / 33 = 12{,}0$ .
$F = 91{,}8 / 12{,}0 = 7{,}65$ .
$F_{0{,}05;\, 2,\, 33} \approx 3{,}28$ (interpolação de tabela). $7{,}65 > 3{,}28$ — rejeita $H_0$ .
$\eta^2 = 183{,}6 / (183{,}6 + 396{,}0) = 183{,}6 / 579{,}6 \approx 0{,}317$ — efeito grande.
Post-hoc (inspeção das médias): A marca Q tem média 22,0 h, claramente acima das demais. Uma análise formal de Tukey HSD confirmaria qual(is) diferenças são significativas.

Verificação: Reporte formal: $F(2, 33) = 7{,}65$ , $p < 0{,}01$ , $\eta^2 = 0{,}32$ . A marca Q apresenta duração significativamente maior do que P; a diferença entre Q e R requer post-hoc formal.

Fonte. Navarro — Learning Statistics with R cap. 14 — CC-BY-SA 4.0.

Exercise list

42 exercises · 10 with worked solution (25%)

Application 17Understanding 10Modeling 5Challenge 6Proof 4

Ex. 107.1Application
Um experimento compara 3 grupos com 10 observações cada. Determine $df_B$ e $df_W$ .
Solve online OpenStax Statistics · §13.2 · ex. 13.1 · p. 718
Show solution
Com $k = 3$ grupos e $N = 30$ observações totais: $df_B = k - 1 = 2$ e $df_W = N - k = 30 - 3 = 27$ . Conferência: $2 + 27 = 29 = N - 1$ ✓
Show step-by-step (with the why)
1. Identifique $k$ (número de grupos) e $N$ (total de observações). Por quê: os graus de liberdade derivam diretamente dessas duas quantidades.
2. Calcule $df_B = k - 1 = 3 - 1 = 2$ . Por quê: entre $k$ grupos, "perde" 1 grau ao estimar a grande média.
3. Calcule $df_W = N - k = 30 - 3 = 27$ . Por quê: dentro de cada grupo estima-se a média local, perdendo 1 gl por grupo.
4. Confira: $df_B + df_W = N - 1$ . Se não fechar, há erro.
Macete: "Entre = grupos menos 1; Dentro = total menos grupos."
Ex. 107.2ApplicationAnswer key
Um pesquisador usa 5 grupos com 10 participantes cada. Determine $df_B$ e $df_W$ .
Solve online OpenStax Statistics · §13.2 · ex. 13.2 · p. 718
Show solution
$k = 5$ , $N = 50$ . $df_B = 5 - 1 = 4$ . $df_W = 50 - 5 = 45$ . Conferência: $4 + 45 = 49$ ✓
Ex. 107.3Application
Em um experimento com 3 grupos, $SSB = 40$ ( $df_B = 2$ ) e $SSW = 150$ ( $df_W = 30$ ). Calcule $MS_B$ e $MS_W$ .
Solve online OpenStax Statistics · §13.2 · ex. 13.3 · p. 719
Show solution
$MS_B = SSB / df_B = 40 / 2 = 20$ . $MS_W = SSW / df_W = 150 / 30 = 5$ .
Ex. 107.4ApplicationAnswer key
A partir dos valores do exercício 107.3, calcule a estatística $F$ .
Solve online OpenStax Statistics · §13.3 · ex. 13.5 · p. 721
Show solution
$F = MS_B / MS_W = 20 / 5 = 4{,}0$ . Usando os valores do exercício anterior.
Ex. 107.5Application
O valor $F = 4{,}0$ com $df = (2, 30)$ e $\alpha = 0{,}05$ (crítico $\approx 3{,}32$ ). Qual é a conclusão correta?
Select the correct option
Rejeita $H_0$ — evidência de diferença entre gruposNão rejeita $H_0$ — F abaixo do críticoResultado inconclusivo — F igual ao críticoNão é possível decidir sem o valor de SST
Select an option first
Solve online OpenStax Statistics · §13.3 · ex. 13.6 · p. 722
Show solution
Com $F = 4{,}0$ e crítico $F_{0{,}05;\,2,\,30} \approx 3{,}32$ , temos $4{,}0 > 3{,}32$ — rejeita-se $H_0$ . A opção B erra o sentido da comparação; C confunde com o valor limite; D é irrelevante pois F não depende de SST diretamente.
Ex. 107.6Application
$SST = 200$ e $SSB = 80$ . Calcule $\eta^2$ e classifique o tamanho do efeito.
Solve online OpenIntro Statistics · §7.5 · ex. 7.35 · p. 290
Show solution
$\eta^2 = SSB / SST = 80 / 200 = 0{,}40$ . Efeito grande (convenção Cohen: $\eta^2 \geq 0{,}14$ ).
Ex. 107.7Application
Usando os dados do exercício 107.6 ( $SST = 200$ , $SSB = 80$ ), determine $SSW$ .
Solve online OpenIntro Statistics · §7.5 · ex. 7.33 · p. 288
Show solution
$SSW = SST - SSB = 200 - 80 = 120$ . A decomposição $SST = SSB + SSW$ é exata (sem resto).
Ex. 107.8ApplicationAnswer key
Por que, sob $H_0$ , espera-se que $F \approx 1$ ? Explique em termos do que $MS_B$ e $MS_W$ estimam.
Solve online OpenStax Statistics · §13.2 · ex. 13.4 · p. 719
Show solution
Sob $H_0$ , $MS_B$ e $MS_W$ estimam a mesma variância $\sigma^2$ , portanto $E[F] = (N-k)/(N-k-2) \approx 1$ para $df_W$ grande. Se $H_1$ vale, $E[MS_B] > \sigma^2$ , então $E[F] > 1$ .
Ex. 107.9Application
Três grupos com $n = 15$ cada. Médias dos grupos: 9, 11 e 13. Calcule a grande média $\bar{Y}$ .
Solve online OpenIntro Statistics · §7.5 · ex. 7.30 · p. 287
Show solution
Para grupos balanceados ( $n_i$ iguais), a grande média é a média das médias dos grupos: $\bar Y = (9 + 11 + 13)/3 = 33/3 = 11$ .
Ex. 107.10Application
Usando os dados do exercício 107.9, calcule $SSB$ .
Solve online OpenIntro Statistics · §7.5 · ex. 7.31 · p. 287
Show solution
Com $\bar Y = 11$ (exercício anterior): $SSB = 15(9-11)^2 + 15(11-11)^2 + 15(13-11)^2 = 15 \cdot 4 + 0 + 15 \cdot 4 = 60 + 0 + 60 = 120$ . Corrigindo: $60 + 0 + 60 = 120$ . (Resp: 120.)
Ex. 107.11Understanding
Por que não fazer múltiplos testes $t$ para comparar 4 grupos? Calcule a probabilidade de ao menos um falso positivo com $\alpha = 0{,}05$ .
Solve online OpenIntro Statistics · §7.5 · ex. 7.37 · p. 289
Show solution
Com $k = 4$ grupos, seriam $\binom{4}{2} = 6$ testes t. Se cada um tem $\alpha = 0{,}05$ , a probabilidade de pelo menos um erro tipo I é $1 - (1-0{,}05)^6 \approx 0{,}26$ . A ANOVA mantém $\alpha = 0{,}05$ global.
Show step-by-step (with the why)
1. Conte o número de pares: $\binom{4}{2} = 6$ comparações.
2. Compute a probabilidade de ao menos 1 erro: $1 - (0{,}95)^6 \approx 0{,}26$ .
3. Conclua: 26% de chance de falso positivo mesmo sem diferença real — inaceitável para decisão científica.
Observação: Esse problema se chama "inflação do erro família" (family-wise error rate, FWER). A ANOVA resolve na raiz.
Ex. 107.12Understanding
Liste as três suposições da ANOVA one-way. Com $n = 8$ por grupo e desvios-padrão $s_1 = 3$ , $s_2 = 3$ , $s_3 = 9$ , qual suposição é mais suspeita?
Solve online OpenIntro Statistics · §7.5 · ex. 7.40 · p. 291
Show solution
Suposição de normalidade: distribuição aproximadamente normal dentro de cada grupo. Suposição de homocedasticidade: variâncias iguais entre grupos. Independência: observações independentes entre e dentro dos grupos. Com $n = 8$ , normalidade é crítica (TLC não ajuda muito); razão de variâncias 9 indica heterocedasticidade séria.
Ex. 107.13Understanding
Um estudo tem $k = 3$ grupos com $n = 8$ . Shapiro-Wilk rejeita normalidade em um grupo ( $p = 0{,}008$ ). Razão das variâncias: 9:1. Que teste usar?
Select the correct option
Kruskal-Wallis — variâncias muito desiguais e n pequeno tornam ANOVA inapropriadaWelch's ANOVA — basta ajustar os graus de liberdadeANOVA clássica — é robusta a tudoTeste t de Student repetido — mais simples
Select an option first
Solve online Navarro — Learning Statistics with R · cap. 14 · ex. 14.7 · p. 423
Show solution
Com heterocedasticidade severa ( $s_3/s_1 = 3$ , razão de variâncias 9) E não-normalidade em $n$ pequeno, nenhuma versão paramétrica é segura. Kruskal-Wallis (baseado em ranks) é a alternativa correta. Welch ajuda só para heterocedasticidade quando a normalidade é ok.
Ex. 107.14UnderstandingAnswer key
Para que serve o teste de Levene antes da ANOVA? Que conclusão tirar de $p = 0{,}38$ ?
Solve online OpenStax Statistics · §13.4 · ex. 13.9 · p. 725
Show solution
O teste de Levene verifica a hipótese $H_0: \sigma_1^2 = \sigma_2^2 = \cdots = \sigma_k^2$ . Se $p > 0{,}05$ , não há evidência contra homocedasticidade e a ANOVA clássica é indicada. Se $p \leq 0{,}05$ , use Welch's ANOVA.
Ex. 107.15Understanding
A ANOVA rejeita $H_0$ em um experimento com 5 grupos. O que isso significa? O que fazer a seguir?
Solve online OpenIntro Statistics · §7.5 · ex. 7.43 · p. 293
Show solution
ANOVA rejeitada diz apenas "pelo menos um grupo difere". Para identificar quais pares de grupos diferem, aplica-se post-hoc com correção de erro família: Tukey HSD para comparações pareadas, Bonferroni para qualquer contraste, Scheffé para contrastes lineares gerais.
Ex. 107.16UnderstandingAnswer key
Compare Tukey HSD e Bonferroni: qual é mais conservador? Quando usar cada um?
Solve online Navarro — Learning Statistics with R · cap. 14 · ex. 14.3 · p. 410
Show solution
Tukey HSD controla FWER apenas para comparações pareadas e é mais poderoso que Bonferroni nesse caso. Bonferroni é mais geral (funciona para qualquer conjunto de testes) mas mais conservador. Para $m$ comparações planejadas pareadas, Tukey é preferível; para contrastes ad hoc, Bonferroni é a escolha segura.
Ex. 107.17Understanding
Para $k = 2$ grupos, como se relacionam $F$ da ANOVA e $t$ do teste de duas amostras? Os p-valores coincidem?
Solve online Navarro — Learning Statistics with R · cap. 14 · ex. 14.5 · p. 418
Show solution
Para $k = 2$ : $F = T^2$ onde $T$ é a estatística t pooled de duas amostras. Os dois testes são equivalentes: $F_{1, N-2} = T^2_{N-2}$ . O valor-p é idêntico (teste bilateral).
Ex. 107.18UnderstandingAnswer key
Descreva a forma da distribuição $F$ com graus de liberdade pequenos. Por que $F$ nunca é negativo?
Solve online OpenStax Statistics · §13.3 · ex. 13.7 · p. 722
Show solution
A distribuição F é assimétrica à direita e assume apenas valores não-negativos (é razão de variâncias). Para valores pequenos de gl, a cauda direita é muito pesada. Quando $df_1$ e $df_2$ crescem, a distribuição F se aproxima da normal. Sempre $F \geq 0$ .
Ex. 107.19Understanding
Converta $\eta^2 = 0{,}09$ para Cohen's $f$ e classifique o tamanho do efeito.
Solve online OpenIntro Statistics · §7.5 · ex. 7.38 · p. 290
Show solution
Cohen's $f = \sqrt{\eta^2/(1-\eta^2)}$ . Para $\eta^2 = 0{,}09$ : $f = \sqrt{0{,}09/0{,}91} \approx 0{,}315$ . Pela convenção de Cohen ( $f = 0{,}10$ pequeno; $0{,}25$ médio; $0{,}40$ grande), este é um efeito próximo do grande.
Ex. 107.20Understanding
Por que $E[MS_W] = \sigma^2$ mesmo sob $H_1$ , mas $E[MS_B] > \sigma^2$ sob $H_1$ ?
Solve online Navarro — Learning Statistics with R · cap. 14 · ex. 14.6 · p. 420
Show solution
$E[MS_W] = \sigma^2$ sempre — $MS_W$ é estimador não-viesado de $\sigma^2$ tanto sob $H_0$ quanto sob $H_1$ . Já $E[MS_B] = \sigma^2 + \sum n_i \alpha_i^2/(k-1)$ , que é $\sigma^2$ somente quando todos os $\alpha_i = 0$ (i.e., sob $H_0$ ). Essa assimetria é o que faz F ser sensível ao efeito do tratamento.
Ex. 107.21Application
Três grupos com $n = 8$ cada. Médias: 12, 15 e 18. Calcule $SSB$ e $MS_B$ .
Solve online OpenStax Statistics · §13.2 · ex. 13.12 · p. 718
Show solution
Grande média: $\bar Y = (12 + 15 + 18)/3 = 15$ . $SSB = 8(12-15)^2 + 8(15-15)^2 + 8(18-15)^2 = 8 \cdot 9 + 0 + 8 \cdot 9 = 144$ . $df_B = 2$ . $MS_B = 72$ .
Ex. 107.22ApplicationAnswer key
Continuação do exercício 107.21: $SSW = 336$ e $df_W = 21$ . Calcule $F$ e decida a $\alpha = 0{,}05$ (crítico $\approx 3{,}47$ ).
Solve online OpenStax Statistics · §13.2 · ex. 13.13 · p. 719
Show solution
$MS_W = SSW / df_W = 336 / 21 = 16$ . $F = MS_B / MS_W = 72 / 16 = 4{,}5$ . Com $df = (2, 21)$ e crítico $F_{0{,}05;\,2,\,21} \approx 3{,}47$ : $4{,}5 > 3{,}47$ — rejeita $H_0$ .
Ex. 107.23Application
Usando os dados dos exercícios 107.21–107.22 ( $SSB = 144$ , $SSW = 336$ ), calcule $\eta^2$ .
Solve online OpenIntro Statistics · §7.5 · ex. 7.36 · p. 290
Show solution
$SST = SSB + SSW = 144 + 336 = 480$ . $\eta^2 = 144/480 = 0{,}30$ . Efeito grande (acima de 0,14).
Ex. 107.24Application
4 grupos com $n = 12$ cada. $SSB = 120$ e $SSW = 440$ . Conduza a ANOVA completa a $\alpha = 0{,}05$ (crítico $F_{3,44} \approx 2{,}82$ ) e calcule $\eta^2$ .
Solve online OpenStax Statistics · §13.3 · ex. 13.14 · p. 723
Show solution
4 grupos balanceados: $N = 4 \times 12 = 48$ . $df_B = 3$ , $df_W = 44$ . $MS_B = 120/3 = 40$ . $MS_W = 440/44 = 10$ . $F = 40/10 = 4{,}0$ . Crítico $F_{0{,}05;\,3,\,44} \approx 2{,}82$ : rejeita $H_0$ . $\eta^2 = 120/560 \approx 0{,}214$ .
Show step-by-step (with the why)
1. Calcule $N = 4 \times 12 = 48$ e os gl: $df_B = 3$ , $df_W = 44$ .
2. Médias quadráticas: $MS_B = 120/3 = 40$ ; $MS_W = 440/44 = 10$ .
3. Estatística: $F = 40/10 = 4{,}0$ .
4. Decisão: $4{,}0 > 2{,}82$ — rejeita $H_0$ .
5. Tamanho de efeito: $\eta^2 = 120/560 \approx 0{,}21$ — grande.
Macete: Sempre some SS e confira gl antes de calcular F. Erro nos gl contamina tudo.
Ex. 107.25Application
Complete a tabela ANOVA: $MS_B = 12$ , $MS_W = 2$ . Calcule $F$ .
Solve online OpenStax Statistics · §13.2 · ex. 13.15 · p. 720
Show solution
$F = MS_B/MS_W = 12/2 = 6{,}0$ .
Ex. 107.26ModelingAnswer key
Um professor quer comparar três métodos de ensino (A, B, C) com 20 alunos cada, avaliados por prova. Formalize o modelo ANOVA, as hipóteses e as suposições necessárias.
Solve online OpenStax Statistics · §13.1 · ex. 13.20 · p. 712
Show solution
Modelo: $Y_{ij} = \mu + \alpha_i + \varepsilon_{ij}$ com $i \in \{A, B, C\}$ , $j = 1, \ldots, 20$ . $H_0: \alpha_A = \alpha_B = \alpha_C = 0$ . Variável resposta: resultado na prova (0–100). Suposições: notas aproximadamente normais em cada método, variâncias similares, grupos independentes.
Ex. 107.27Modeling
Um estudo clínico compara 4 dietas para perda de peso com 40 participantes cada. Descreva como verificar as suposições da ANOVA antes de conduzir o teste.
Solve online OpenIntro Statistics · §7.5 · ex. 7.45 · p. 294
Show solution
Independência: cada paciente aparece em uma única dieta (grupos separados — ok). Normalidade: com $n = 40$ , TLC garante robustez. Homocedasticidade: boxplots das perdas por dieta — se amplitudes similares, suposição plausível. Verificar com Levene ou razão das variâncias amostrais.
Ex. 107.28Modeling
Um pesquisador compara 3 algoritmos de ML testados nos mesmos 30 datasets. É adequado usar ANOVA one-way? Justifique.
Solve online Navarro — Learning Statistics with R · cap. 14 · ex. 14.9 · p. 428
Show solution
Não é diretamente adequado. Algoritmos testados nos mesmos 30 datasets não são independentes entre si — o desempenho em um dataset pode estar correlacionado. A estrutura correta é ANOVA de medidas repetidas (ou modelos mistos) com dataset como bloco. ANOVA one-way clássica assumiria independência, o que viola o delineamento.
Ex. 107.29Modeling
Cinco lojas têm vendas semanais monitoradas por 30 semanas. Você quer usar ANOVA. Esboce: $df_B$ , $df_W$ , e se $n = 30$ é suficiente para detectar efeito médio (Cohen's $f = 0{,}25$ , poder 80%).
Solve online OpenStax Statistics · §13.1 · ex. 13.22 · p. 714
Show solution
5 grupos, $n = 30$ cada, $N = 150$ . $df_B = 4$ , $df_W = 145$ . Para detectar $f = 0{,}25$ (médio), poder 80%, $\alpha = 0{,}05$ , $k = 5$ : precisam-se aprox. 52 por grupo — logo 30 pode ser insuficiente. Consultar tabelas de poder ou software.
Ex. 107.30Modeling
Um laboratório de química compara quatro concentrações de catalisador (0, 5, 10, 20 g/L) no rendimento de uma reação, com 10 replicações cada. Justifique o uso de ANOVA one-way e liste as suposições a verificar.
Solve online Navarro — Learning Statistics with R · cap. 14 · ex. 14.2 · p. 412
Show solution
O ensaio compara quatro concentrações de catalisador — k = 4 grupos. Variável resposta: rendimento (%). Se grupos são independentes (cada reação usa só um catalisador), normalidade plausível para rendimento químico, homocedasticidade a verificar com Levene: ANOVA one-way é o teste adequado.
Ex. 107.31Application
4 dietas, 25 pessoas cada. Perdas de peso (kg) — médias por dieta: 3, 4, 5 e 4,5. Calcule $SSB$ .
Solve online OpenStax Statistics · §13.2 · ex. 13.16 · p. 719
Show solution
Grupos balanceados: $\bar Y = (3 + 4 + 5 + 4{,}5)/4 = 4{,}125$ . $SSB = 25[(3-4{,}125)^2 + (4-4{,}125)^2 + (5-4{,}125)^2 + (4{,}5-4{,}125)^2]$ $= 25[1{,}266 + 0{,}016 + 0{,}766 + 0{,}141] = 25 \times 2{,}188 = 54{,}7$ .
Ex. 107.32ApplicationAnswer key
$SST = 300$ e $\eta^2 = 0{,}5$ . Determine $SSB$ e $SSW$ .
Solve online OpenIntro Statistics · §7.5 · ex. 7.34 · p. 290
Show solution
$\eta^2 = SSB/SST \Rightarrow SSB = 0{,}5 \times 300 = 150$ . $SSW = 300 - 150 = 150$ .
Ex. 107.33ChallengeAnswer key
Derive algebricamente a decomposição $SST = SSB + SSW$ . Mostre explicitamente por que os termos cruzados cancelam.
Solve online OpenStax Statistics · §13.2 · ex. 13.25 · p. 716
Show solution
Partindo de $Y_{ij} - \bar Y = (\bar Y_i - \bar Y) + (Y_{ij} - \bar Y_i)$ , eleve ao quadrado e some sobre $i, j$ . O termo cruzado é $2\sum_i (\bar Y_i - \bar Y) \sum_j (Y_{ij} - \bar Y_i)$ . Como $\sum_j (Y_{ij} - \bar Y_i) = 0$ para cada $i$ , os termos cruzados cancelam, restando $SST = SSB + SSW$ .
Ex. 107.34Challenge
Mostre que, para $k = 2$ grupos balanceados, a estatística $F$ da ANOVA é igual ao quadrado da estatística $t$ do teste de duas amostras com variância pooled.
Navarro — Learning Statistics with R · cap. 14 · ex. 14.10 · p. 415
Show solution
Para $k = 2$ grupos com $n_1 = n_2 = n$ , $\bar Y_1 - \bar Y_2 = d$ . $\bar Y = (\bar Y_1 + \bar Y_2)/2$ . $SSB = n(\bar Y_1 - \bar Y)^2 + n(\bar Y_2 - \bar Y)^2 = n(d/2)^2 + n(d/2)^2 = nd^2/2$ . O teste t pooled tem $T^2 = (\bar Y_1 - \bar Y_2)^2 / (s_p^2(1/n + 1/n)) = d^2 n / (2 MS_W)$ . Como $MS_B = SSB/1 = nd^2/2$ , temos $F = MS_B/MS_W = T^2$ .
Ex. 107.35Challenge
Argumente (sem demonstração completa) por que, sob $H_0$ , $SSB/\sigma^2 \sim \chi^2_{k-1}$ e $SSW/\sigma^2 \sim \chi^2_{N-k}$ são independentes. Como isso implica que $F \sim F_{k-1, N-k}$ ?
Solve online OpenIntro Statistics · §7.5 · ex. 7.47 · p. 295
Show solution
Sob $H_0$ , $SSB/\sigma^2 \sim \chi^2_{k-1}$ (combinação quadrática de $k-1$ desvios normais independentes da grande média) e $SSW/\sigma^2 \sim \chi^2_{N-k}$ (combinação dentro de $k$ grupos, cada um com $n_i - 1$ gl). Independência por ortogonalidade da projeção ortogonal em subespaços complementares. Logo $F = (SSB/(k-1))/(SSW/(N-k)) \sim F_{k-1, N-k}$ .
Ex. 107.36Challenge
O que acontece com a ANOVA quando os grupos têm tamanhos muito diferentes (desbalanceamento extremo)? O teste ainda é válido?
Solve online Navarro — Learning Statistics with R · cap. 14 · ex. 14.11 · p. 424
Show solution
Desbalanceamento não invalida a ANOVA (a fórmula geral $SSB = \sum_i n_i (\bar Y_i - \bar Y)^2$ continua válida). O problema é interpretativo e de poder: grupos grandes têm mais peso na grande média, e a estimativa pooled de $\sigma^2$ pode ser dominada por grupos com muitas observações. Em desbalanceamento extremo ( $n_i/n_j > 10$ ), a robustez à heterocedasticidade diminui. Prefira Welch nesse caso.
Ex. 107.37Challenge
Para detectar efeito médio ( $f = 0{,}25$ ) entre 4 grupos a $\alpha = 0{,}05$ com poder 80%, quantos sujeitos por grupo são necessários (aproximadamente)? Com $n = 25$ por grupo, o estudo está adequadamente dimensionado?
Solve online OpenStax Statistics · §13.1 · ex. 13.27 · p. 715
Show solution
4 grupos, $n = 25$ cada, $N = 100$ . Para detectar $f = 0{,}25$ , poder 80%, $\alpha = 0{,}05$ , $k = 4$ : precisam-se aprox. 45 por grupo (tabelas de poder ou `pwr` em R). Com $n = 25$ o poder é aproximadamente 55–60% — insuficiente. Recomenda-se aumentar para $n \geq 45$ por grupo.
Ex. 107.38Challenge
O que é o fator de Bayes $BF_{10}$ na ANOVA bayesiana? Como interpretar $BF_{10} = 15$ versus $BF_{10} = 0{,}08$ ?
Solve online Navarro — Learning Statistics with R · cap. 14 · ex. 14.12 · p. 430
Show solution
A ANOVA bayesiana computa o fator de Bayes $BF_{10}$ = razão de verossimilhanças marginais entre o modelo com efeito do grupo e o modelo nulo. $BF_{10} > 10$ é evidência forte para $H_1$ ; $BF_{10} < 1/10$ é evidência forte para $H_0$ . Vantagem: quantifica evidência em ambas as direções, ao contrário do p-valor que só rejeita ou não rejeita $H_0$ .
Ex. 107.39Proof
Demonstre que $SST = SSB + SSW$ , mostrando que os termos cruzados cancelam ao somar sobre $j$ para cada $i$ fixo.
OpenStax Statistics · §13.2 · ex. 13.28 · p. 716
Show solution
Escreva $Y_{ij} - \bar Y = (\bar Y_i - \bar Y) + (Y_{ij} - \bar Y_i)$ . Eleve ao quadrado: $(Y_{ij}-\bar Y)^2 = (\bar Y_i - \bar Y)^2 + (Y_{ij}-\bar Y_i)^2 + 2(\bar Y_i - \bar Y)(Y_{ij}-\bar Y_i)$ . Somando sobre $j$ para $i$ fixo: o terceiro termo fica $2(\bar Y_i - \bar Y) \cdot 0 = 0$ . Somando sobre $i$ : $SST = SSB + SSW$ . ∎
Ex. 107.40Proof
Mostre que $E[MS_B] = \sigma^2$ sob $H_0$ (para grupos balanceados, $n_i = n$ ).
Navarro — Learning Statistics with R · cap. 14 · ex. 14.1 · p. 408
Show solution
Sob $H_0$ , $\bar Y_i - \bar Y \sim \mathcal N(0, \sigma^2(1/n_i - 1/N))$ aproximadamente. $E[SSB] = E[\sum n_i (\bar Y_i - \bar Y)^2]$ . Calculando via $E[X^2] = \text{Var}(X) + (E[X])^2$ com $E[\bar Y_i - \bar Y] = 0$ sob $H_0$ : $E[SSB] = (k-1)\sigma^2$ , portanto $E[MS_B] = \sigma^2$ . ∎
Ex. 107.41Proof
Derive a estatística do teste de Kruskal-Wallis e explique por que ela é o análogo não-paramétrico da ANOVA one-way.
Solve online OpenIntro Statistics · §7.5 · ex. 7.49 · p. 296
Show solution
Kruskal-Wallis: ranqueia todas as $N$ observações conjuntamente, calcula soma de ranks por grupo $R_i$ , e computa $H = \frac{12}{N(N+1)} \sum_i \frac{R_i^2}{n_i} - 3(N+1)$ . Sob $H_0$ , $H \sim \chi^2_{k-1}$ . Não assume normalidade — adequado quando a suposição falha. Perde poder se a normalidade de fato vale (comparado à ANOVA).
Ex. 107.42Proof
Derive a estatística $F^*$ da Welch's ANOVA para variâncias desiguais. Explique como os graus de liberdade do denominador são ajustados.
Solve online Navarro — Learning Statistics with R · cap. 14 · ex. 14.13 · p. 416
Show solution
A Welch's ANOVA não assume $\sigma_i^2 = \sigma^2$ . Define pesos $w_i = n_i/s_i^2$ , média ponderada $\bar Y^* = \sum w_i \bar Y_i / W$ , e statística $F^* = \frac{\sum w_i(\bar Y_i - \bar Y^*)^2/(k-1)}{1 + \frac{2(k-2)}{k^2-1} \sum (1 - w_i/W)^2/(n_i-1)}$ . O denominador corrige os graus de liberdade do denominador (fórmula de Welch-Satterthwaite generalizada). Sob $H_0$ , $F^*$ aproxima $F_{k-1, df_W^*}$ com $df_W^*$ fracionário.

Fontes

OpenStax — Statistics — Illowsky, Dean · CC-BY 4.0 · §13.1–13.4. Fonte primária desta lição. Definição do modelo, estatística F, tabela ANOVA, exercícios aplicados.
OpenIntro Statistics (4.ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA 3.0 · §7.5. Suposições do modelo, homocedasticidade, post-hoc de Tukey e Bonferroni.
Learning Statistics with R — Navarro · CC-BY-SA 4.0 · cap. 14. Intuição geométrica para F, tamanho de efeito $\eta^2$ , Welch's ANOVA, ANOVA bayesiana.