Math ClubMath Club
v1 · padrão canônico

Lição 107 — ANOVA one-way

Análise de variância (ANOVA one-way): decomposição SST = SSB + SSW, estatística F, tabela ANOVA, verificação de suposições, post-hoc de Tukey, tamanho de efeito eta².

Used in: 3.º ano EM — Estatística Inferencial · Stochastik LK alemão · H2 Math singapurense (estatística) · Math B japonês

F=MSentreMSdentro=SSB/(k1)SSW/(Nk)F = \frac{MS_{\text{entre}}}{MS_{\text{dentro}}} = \frac{SSB/(k-1)}{SSW/(N-k)}

A ANOVA one-way compara kk médias de grupos com um único teste. A estatística F é a razão entre a variância entre grupos e a variância dentro dos grupos. Sob H0H_0 (todas as médias iguais), F1F \approx 1. Quando alguma média difere, FF cresce — e rejeitamos H0H_0.

Choose your door

Rigorous notation, full derivation, hypotheses

Definição rigorosa

O problema: comparar k médias com um único teste

Suponha que você tem k2k \geq 2 grupos independentes e quer saber se as médias populacionais μ1,,μk\mu_1, \ldots, \mu_k são iguais. Fazer (k2)\binom{k}{2} testes tt separados inflaciona o erro do tipo I. A ANOVA resolve isso com um único teste global.

"In a one-way analysis of variance problem, we are interested in comparing the means of kk populations. If the means are all equal, we say the treatments, or factor levels, are not different from one another. If at least one mean differs, we say the treatments are different." — OpenStax Statistics §13.1

Decomposição da variância total

Grupo 1Ȳ₁ = 75Grupo 2Ȳ₂ = 110Grupo 3Ȳ₃ = 140Ȳ

Três grupos com médias distintas. Linha sólida tracejada colorida = média do grupo (Yˉi\bar Y_i). Linha cinza pontilhada = grande média (Yˉ\bar Y). SSB mede quanto as médias coloridas se afastam da cinza; SSW mede a dispersão dos pontos em torno de suas próprias médias.

Estatística F e tabela ANOVA

"The one-way ANOVA test statistic FF is the ratio of two independent chi-square variables divided by their respective degrees of freedom... Under the null hypothesis, FF follows an FF distribution with k1k-1 and NkN-k degrees of freedom." — OpenStax Statistics §13.2

Suposições do modelo

Tamanho de efeito

Exemplos resolvidos

Exercise list

42 exercises · 10 with worked solution (25%)

Application 17Understanding 10Modeling 5Challenge 6Proof 4
  1. Ex. 107.1Application

    Um experimento compara 3 grupos com 10 observações cada. Determine dfBdf_B e dfWdf_W.

    Show solution
    Com k=3k = 3 grupos e N=30N = 30 observações totais: dfB=k1=2df_B = k - 1 = 2 e dfW=Nk=303=27df_W = N - k = 30 - 3 = 27. Conferência: 2+27=29=N12 + 27 = 29 = N - 1
    Show step-by-step (with the why)
    1. Identifique kk (número de grupos) e NN (total de observações). Por quê: os graus de liberdade derivam diretamente dessas duas quantidades.
    2. Calcule dfB=k1=31=2df_B = k - 1 = 3 - 1 = 2. Por quê: entre kk grupos, "perde" 1 grau ao estimar a grande média.
    3. Calcule dfW=Nk=303=27df_W = N - k = 30 - 3 = 27. Por quê: dentro de cada grupo estima-se a média local, perdendo 1 gl por grupo.
    4. Confira: dfB+dfW=N1df_B + df_W = N - 1. Se não fechar, há erro.

    Macete: "Entre = grupos menos 1; Dentro = total menos grupos."

  2. Ex. 107.2ApplicationAnswer key

    Um pesquisador usa 5 grupos com 10 participantes cada. Determine dfBdf_B e dfWdf_W.

    Show solution
    k=5k = 5, N=50N = 50. dfB=51=4df_B = 5 - 1 = 4. dfW=505=45df_W = 50 - 5 = 45. Conferência: 4+45=494 + 45 = 49
  3. Ex. 107.3Application

    Em um experimento com 3 grupos, SSB=40SSB = 40 (dfB=2df_B = 2) e SSW=150SSW = 150 (dfW=30df_W = 30). Calcule MSBMS_B e MSWMS_W.

    Show solution
    MSB=SSB/dfB=40/2=20MS_B = SSB / df_B = 40 / 2 = 20. MSW=SSW/dfW=150/30=5MS_W = SSW / df_W = 150 / 30 = 5.
  4. Ex. 107.4ApplicationAnswer key

    A partir dos valores do exercício 107.3, calcule a estatística FF.

    Show solution
    F=MSB/MSW=20/5=4,0F = MS_B / MS_W = 20 / 5 = 4{,}0. Usando os valores do exercício anterior.
  5. Ex. 107.5Application

    O valor F=4,0F = 4{,}0 com df=(2,30)df = (2, 30) e α=0,05\alpha = 0{,}05 (crítico 3,32\approx 3{,}32). Qual é a conclusão correta?

    Select the correct option
    Select an option first
    Show solution
    Com F=4,0F = 4{,}0 e crítico F0,05;2,303,32F_{0{,}05;\,2,\,30} \approx 3{,}32, temos 4,0>3,324{,}0 > 3{,}32 — rejeita-se H0H_0. A opção B erra o sentido da comparação; C confunde com o valor limite; D é irrelevante pois F não depende de SST diretamente.
  6. Ex. 107.6Application

    SST=200SST = 200 e SSB=80SSB = 80. Calcule η2\eta^2 e classifique o tamanho do efeito.

    Show solution
    η2=SSB/SST=80/200=0,40\eta^2 = SSB / SST = 80 / 200 = 0{,}40. Efeito grande (convenção Cohen: η20,14\eta^2 \geq 0{,}14).
  7. Ex. 107.7Application

    Usando os dados do exercício 107.6 (SST=200SST = 200, SSB=80SSB = 80), determine SSWSSW.

    Show solution
    SSW=SSTSSB=20080=120SSW = SST - SSB = 200 - 80 = 120. A decomposição SST=SSB+SSWSST = SSB + SSW é exata (sem resto).
  8. Ex. 107.8ApplicationAnswer key

    Por que, sob H0H_0, espera-se que F1F \approx 1? Explique em termos do que MSBMS_B e MSWMS_W estimam.

    Show solution
    Sob H0H_0, MSBMS_B e MSWMS_W estimam a mesma variância σ2\sigma^2, portanto E[F]=(Nk)/(Nk2)1E[F] = (N-k)/(N-k-2) \approx 1 para dfWdf_W grande. Se H1H_1 vale, E[MSB]>σ2E[MS_B] > \sigma^2, então E[F]>1E[F] > 1.
  9. Ex. 107.9Application

    Três grupos com n=15n = 15 cada. Médias dos grupos: 9, 11 e 13. Calcule a grande média Yˉ\bar{Y}.

    Show solution
    Para grupos balanceados (nin_i iguais), a grande média é a média das médias dos grupos: Yˉ=(9+11+13)/3=33/3=11\bar Y = (9 + 11 + 13)/3 = 33/3 = 11.
  10. Ex. 107.10Application

    Usando os dados do exercício 107.9, calcule SSBSSB.

    Show solution
    Com Yˉ=11\bar Y = 11 (exercício anterior): SSB=15(911)2+15(1111)2+15(1311)2=154+0+154=60+0+60=120SSB = 15(9-11)^2 + 15(11-11)^2 + 15(13-11)^2 = 15 \cdot 4 + 0 + 15 \cdot 4 = 60 + 0 + 60 = 120. Corrigindo: 60+0+60=12060 + 0 + 60 = 120. (Resp: 120.)
  11. Ex. 107.11Understanding

    Por que não fazer múltiplos testes tt para comparar 4 grupos? Calcule a probabilidade de ao menos um falso positivo com α=0,05\alpha = 0{,}05.

    Show solution
    Com k=4k = 4 grupos, seriam (42)=6\binom{4}{2} = 6 testes t. Se cada um tem α=0,05\alpha = 0{,}05, a probabilidade de pelo menos um erro tipo I é 1(10,05)60,261 - (1-0{,}05)^6 \approx 0{,}26. A ANOVA mantém α=0,05\alpha = 0{,}05 global.
    Show step-by-step (with the why)
    1. Conte o número de pares: (42)=6\binom{4}{2} = 6 comparações.
    2. Compute a probabilidade de ao menos 1 erro: 1(0,95)60,261 - (0{,}95)^6 \approx 0{,}26.
    3. Conclua: 26% de chance de falso positivo mesmo sem diferença real — inaceitável para decisão científica.

    Observação: Esse problema se chama "inflação do erro família" (family-wise error rate, FWER). A ANOVA resolve na raiz.

  12. Ex. 107.12Understanding

    Liste as três suposições da ANOVA one-way. Com n=8n = 8 por grupo e desvios-padrão s1=3s_1 = 3, s2=3s_2 = 3, s3=9s_3 = 9, qual suposição é mais suspeita?

    Show solution
    Suposição de normalidade: distribuição aproximadamente normal dentro de cada grupo. Suposição de homocedasticidade: variâncias iguais entre grupos. Independência: observações independentes entre e dentro dos grupos. Com n=8n = 8, normalidade é crítica (TLC não ajuda muito); razão de variâncias 9 indica heterocedasticidade séria.
  13. Ex. 107.13Understanding

    Um estudo tem k=3k = 3 grupos com n=8n = 8. Shapiro-Wilk rejeita normalidade em um grupo (p=0,008p = 0{,}008). Razão das variâncias: 9:1. Que teste usar?

    Select the correct option
    Select an option first
    Show solution
    Com heterocedasticidade severa (s3/s1=3s_3/s_1 = 3, razão de variâncias 9) E não-normalidade em nn pequeno, nenhuma versão paramétrica é segura. Kruskal-Wallis (baseado em ranks) é a alternativa correta. Welch ajuda só para heterocedasticidade quando a normalidade é ok.
  14. Ex. 107.14UnderstandingAnswer key

    Para que serve o teste de Levene antes da ANOVA? Que conclusão tirar de p=0,38p = 0{,}38?

    Show solution
    O teste de Levene verifica a hipótese H0:σ12=σ22==σk2H_0: \sigma_1^2 = \sigma_2^2 = \cdots = \sigma_k^2. Se p>0,05p > 0{,}05, não há evidência contra homocedasticidade e a ANOVA clássica é indicada. Se p0,05p \leq 0{,}05, use Welch's ANOVA.
  15. Ex. 107.15Understanding

    A ANOVA rejeita H0H_0 em um experimento com 5 grupos. O que isso significa? O que fazer a seguir?

    Show solution
    ANOVA rejeitada diz apenas "pelo menos um grupo difere". Para identificar quais pares de grupos diferem, aplica-se post-hoc com correção de erro família: Tukey HSD para comparações pareadas, Bonferroni para qualquer contraste, Scheffé para contrastes lineares gerais.
  16. Ex. 107.16UnderstandingAnswer key

    Compare Tukey HSD e Bonferroni: qual é mais conservador? Quando usar cada um?

    Show solution
    Tukey HSD controla FWER apenas para comparações pareadas e é mais poderoso que Bonferroni nesse caso. Bonferroni é mais geral (funciona para qualquer conjunto de testes) mas mais conservador. Para mm comparações planejadas pareadas, Tukey é preferível; para contrastes ad hoc, Bonferroni é a escolha segura.
  17. Ex. 107.17Understanding

    Para k=2k = 2 grupos, como se relacionam FF da ANOVA e tt do teste de duas amostras? Os p-valores coincidem?

    Show solution
    Para k=2k = 2: F=T2F = T^2 onde TT é a estatística t pooled de duas amostras. Os dois testes são equivalentes: F1,N2=TN22F_{1, N-2} = T^2_{N-2}. O valor-p é idêntico (teste bilateral).
  18. Ex. 107.18UnderstandingAnswer key

    Descreva a forma da distribuição FF com graus de liberdade pequenos. Por que FF nunca é negativo?

    Show solution
    A distribuição F é assimétrica à direita e assume apenas valores não-negativos (é razão de variâncias). Para valores pequenos de gl, a cauda direita é muito pesada. Quando df1df_1 e df2df_2 crescem, a distribuição F se aproxima da normal. Sempre F0F \geq 0.
  19. Ex. 107.19Understanding

    Converta η2=0,09\eta^2 = 0{,}09 para Cohen's ff e classifique o tamanho do efeito.

    Show solution
    Cohen's f=η2/(1η2)f = \sqrt{\eta^2/(1-\eta^2)}. Para η2=0,09\eta^2 = 0{,}09: f=0,09/0,910,315f = \sqrt{0{,}09/0{,}91} \approx 0{,}315. Pela convenção de Cohen (f=0,10f = 0{,}10 pequeno; 0,250{,}25 médio; 0,400{,}40 grande), este é um efeito próximo do grande.
  20. Ex. 107.20Understanding

    Por que E[MSW]=σ2E[MS_W] = \sigma^2 mesmo sob H1H_1, mas E[MSB]>σ2E[MS_B] > \sigma^2 sob H1H_1?

    Show solution
    E[MSW]=σ2E[MS_W] = \sigma^2 sempre — MSWMS_W é estimador não-viesado de σ2\sigma^2 tanto sob H0H_0 quanto sob H1H_1. Já E[MSB]=σ2+niαi2/(k1)E[MS_B] = \sigma^2 + \sum n_i \alpha_i^2/(k-1), que é σ2\sigma^2 somente quando todos os αi=0\alpha_i = 0 (i.e., sob H0H_0). Essa assimetria é o que faz F ser sensível ao efeito do tratamento.
  21. Ex. 107.21Application

    Três grupos com n=8n = 8 cada. Médias: 12, 15 e 18. Calcule SSBSSB e MSBMS_B.

    Show solution
    Grande média: Yˉ=(12+15+18)/3=15\bar Y = (12 + 15 + 18)/3 = 15. SSB=8(1215)2+8(1515)2+8(1815)2=89+0+89=144SSB = 8(12-15)^2 + 8(15-15)^2 + 8(18-15)^2 = 8 \cdot 9 + 0 + 8 \cdot 9 = 144. dfB=2df_B = 2. MSB=72MS_B = 72.
  22. Ex. 107.22ApplicationAnswer key

    Continuação do exercício 107.21: SSW=336SSW = 336 e dfW=21df_W = 21. Calcule FF e decida a α=0,05\alpha = 0{,}05 (crítico 3,47\approx 3{,}47).

    Show solution
    MSW=SSW/dfW=336/21=16MS_W = SSW / df_W = 336 / 21 = 16. F=MSB/MSW=72/16=4,5F = MS_B / MS_W = 72 / 16 = 4{,}5. Com df=(2,21)df = (2, 21) e crítico F0,05;2,213,47F_{0{,}05;\,2,\,21} \approx 3{,}47: 4,5>3,474{,}5 > 3{,}47 — rejeita H0H_0.
  23. Ex. 107.23Application

    Usando os dados dos exercícios 107.21–107.22 (SSB=144SSB = 144, SSW=336SSW = 336), calcule η2\eta^2.

    Show solution
    SST=SSB+SSW=144+336=480SST = SSB + SSW = 144 + 336 = 480. η2=144/480=0,30\eta^2 = 144/480 = 0{,}30. Efeito grande (acima de 0,14).
  24. Ex. 107.24Application

    4 grupos com n=12n = 12 cada. SSB=120SSB = 120 e SSW=440SSW = 440. Conduza a ANOVA completa a α=0,05\alpha = 0{,}05 (crítico F3,442,82F_{3,44} \approx 2{,}82) e calcule η2\eta^2.

    Show solution
    4 grupos balanceados: N=4×12=48N = 4 \times 12 = 48. dfB=3df_B = 3, dfW=44df_W = 44. MSB=120/3=40MS_B = 120/3 = 40. MSW=440/44=10MS_W = 440/44 = 10. F=40/10=4,0F = 40/10 = 4{,}0. Crítico F0,05;3,442,82F_{0{,}05;\,3,\,44} \approx 2{,}82: rejeita H0H_0. η2=120/5600,214\eta^2 = 120/560 \approx 0{,}214.
    Show step-by-step (with the why)
    1. Calcule N=4×12=48N = 4 \times 12 = 48 e os gl: dfB=3df_B = 3, dfW=44df_W = 44.
    2. Médias quadráticas: MSB=120/3=40MS_B = 120/3 = 40; MSW=440/44=10MS_W = 440/44 = 10.
    3. Estatística: F=40/10=4,0F = 40/10 = 4{,}0.
    4. Decisão: 4,0>2,824{,}0 > 2{,}82 — rejeita H0H_0.
    5. Tamanho de efeito: η2=120/5600,21\eta^2 = 120/560 \approx 0{,}21 — grande.

    Macete: Sempre some SS e confira gl antes de calcular F. Erro nos gl contamina tudo.

  25. Ex. 107.25Application

    Complete a tabela ANOVA: MSB=12MS_B = 12, MSW=2MS_W = 2. Calcule FF.

    Show solution
    F=MSB/MSW=12/2=6,0F = MS_B/MS_W = 12/2 = 6{,}0.
  26. Ex. 107.26ModelingAnswer key

    Um professor quer comparar três métodos de ensino (A, B, C) com 20 alunos cada, avaliados por prova. Formalize o modelo ANOVA, as hipóteses e as suposições necessárias.

    Show solution
    Modelo: Yij=μ+αi+εijY_{ij} = \mu + \alpha_i + \varepsilon_{ij} com i{A,B,C}i \in \{A, B, C\}, j=1,,20j = 1, \ldots, 20. H0:αA=αB=αC=0H_0: \alpha_A = \alpha_B = \alpha_C = 0. Variável resposta: resultado na prova (0–100). Suposições: notas aproximadamente normais em cada método, variâncias similares, grupos independentes.
  27. Ex. 107.27Modeling

    Um estudo clínico compara 4 dietas para perda de peso com 40 participantes cada. Descreva como verificar as suposições da ANOVA antes de conduzir o teste.

    Show solution
    Independência: cada paciente aparece em uma única dieta (grupos separados — ok). Normalidade: com n=40n = 40, TLC garante robustez. Homocedasticidade: boxplots das perdas por dieta — se amplitudes similares, suposição plausível. Verificar com Levene ou razão das variâncias amostrais.
  28. Ex. 107.28Modeling

    Um pesquisador compara 3 algoritmos de ML testados nos mesmos 30 datasets. É adequado usar ANOVA one-way? Justifique.

    Show solution
    Não é diretamente adequado. Algoritmos testados nos mesmos 30 datasets não são independentes entre si — o desempenho em um dataset pode estar correlacionado. A estrutura correta é ANOVA de medidas repetidas (ou modelos mistos) com dataset como bloco. ANOVA one-way clássica assumiria independência, o que viola o delineamento.
  29. Ex. 107.29Modeling

    Cinco lojas têm vendas semanais monitoradas por 30 semanas. Você quer usar ANOVA. Esboce: dfBdf_B, dfWdf_W, e se n=30n = 30 é suficiente para detectar efeito médio (Cohen's f=0,25f = 0{,}25, poder 80%).

    Show solution
    5 grupos, n=30n = 30 cada, N=150N = 150. dfB=4df_B = 4, dfW=145df_W = 145. Para detectar f=0,25f = 0{,}25 (médio), poder 80%, α=0,05\alpha = 0{,}05, k=5k = 5: precisam-se aprox. 52 por grupo — logo 30 pode ser insuficiente. Consultar tabelas de poder ou software.
  30. Ex. 107.30Modeling

    Um laboratório de química compara quatro concentrações de catalisador (0, 5, 10, 20 g/L) no rendimento de uma reação, com 10 replicações cada. Justifique o uso de ANOVA one-way e liste as suposições a verificar.

    Show solution
    O ensaio compara quatro concentrações de catalisador — k = 4 grupos. Variável resposta: rendimento (%). Se grupos são independentes (cada reação usa só um catalisador), normalidade plausível para rendimento químico, homocedasticidade a verificar com Levene: ANOVA one-way é o teste adequado.
  31. Ex. 107.31Application

    4 dietas, 25 pessoas cada. Perdas de peso (kg) — médias por dieta: 3, 4, 5 e 4,5. Calcule SSBSSB.

    Show solution
    Grupos balanceados: Yˉ=(3+4+5+4,5)/4=4,125\bar Y = (3 + 4 + 5 + 4{,}5)/4 = 4{,}125. SSB=25[(34,125)2+(44,125)2+(54,125)2+(4,54,125)2]SSB = 25[(3-4{,}125)^2 + (4-4{,}125)^2 + (5-4{,}125)^2 + (4{,}5-4{,}125)^2] =25[1,266+0,016+0,766+0,141]=25×2,188=54,7= 25[1{,}266 + 0{,}016 + 0{,}766 + 0{,}141] = 25 \times 2{,}188 = 54{,}7.
  32. Ex. 107.32ApplicationAnswer key

    SST=300SST = 300 e η2=0,5\eta^2 = 0{,}5. Determine SSBSSB e SSWSSW.

    Show solution
    η2=SSB/SSTSSB=0,5×300=150\eta^2 = SSB/SST \Rightarrow SSB = 0{,}5 \times 300 = 150. SSW=300150=150SSW = 300 - 150 = 150.
  33. Ex. 107.33ChallengeAnswer key

    Derive algebricamente a decomposição SST=SSB+SSWSST = SSB + SSW. Mostre explicitamente por que os termos cruzados cancelam.

    Show solution
    Partindo de YijYˉ=(YˉiYˉ)+(YijYˉi)Y_{ij} - \bar Y = (\bar Y_i - \bar Y) + (Y_{ij} - \bar Y_i), eleve ao quadrado e some sobre i,ji, j. O termo cruzado é 2i(YˉiYˉ)j(YijYˉi)2\sum_i (\bar Y_i - \bar Y) \sum_j (Y_{ij} - \bar Y_i). Como j(YijYˉi)=0\sum_j (Y_{ij} - \bar Y_i) = 0 para cada ii, os termos cruzados cancelam, restando SST=SSB+SSWSST = SSB + SSW.
  34. Ex. 107.34Challenge

    Mostre que, para k=2k = 2 grupos balanceados, a estatística FF da ANOVA é igual ao quadrado da estatística tt do teste de duas amostras com variância pooled.

    Show solution
    Para k=2k = 2 grupos com n1=n2=nn_1 = n_2 = n, Yˉ1Yˉ2=d\bar Y_1 - \bar Y_2 = d. Yˉ=(Yˉ1+Yˉ2)/2\bar Y = (\bar Y_1 + \bar Y_2)/2. SSB=n(Yˉ1Yˉ)2+n(Yˉ2Yˉ)2=n(d/2)2+n(d/2)2=nd2/2SSB = n(\bar Y_1 - \bar Y)^2 + n(\bar Y_2 - \bar Y)^2 = n(d/2)^2 + n(d/2)^2 = nd^2/2. O teste t pooled tem T2=(Yˉ1Yˉ2)2/(sp2(1/n+1/n))=d2n/(2MSW)T^2 = (\bar Y_1 - \bar Y_2)^2 / (s_p^2(1/n + 1/n)) = d^2 n / (2 MS_W). Como MSB=SSB/1=nd2/2MS_B = SSB/1 = nd^2/2, temos F=MSB/MSW=T2F = MS_B/MS_W = T^2.
  35. Ex. 107.35Challenge

    Argumente (sem demonstração completa) por que, sob H0H_0, SSB/σ2χk12SSB/\sigma^2 \sim \chi^2_{k-1} e SSW/σ2χNk2SSW/\sigma^2 \sim \chi^2_{N-k} são independentes. Como isso implica que FFk1,NkF \sim F_{k-1, N-k}?

    Show solution
    Sob H0H_0, SSB/σ2χk12SSB/\sigma^2 \sim \chi^2_{k-1} (combinação quadrática de k1k-1 desvios normais independentes da grande média) e SSW/σ2χNk2SSW/\sigma^2 \sim \chi^2_{N-k} (combinação dentro de kk grupos, cada um com ni1n_i - 1 gl). Independência por ortogonalidade da projeção ortogonal em subespaços complementares. Logo F=(SSB/(k1))/(SSW/(Nk))Fk1,NkF = (SSB/(k-1))/(SSW/(N-k)) \sim F_{k-1, N-k}.
  36. Ex. 107.36Challenge

    O que acontece com a ANOVA quando os grupos têm tamanhos muito diferentes (desbalanceamento extremo)? O teste ainda é válido?

    Show solution
    Desbalanceamento não invalida a ANOVA (a fórmula geral SSB=ini(YˉiYˉ)2SSB = \sum_i n_i (\bar Y_i - \bar Y)^2 continua válida). O problema é interpretativo e de poder: grupos grandes têm mais peso na grande média, e a estimativa pooled de σ2\sigma^2 pode ser dominada por grupos com muitas observações. Em desbalanceamento extremo (ni/nj>10n_i/n_j > 10), a robustez à heterocedasticidade diminui. Prefira Welch nesse caso.
  37. Ex. 107.37Challenge

    Para detectar efeito médio (f=0,25f = 0{,}25) entre 4 grupos a α=0,05\alpha = 0{,}05 com poder 80%, quantos sujeitos por grupo são necessários (aproximadamente)? Com n=25n = 25 por grupo, o estudo está adequadamente dimensionado?

    Show solution
    4 grupos, n=25n = 25 cada, N=100N = 100. Para detectar f=0,25f = 0{,}25, poder 80%, α=0,05\alpha = 0{,}05, k=4k = 4: precisam-se aprox. 45 por grupo (tabelas de poder ou `pwr` em R). Com n=25n = 25 o poder é aproximadamente 55–60% — insuficiente. Recomenda-se aumentar para n45n \geq 45 por grupo.
  38. Ex. 107.38Challenge

    O que é o fator de Bayes BF10BF_{10} na ANOVA bayesiana? Como interpretar BF10=15BF_{10} = 15 versus BF10=0,08BF_{10} = 0{,}08?

    Show solution
    A ANOVA bayesiana computa o fator de Bayes BF10BF_{10} = razão de verossimilhanças marginais entre o modelo com efeito do grupo e o modelo nulo. BF10>10BF_{10} > 10 é evidência forte para H1H_1; BF10<1/10BF_{10} < 1/10 é evidência forte para H0H_0. Vantagem: quantifica evidência em ambas as direções, ao contrário do p-valor que só rejeita ou não rejeita H0H_0.
  39. Ex. 107.39Proof

    Demonstre que SST=SSB+SSWSST = SSB + SSW, mostrando que os termos cruzados cancelam ao somar sobre jj para cada ii fixo.

    Show solution
    Escreva YijYˉ=(YˉiYˉ)+(YijYˉi)Y_{ij} - \bar Y = (\bar Y_i - \bar Y) + (Y_{ij} - \bar Y_i). Eleve ao quadrado: (YijYˉ)2=(YˉiYˉ)2+(YijYˉi)2+2(YˉiYˉ)(YijYˉi)(Y_{ij}-\bar Y)^2 = (\bar Y_i - \bar Y)^2 + (Y_{ij}-\bar Y_i)^2 + 2(\bar Y_i - \bar Y)(Y_{ij}-\bar Y_i). Somando sobre jj para ii fixo: o terceiro termo fica 2(YˉiYˉ)0=02(\bar Y_i - \bar Y) \cdot 0 = 0. Somando sobre ii: SST=SSB+SSWSST = SSB + SSW. ∎
  40. Ex. 107.40Proof

    Mostre que E[MSB]=σ2E[MS_B] = \sigma^2 sob H0H_0 (para grupos balanceados, ni=nn_i = n).

    Show solution
    Sob H0H_0, YˉiYˉN(0,σ2(1/ni1/N))\bar Y_i - \bar Y \sim \mathcal N(0, \sigma^2(1/n_i - 1/N)) aproximadamente. E[SSB]=E[ni(YˉiYˉ)2]E[SSB] = E[\sum n_i (\bar Y_i - \bar Y)^2]. Calculando via E[X2]=Var(X)+(E[X])2E[X^2] = \text{Var}(X) + (E[X])^2 com E[YˉiYˉ]=0E[\bar Y_i - \bar Y] = 0 sob H0H_0: E[SSB]=(k1)σ2E[SSB] = (k-1)\sigma^2, portanto E[MSB]=σ2E[MS_B] = \sigma^2. ∎
  41. Ex. 107.41Proof

    Derive a estatística do teste de Kruskal-Wallis e explique por que ela é o análogo não-paramétrico da ANOVA one-way.

    Show solution
    Kruskal-Wallis: ranqueia todas as NN observações conjuntamente, calcula soma de ranks por grupo RiR_i, e computa H=12N(N+1)iRi2ni3(N+1)H = \frac{12}{N(N+1)} \sum_i \frac{R_i^2}{n_i} - 3(N+1). Sob H0H_0, Hχk12H \sim \chi^2_{k-1}. Não assume normalidade — adequado quando a suposição falha. Perde poder se a normalidade de fato vale (comparado à ANOVA).
  42. Ex. 107.42Proof

    Derive a estatística FF^* da Welch's ANOVA para variâncias desiguais. Explique como os graus de liberdade do denominador são ajustados.

    Show solution
    A Welch's ANOVA não assume σi2=σ2\sigma_i^2 = \sigma^2. Define pesos wi=ni/si2w_i = n_i/s_i^2, média ponderada Yˉ=wiYˉi/W\bar Y^* = \sum w_i \bar Y_i / W, e statística F=wi(YˉiYˉ)2/(k1)1+2(k2)k21(1wi/W)2/(ni1)F^* = \frac{\sum w_i(\bar Y_i - \bar Y^*)^2/(k-1)}{1 + \frac{2(k-2)}{k^2-1} \sum (1 - w_i/W)^2/(n_i-1)}. O denominador corrige os graus de liberdade do denominador (fórmula de Welch-Satterthwaite generalizada). Sob H0H_0, FF^* aproxima Fk1,dfWF_{k-1, df_W^*} com dfWdf_W^* fracionário.

Fontes

  • OpenStax — Statistics — Illowsky, Dean · CC-BY 4.0 · §13.1–13.4. Fonte primária desta lição. Definição do modelo, estatística F, tabela ANOVA, exercícios aplicados.

  • OpenIntro Statistics (4.ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA 3.0 · §7.5. Suposições do modelo, homocedasticidade, post-hoc de Tukey e Bonferroni.

  • Learning Statistics with R — Navarro · CC-BY-SA 4.0 · cap. 14. Intuição geométrica para F, tamanho de efeito η2\eta^2, Welch's ANOVA, ANOVA bayesiana.

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.