Math ClubMath Club
v1 · padrão canônico

Lição 104 — Teste z e teste t de Student

Teste z para média com sigma conhecido. Teste t de Student: uma amostra, duas amostras independentes (Welch e pooled), e pareado. Condições de aplicação e escolha do teste adequado.

Used in: 3.º ano do EM (17-18 anos) · Equiv. Stochastik LK alemão · Equiv. Math B japonês · H2 Statistics singapurense

T=Xˉμ0s/ntn1(uma amostra, σ desconhecido)T = \frac{\bar X - \mu_0}{s/\sqrt{n}} \sim t_{n-1} \quad \text{(uma amostra, } \sigma \text{ desconhecido)}

O teste t de Student substitui o desvio padrão populacional desconhecido pelo desvio amostral ss, pagando o preço com caudas mais pesadas (distribuição tn1t_{n-1}). Para duas amostras independentes, usa-se Welch (variâncias diferentes) ou pooled (variâncias iguais). Para pares, opera-se sobre as diferenças.

Choose your door

Rigorous notation, full derivation, hypotheses

Definição rigorosa

Teste z — sigma conhecido

Teste t — uma amostra

"A distribuição t de Student é apropriada quando usamos o desvio padrão amostral ss em lugar de σ\sigma. As caudas mais pesadas refletem a incerteza adicional de estimar σ\sigma." — OpenIntro Statistics, §5.3

Teste t — duas amostras independentes

Teste t pareado

sigmaconhecido?SimTeste zNaoUmaou duas amostras?Umat (n-1 gl)uma amostraDuasParesdependentes?Simt pareadoNao (independentes)Welch t

Árvore de decisão para escolha do teste. Use Welch por padrão para duas amostras independentes.

Exemplos resolvidos

Exercise list

20 exercises · 5 with worked solution (25%)

Application 12Understanding 3Modeling 3Challenge 1Proof 1
  1. Ex. 104.1Application

    H0:μ=20H_0: \mu = 20, H1:μ20H_1: \mu \neq 20. Dados: n=16n = 16, Xˉ=22\bar X = 22, s=5s = 5. Estatística t e conclusão com α=0,05\alpha = 0{,}05.

    Show solution
    T=(2220)/(5/16)=2/1,25=1,60T = (22 - 20)/(5/\sqrt{16}) = 2/1{,}25 = 1{,}60. Valor crítico bilateral: t0,025,15=2,131t_{0{,}025,\,15} = 2{,}131. Como 1,60<2,1311{,}60 < 2{,}131, não rejeitamos H0H_0. p-valor 0,130\approx 0{,}130.
  2. Ex. 104.2Application

    H0:μ=50H_0: \mu = 50, H1:μ<50H_1: \mu < 50. Dados: n=36n = 36, Xˉ=48\bar X = 48, s=8s = 8. Calcule TT e o p-valor. Conclusão com α=0,05\alpha = 0{,}05.

    Show solution
    T=(4850)/(8/36)=2/1,333=1,50T = (48 - 50)/(8/\sqrt{36}) = -2/1{,}333 = -1{,}50. Unilateral à esquerda: p=P(t35<1,50)0,071p = P(t_{35} < -1{,}50) \approx 0{,}071. Como p>0,05p > 0{,}05, não rejeitamos H0H_0.
  3. Ex. 104.3Application

    Pressão arterial de 10 pacientes antes e depois de dieta. Diferenças: 2, 3, 1, 4, 2, 3, 1, 2, 3, 1 mmHg. H0:μD=0H_0: \mu_D = 0, H1:μD>0H_1: \mu_D > 0. Ao nível 5%, a dieta reduziu a pressão?

    Show solution
    Dˉ=2,2\bar D = 2{,}2, sD=1,033s_D = 1{,}033. T=6,73>1,833T = 6{,}73 > 1{,}833. Rejeitamos H0H_0: melhora significativa após intervenção.
    Show step-by-step (with the why)
    1. Diferenças Di=poˊspreˊD_i = \text{pós} - \text{pré}: 2, 3, 1, 4, 2, 3, 1, 2, 3, 1.
    2. Dˉ=(2+3+1+4+2+3+1+2+3+1)/10=22/10=2,2\bar D = (2+3+1+4+2+3+1+2+3+1)/10 = 22/10 = 2{,}2.
    3. Di2=4+9+1+16+4+9+1+4+9+1=58\sum D_i^2 = 4+9+1+16+4+9+1+4+9+1 = 58. sD2=(5810×4,84)/9=(5848,4)/9=1,067s_D^2 = (58 - 10 \times 4{,}84)/9 = (58-48{,}4)/9 = 1{,}067. sD=1,033s_D = 1{,}033.
    4. T=2,2/(1,033/10)=2,2/0,327=6,73T = 2{,}2/(1{,}033/\sqrt{10}) = 2{,}2/0{,}327 = 6{,}73.
    5. Valor crítico: t0,05,9=1,833t_{0{,}05,\,9} = 1{,}833. Como 6,73>1,8336{,}73 > 1{,}833, rejeitamos H0H_0.
    6. Macete: O teste pareado com 10 pares tem df=9df = 9, como um teste de uma amostra com n=10n = 10 — as diferenças são tratadas como dados únicos.
  4. Ex. 104.4Application

    Grupo A: n1=30n_1 = 30, Xˉ1=85\bar X_1 = 85, s1=4s_1 = 4. Grupo B: n2=25n_2 = 25, Xˉ2=80\bar X_2 = 80, s2=3s_2 = 3. Welch t bilateral ao nível 5%.

    Show solution
    SE=16/30+9/25=0,533+0,360=0,893=0,945\mathrm{SE} = \sqrt{16/30 + 9/25} = \sqrt{0{,}533 + 0{,}360} = \sqrt{0{,}893} = 0{,}945. TW=(8580)/0,945=5,291T_W = (85 - 80)/0{,}945 = 5{,}291. ν49\nu \approx 49. Valor crítico bilateral: t0,025,492,010t_{0{,}025,\,49} \approx 2{,}010. Como 5,291>2,0105{,}291 > 2{,}010, rejeitamos H0H_0. As notas diferem significativamente.
  5. Ex. 104.5Understanding

    Você quer comparar salários médios entre dois departamentos de uma empresa, com variâncias possivelmente diferentes. Qual a melhor estratégia?

    Select the correct option
    Select an option first
    Show solution
    O Welch t é recomendado por padrão porque: (1) é robusto quando as variâncias diferem; (2) perde muito pouco poder quando as variâncias são iguais. O pré-teste F de igualdade de variâncias não é recomendado pois introduz erro adicional no controle do nível global.
  6. Ex. 104.6Application

    QI médio da população: μ0=100\mu_0 = 100, σ=15\sigma = 15 (conhecido). Uma turma de n=64n = 64 tem Xˉ=102\bar X = 102. Ao nível 5%, a turma tem QI médio diferente da população?

    Show solution
    Z=(Xˉμ0)/(σ/n)=(102100)/(15/64)=2/1,875=1,067Z = (\bar X - \mu_0)/(\sigma/\sqrt{n}) = (102 - 100)/(15/\sqrt{64}) = 2/1{,}875 = 1{,}067. p-valor bilateral: 2×P(Z>1,067)=2×0,143=0,2862 \times P(Z > 1{,}067) = 2 \times 0{,}143 = 0{,}286. Não rejeitamos H0H_0: sem evidência de que a turma difere da população.
  7. Ex. 104.7ApplicationAnswer key

    Tempo de reação (ms) de 10 motoristas antes e depois de uma xícara de café. Diferenças: 2, -1, 3, 1, 2, 0, 1, 2, -1, 2. Ao nível 5%, o café alterou o tempo de reação?

    Show solution
    Diferenças: 2, -1, 3, 1, 2, 0, 1, 2, -1, 2. Dˉ=11/10=1,1\bar D = 11/10 = 1{,}1. sD2=(Di210×1,21)/9=(2812,1)/9=1,767s_D^2 = (\sum D_i^2 - 10 \times 1{,}21)/9 = (28 - 12{,}1)/9 = 1{,}767. sD=1,329s_D = 1{,}329. T=1,1/(1,329/10)=1,1/0,420=2,618T = 1{,}1/(1{,}329/\sqrt{10}) = 1{,}1/0{,}420 = 2{,}618. t0,025,9=2,262t_{0{,}025,\,9} = 2{,}262. Como 2,618>2,2622{,}618 > 2{,}262, rejeitamos H0H_0.
  8. Ex. 104.8ApplicationAnswer key

    Grupo 1: n1=15n_1 = 15, Xˉ1=75\bar X_1 = 75, s1=10s_1 = 10. Grupo 2: n2=20n_2 = 20, Xˉ2=70\bar X_2 = 70, s2=9s_2 = 9. Use pooled t bilateral ao nível 5% (assumindo variâncias iguais).

    Show solution
    sp2=(14×100+19×81)/(15+202)=(1400+1539)/33=2939/33=89,06s_p^2 = (14 \times 100 + 19 \times 81)/(15+20-2) = (1400+1539)/33 = 2939/33 = 89{,}06. sp=9,437s_p = 9{,}437. TP=(7570)/(9,437×1/15+1/20)=5/(9,437×0,2582)=5/2,437=2,052T_P = (75-70)/(9{,}437 \times \sqrt{1/15+1/20}) = 5/(9{,}437 \times 0{,}2582) = 5/2{,}437 = 2{,}052. df=33df = 33. Valor crítico: t0,025,332,035t_{0{,}025,\,33} \approx 2{,}035. Rejeitamos H0H_0 marginalmente.
  9. Ex. 104.9UnderstandingAnswer key

    Um médico mede a pressão de 20 pacientes antes e depois de um tratamento. Qual teste é mais adequado?

    Select the correct option
    Select an option first
    Show solution
    Os mesmos pacientes são medidos em dois momentos — as observações são dependentes (um paciente com pressão alta antes tende a ter pressão alta depois). O teste pareado é mais poderoso porque elimina a variabilidade entre pacientes, focando na variabilidade das diferenças.
  10. Ex. 104.10Application

    Horas de estudo de n=20n = 20 universitários: Xˉ=4,5\bar X = 4{,}5 h/dia, s=1,2s = 1{,}2 h. H0:μ=5H_0: \mu = 5. Bilateral ao nível 5%.

    Show solution
    T=1,863T = -1{,}863. p-valor 0,078>0,05\approx 0{,}078 > 0{,}05. Não rejeitamos H0H_0: evidência insuficiente de que o sono difere de 5 h.
    Show step-by-step (with the why)
    1. Hipóteses: H0:μ=5H_0: \mu = 5 h, H1:μ5H_1: \mu \neq 5 h. α=0,05\alpha = 0{,}05.
    2. Estatística: T=(4,55)/(1,2/20)=0,5/0,268=1,863T = (4{,}5 - 5)/(1{,}2/\sqrt{20}) = -0{,}5/0{,}268 = -1{,}863.
    3. Valor crítico: t0,025,19=2,093t_{0{,}025,\,19} = 2{,}093. Como 1,863=1,863<2,093|-1{,}863| = 1{,}863 < 2{,}093, não rejeitamos H0H_0.
    4. p-valor: 2×P(t19<1,863)2×0,039=0,0782 \times P(t_{19} < -1{,}863) \approx 2 \times 0{,}039 = 0{,}078. Coerente.
    5. Observação: O resultado está próximo da fronteira. Com n=40n = 40, o mesmo efeito daria T=2,635T = -2{,}635 e p0,012p \approx 0{,}012 — a diferença entre "não significativo" e "significativo" frequentemente é tamanho amostral.
  11. Ex. 104.11Application

    Moeda jogada 100 vezes: 52 caras. Ao nível 5%, a moeda é justa? (Use teste z para proporção com σp^=p0(1p0)/n\sigma_{\hat p} = \sqrt{p_0(1-p_0)/n}.)

    Show solution
    Z=(0,520,50)/0,50×0,50/100=0,02/0,05=0,40Z = (0{,}52 - 0{,}50)/\sqrt{0{,}50 \times 0{,}50/100} = 0{,}02/0{,}05 = 0{,}40. p-valor bilateral: 2×P(Z>0,40)=2×0,345=0,6892 \times P(Z > 0{,}40) = 2 \times 0{,}345 = 0{,}689. Não rejeitamos H0H_0. Os dados são consistentes com a moeda justa.
  12. Ex. 104.12Application

    Turmas A e B: n1=20n_1 = 20, Xˉ1=45\bar X_1 = 45, s1=7s_1 = 7; n2=30n_2 = 30, Xˉ2=40\bar X_2 = 40, s2=10s_2 = 10. Welch t ao nível 5%.

    Show solution
    SE=49/20+100/30=2,45+3,333=5,783=2,405\mathrm{SE} = \sqrt{49/20 + 100/30} = \sqrt{2{,}45 + 3{,}333} = \sqrt{5{,}783} = 2{,}405. TW=(4540)/2,405=5/2,405=2,079T_W = (45-40)/2{,}405 = 5/2{,}405 = 2{,}079. ν44\nu \approx 44. t0,025,442,015t_{0{,}025,\,44} \approx 2{,}015. Rejeitamos H0H_0: as médias diferem.
  13. Ex. 104.13Understanding

    Qual a relação entre o teste z e o teste t para amostras grandes?

    Select the correct option
    Select an option first
    Show solution
    Para nn grande, tn1N(0,1)t_{n-1} \to \mathcal{N}(0,1). Os quantis convergem: t0,025,=z0,025=1,960t_{0{,}025,\,\infty} = z_{0{,}025} = 1{,}960. Para n=120n = 120, t0,025,119=1,980t_{0{,}025,\,119} = 1{,}980 — diferença de 1%. Ambos os testes exigem dados aproximadamente normais ou nn grande pelo TCL.
  14. Ex. 104.14ApplicationAnswer key

    Velocidade de digitação (wpm) de 10 alunos antes e depois de curso: antes [40, 35, 50, 45, 38, 42, 47, 36, 44, 41], depois [45, 38, 57, 47, 42, 48, 48, 39, 49, 45]. Ao nível 5%, o curso melhorou a velocidade?

    Show solution
    Diferenças (pós-pré): 5, 3, 7, 2, 4, 6, 1, 3, 5, 4. Dˉ=40/10=4,0\bar D = 40/10 = 4{,}0. sD2=(Di210×16)/9s_D^2 = (\sum D_i^2 - 10 \times 16)/9. Di2=25+9+49+4+16+36+1+9+25+16=190\sum D_i^2 = 25+9+49+4+16+36+1+9+25+16 = 190. sD2=(190160)/9=3,333s_D^2 = (190-160)/9 = 3{,}333. sD=1,826s_D = 1{,}826. T=4,0/(1,826/10)=4,0/0,577=6,93T = 4{,}0/(1{,}826/\sqrt{10}) = 4{,}0/0{,}577 = 6{,}93. t0,05,9=1,833t_{0{,}05,\,9} = 1{,}833. Rejeitamos H0H_0.
  15. Ex. 104.15ApplicationAnswer key

    Uma linha de produção deve encher frascos com 200 mL. Amostra de n=25n = 25: Xˉ=198\bar X = 198 mL, s=12s = 12 mL. Ao nível 5%, o processo está desregulado?

    Show solution
    T=(198200)/(12/25)=2/2,4=0,833T = (198 - 200)/(12/\sqrt{25}) = -2/2{,}4 = -0{,}833. Bilateral, df=24df = 24: p-valor =2×P(t24<0,833)0,413= 2 \times P(t_{24} < -0{,}833) \approx 0{,}413. Não rejeitamos H0H_0. Processo está sob controle.
  16. Ex. 104.16Modeling

    Uma escola aplicou programa de reforço em Matemática. Pontuação de 10 alunos no SAEB antes: [60, 55, 70, 65, 58, 62, 67, 56, 64, 61]. Depois: [75, 63, 82, 85, 63, 72, 85, 63, 76, 74]. Use o teste adequado ao nível 5%.

    Show solution
    Pareado: os alunos são os mesmos, medidos antes e depois. Diferenças: 15, 8, 12, 20, 5, 10, 18, 7, 12, 13. Dˉ=120/10=12,0\bar D = 120/10 = 12{,}0. sD2=(Di210×144)/9s_D^2 = (\sum D_i^2 - 10 \times 144)/9. Di2=225+64+144+400+25+100+324+49+144+169=1644\sum D_i^2 = 225+64+144+400+25+100+324+49+144+169 = 1644. sD2=(16441440)/9=22,67s_D^2 = (1644-1440)/9 = 22{,}67. sD=4,76s_D = 4{,}76. T=12/(4,76/10)=12/1,506=7,97T = 12/(4{,}76/\sqrt{10}) = 12/1{,}506 = 7{,}97. Rejeitamos H0H_0.
  17. Ex. 104.17Modeling

    Uma rede de escolas testou uma nova metodologia de ensino. Escola controle (n1=50n_1 = 50): Xˉ1=505\bar X_1 = 505 pontos, s1=20s_1 = 20. Escola piloto (n2=60n_2 = 60): Xˉ2=520\bar X_2 = 520, s2=25s_2 = 25. Ao nível 1%, a metodologia melhorou os resultados? Calcule também o tamanho de efeito.

    Show solution
    Comparação de dois grupos independentes. Welch t: SE=400/50+625/60=8+10,417=18,417=4,291\mathrm{SE} = \sqrt{400/50 + 625/60} = \sqrt{8 + 10{,}417} = \sqrt{18{,}417} = 4{,}291. TW=(520505)/4,291=15/4,291=3,496T_W = (520 - 505)/4{,}291 = 15/4{,}291 = 3{,}496. ν104\nu \approx 104. p-valor 0,0007\approx 0{,}0007. Rejeitamos H0H_0: a nova metodologia aparenta melhorar o desempenho. Tamanho de efeito d=15/(400+625)/2=15/22,6=0,66d = 15/\sqrt{(400+625)/2} = 15/22{,}6 = 0{,}66 — efeito médio.
  18. Ex. 104.18Modeling

    Temperatura de um processo industrial: μ0=30\mu_0 = 30°C, σ=8\sigma = 8°C. Calcule o teste z bilateral para Xˉ=31\bar X = 31°C com n=100n = 100 e depois com n=10000n = 10000. Compare os p-valores e discuta a diferença entre significância estatística e prática.

    Show solution
    Teste z bilateral: Z=(3130)/(8/100)=1/0,8=1,25Z = (31 - 30)/(8/\sqrt{100}) = 1/0{,}8 = 1{,}25. p-valor =0,211= 0{,}211. Não rejeitamos H0H_0. Mas com n=10000n = 10000: Z=(3130)/(8/10000)=1/0,08=12,5Z = (31 - 30)/(8/\sqrt{10000}) = 1/0{,}08 = 12{,}5. p-valor 0\approx 0. Rejeita com certeza. A mesma diferença de 1°C passa a ser "altamente significativa" — mas a relevância prática depende se 1°C importa para o processo.
  19. Ex. 104.19Challenge

    Mostre algebricamente que o teste pareado tem menor erro padrão que o Welch t (para o mesmo nn por grupo), quando a correlação ρ\rho entre pares é positiva. Quanto menor é o erro padrão para ρ=0,7\rho = 0{,}7 e s1=s2s_1 = s_2?

    Show solution
    Para o pareado: SED=sD/n\mathrm{SE}_D = s_D/\sqrt{n}, onde sD2=s12+s222ρs1s2s_D^2 = s_1^2 + s_2^2 - 2\rho s_1 s_2. Para o Welch independente: SEW=s12/n+s22/n=(s12+s22)/n\mathrm{SE}_W = \sqrt{s_1^2/n + s_2^2/n} = \sqrt{(s_1^2 + s_2^2)/n}. Razão: SED/SEW=12ρs1s2/(s12+s22)\mathrm{SE}_D/\mathrm{SE}_W = \sqrt{1 - 2\rho s_1 s_2/(s_1^2 + s_2^2)}. Para ρ>0\rho > 0, a razão é menor que 1: o pareado tem erro padrão menor e portanto maior poder. Para s1=s2=ss_1 = s_2 = s: SED/SEW=1ρ\mathrm{SE}_D/\mathrm{SE}_W = \sqrt{1 - \rho}. Com ρ=0,7\rho = 0{,}7: redução de 45% no SE.
  20. Ex. 104.20Proof

    Derive a fórmula de Welch-Satterthwaite para os graus de liberdade efetivos ν\nu do teste de Welch. Verifique que para n1=n2n_1 = n_2 e s1=s2s_1 = s_2, a fórmula reduz a ν=2(n1)\nu = 2(n-1), coincidindo com o pooled t.

    Show solution
    Derivação da fórmula de Welch-Satterthwaite: seja W=s12/n1+s22/n2W = s_1^2/n_1 + s_2^2/n_2. Cada componente (nk1)sk2/σk2χnk12(n_k-1)s_k^2/\sigma_k^2 \sim \chi^2_{n_k-1}. A distribuição de WW não é qui-quadrado exata quando σ1σ2\sigma_1 \neq \sigma_2. A aproximação de Satterthwaite iguala os dois primeiros momentos de WW a uma distribuição qui-quadrado escalonada: ν=W2/[(s12/n1)2/(n11)+(s22/n2)2/(n21)]\nu = W^2/[(s_1^2/n_1)^2/(n_1-1) + (s_2^2/n_2)^2/(n_2-1)]. Para n1=n2=nn_1 = n_2 = n e s1=s2s_1 = s_2: ν=(2s2/n)2/(2(s2/n)2/(n1))=2(n1)\nu = (2s^2/n)^2/(2(s^2/n)^2/(n-1)) = 2(n-1), recuperando o resultado do pooled t.

Fontes

  • OpenIntro Statistics (4ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA. Seções §5.3–5.4 (teste t de uma amostra, Welch, pareado; condições de aplicação).
  • Statistics (OpenStax) — Illowsky, Dean · CC-BY. Seções §9.5–9.6 e §10.1–10.4 (testes z e t, duas amostras independentes e pareadas).
  • Statistical Thinking for the 21st Century — Russell Poldrack · CC-BY-NC. Capítulo 12 (testes de comparação de grupos, simulação, perspectiva moderna).

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.