Math ClubMath Club
v1 · padrão canônico

Lição 80 — Consolidação Trim 8 — Estatística e probabilidade aplicada

Workshop integrador: medidas centrais, variância, quartis, v.a. discreta, binomial, normal, TCL, correlação e Bayes em problemas reais brasileiros.

Used in: 2.º ano do EM (16-17 anos) · Equiv. Stochastik LK alemão · Equiv. Math B japonês · Equiv. H2 Maths Statistics (Singapura)

Dadosdescreverμ^,σ^modelarP(X)inferirP(HE)\text{Dados} \xrightarrow{\text{descrever}} \hat\mu,\,\hat\sigma \xrightarrow{\text{modelar}} P(X) \xrightarrow{\text{inferir}} P(H \mid E)

O pipeline completo do trimestre: resumir dados com μ^\hat\mu e σ^\hat\sigma, escolher um modelo probabilístico (binomial, normal), e atualizar crenças via regra de Bayes P(HE)P(H\mid E). Cada seta é uma aula; esta lição tece as flechas em cadeia.

Choose your door

Rigorous notation, full derivation, hypotheses

Síntese formal do trimestre

Estatística descritiva

"A variância é a média dos quadrados dos desvios em relação à média. Para uma amostra, divide-se por n1n-1 (correção de Bessel) em vez de nn." — OpenIntro Statistics §2.1

Variável aleatória discreta

"A esperança é uma média ponderada dos possíveis valores de XX, ponderada pelas probabilidades." — Grinstead & Snell §6.1

Distribuições paramétricas

Teorema Central do Limite

"O TCL é indiscutivelmente o resultado mais importante de toda a teoria de probabilidade. Afirma que a distribuição da média amostral se aproxima da normal independentemente da distribuição original de XX." — OpenIntro Statistics §4.4

Correlação e regressão

Regra de Bayes

DadosamostraEDADescritivaμ, σ, Q, rmodeloProbabilidadeP(X), TCLBayesInferênciaP(H|E), decisão

Pipeline do Trim 8. Cada bloco corresponde a um grupo de aulas (72–73, 74–76, 77, 78–79).

Exemplos resolvidos

Exercise list

37 exercises · 9 with worked solution (25%)

Application 10Understanding 4Modeling 13Challenge 5Proof 5
  1. Ex. 80.1ApplicationAnswer key

    Amostra: 4, 6, 8, 8, 9, 10, 10, 11, 12, 22. Calcule mediana, Q1Q_1, Q3Q_3, IQR e identifique outliers pela cerca de Tukey.

    Show solution
    Dados ordenados: 4, 6, 8, 8, 9, 10, 10, 11, 12, 22. Mediana = (9+10)/2=9,5(9+10)/2 = 9{,}5. Q1Q_1 = mediana dos 5 primeiros = 8. Q3Q_3 = mediana dos 5 últimos = 11. IQR=3\text{IQR} = 3. Cerca superior: 11+1,5×3=15,511 + 1{,}5\times3 = 15{,}5. Outlier: 22 (acima de 15,5).
    Show step-by-step (with the why)
    1. Ordene a amostra: 4, 6, 8, 8, 9, 10, 10, 11, 12, 22. Com 10 valores, a mediana está entre as posições 5 e 6: (9+10)/2=9,5(9+10)/2 = 9{,}5.
    2. Metade inferior (posições 1–5): 4, 6, 8, 8, 9 — mediana = 8 = Q1Q_1. Metade superior (posições 6–10): 10, 10, 11, 12, 22 — mediana = 11 = Q3Q_3.
    3. IQR = Q3Q1=118=3Q_3 - Q_1 = 11 - 8 = 3. Cercas: inferior = 81,5×3=3,58 - 1{,}5\times3 = 3{,}5, superior = 11+1,5×3=15,511 + 1{,}5\times3 = 15{,}5.
    4. Verifique cada valor: 4 está acima de 3,5 (dentro). 22 está acima de 15,5 (outlier).
    Macete: Para nn par, Q1Q_1 e Q3Q_3 são as medianas das duas metades excluindo a mediana central — ou incluindo, dependendo da convenção. OpenIntro usa "mediana dos n/2n/2 primeiros".
  2. Ex. 80.2Application

    Mesma amostra do exercício 80.1. Calcule a média e o desvio padrão amostral. Compare com a mediana: qual é mais representativa da posição central? Por quê?

    Show solution
    Média = (4+6+8+8+9+10+10+11+12+22)/10=100/10=10(4+6+8+8+9+10+10+11+12+22)/10 = 100/10 = 10. Variância amostral: soma dos quadrados dos desvios dividida por 9. s2=[(6)2+(4)2+(2)2+(2)2+(1)2+02+02+12+22+122]/9=(36+16+4+4+1+0+0+1+4+144)/9=210/923,3s^2 = [(−6)^2+(−4)^2+(−2)^2+(−2)^2+(−1)^2+0^2+0^2+1^2+2^2+12^2]/9 = (36+16+4+4+1+0+0+1+4+144)/9 = 210/9 \approx 23{,}3. Desvio: s4,83s \approx 4{,}83. Comparação: a média (10) subiu pela presença do 22; a mediana (9,5) é mais representativa.
  3. Ex. 80.3Application

    XBin(20,0,3)X \sim \text{Bin}(20,\, 0{,}3). Calcule E[X]E[X], Var(X)\text{Var}(X) e σ\sigma.

    Show solution
    XBin(20,0,3)X \sim \text{Bin}(20, 0{,}3). E[X]=np=20×0,3=6E[X] = np = 20\times0{,}3 = 6. Var(X)=np(1p)=20×0,3×0,7=4,2\text{Var}(X) = np(1-p) = 20\times0{,}3\times0{,}7 = 4{,}2. Espera, recalculando: 4,24{,}2, não 4,8. Desvio padrão: σ=4,22,05\sigma = \sqrt{4{,}2} \approx 2{,}05.
  4. Ex. 80.4Application

    Para XBin(20,0,3)X \sim \text{Bin}(20,\, 0{,}3): verifique o critério de aproximação normal e, mesmo que limítrofe, use a aproximação com correção de continuidade para estimar P(X10)P(X \geq 10).

    Show solution
    Critério: np=6np = 6 e n(1p)=14n(1-p) = 14. O critério np10np \geq 10 não é satisfeito (np = 6), então a aproximação normal é grosseira aqui. Para exercitar: μ=6\mu = 6, σ=4,22,05\sigma = \sqrt{4{,}2} \approx 2{,}05. Com correção de continuidade: P(X10)P(Z(9,56)/2,05)=P(Z1,71)4,4%P(X \geq 10) \approx P(Z \geq (9{,}5-6)/2{,}05) = P(Z \geq 1{,}71) \approx 4{,}4\%.
  5. Ex. 80.5Application

    XN(50,100)X \sim \mathcal{N}(50,\, 100). Calcule P(X>65)P(X > 65).

    Show solution
    XN(50,100)X \sim \mathcal{N}(50, 100), então σ=10\sigma = 10. Z=(6550)/10=1,5Z = (65-50)/10 = 1{,}5. P(X>65)=P(Z>1,5)=1Φ(1,5)10,9332=0,06686,7%P(X > 65) = P(Z > 1{,}5) = 1 - \Phi(1{,}5) \approx 1 - 0{,}9332 = 0{,}0668 \approx 6{,}7\%.
  6. Ex. 80.6Application

    Amostra n=100n = 100 de população com μ=10\mu = 10, σ=3\sigma = 3. Calcule P(Xˉ>10,3)P(\bar X > 10{,}3).

    Show solution
    Pelo TCL, XˉN(10,  9/100)=N(10,  0,09)\bar X \sim \mathcal{N}(10,\; 9/100) = \mathcal{N}(10,\; 0{,}09). Erro padrão: σXˉ=3/100=0,3\sigma_{\bar X} = 3/\sqrt{100} = 0{,}3. P(Xˉ>10,3)=P(Z>(10,310)/0,3)=P(Z>1,0)=1Φ(1)15,9%P(\bar X > 10{,}3) = P(Z > (10{,}3-10)/0{,}3) = P(Z > 1{,}0) = 1 - \Phi(1) \approx 15{,}9\%.
    Show step-by-step (with the why)
    1. Identifique os parâmetros: μ=10\mu = 10, σ=3\sigma = 3, n=100n = 100.
    2. Pelo TCL, a média amostral tem distribuição: XˉN(μ,  σ2/n)=N(10,  9/100)\bar X \sim \mathcal{N}(\mu,\; \sigma^2/n) = \mathcal{N}(10,\; 9/100).
    3. Calcule o erro padrão: σXˉ=σ/n=3/10=0,3\sigma_{\bar X} = \sigma/\sqrt{n} = 3/10 = 0{,}3.
    4. Padronize: Z=(10,310)/0,3=1,0Z = (10{,}3 - 10)/0{,}3 = 1{,}0. Consulte tabela: P(Z>1)15,9%P(Z > 1) \approx 15{,}9\%.
    Macete: O erro padrão diminui com n\sqrt{n}. Quadruplicar a amostra dimideia o erro padrão.
  7. Ex. 80.7Application

    Pares (x,y)(x, y): (1, 2), (2, 4), (3, 5), (4, 4), (5, 7). Calcule o coeficiente de correlação de Pearson rr e a reta de regressão y^=b0+b1x\hat y = b_0 + b_1 x.

    Show solution
    Dados: (1,2),(2,4),(3,5),(4,4),(5,7)(1,2),(2,4),(3,5),(4,4),(5,7). xˉ=3\bar x = 3, yˉ=4,4\bar y = 4{,}4. (xixˉ)(yiyˉ)=(2)(2,4)+(1)(0,4)+(0)(0,6)+(1)(0,4)+(2)(2,6)=4,8+0,4+00,4+5,2=10\sum(x_i-\bar x)(y_i-\bar y) = (-2)(-2{,}4)+(-1)(-0{,}4)+(0)(0{,}6)+(1)(-0{,}4)+(2)(2{,}6) = 4{,}8+0{,}4+0-0{,}4+5{,}2 = 10. (xixˉ)2=4+1+0+1+4=10\sum(x_i-\bar x)^2 = 4+1+0+1+4 = 10. (yiyˉ)2=5,76+0,16+0,36+0,16+6,76=13,2\sum(y_i-\bar y)^2 = 5{,}76+0{,}16+0{,}36+0{,}16+6{,}76 = 13{,}2. r=10/10×13,2=10/13210/11,490,870r = 10/\sqrt{10 \times 13{,}2} = 10/\sqrt{132} \approx 10/11{,}49 \approx 0{,}870. Reta: b1=rsy/sx=0,87×13,2/4/10/4=1,0b_1 = r\cdot s_y/s_x = 0{,}87\times\sqrt{13{,}2/4}/\sqrt{10/4} = 1{,}0; b0=4,41×3=1,4b_0 = 4{,}4 - 1\times3 = 1{,}4. Logo y^=1,4+x\hat y = 1{,}4 + x.
  8. Ex. 80.8Application

    Doença com prevalência 2%, teste com sensibilidade 90% e especificidade 95%. Calcule o Valor Preditivo Positivo (VPP).

    Show solution
    Prevalência 2%: P(D)=0,02P(D) = 0{,}02. Sens = 90%: P(+D)=0,90P(+|D) = 0{,}90. Espec = 95%: P(Dc)=0,95P(-|D^c) = 0{,}95, então P(+Dc)=0,05P(+|D^c) = 0{,}05. P(+)=0,9×0,02+0,05×0,98=0,018+0,049=0,067P(+) = 0{,}9\times0{,}02 + 0{,}05\times0{,}98 = 0{,}018 + 0{,}049 = 0{,}067. VPP=P(D+)=0,018/0,0670,26826,8%\text{VPP} = P(D|+) = 0{,}018/0{,}067 \approx 0{,}268 \approx 26{,}8\%.
  9. Ex. 80.9Application

    Y=2X+5Y = 2X + 5 onde XN(10,4)X \sim \mathcal{N}(10,\, 4). Determine a distribuição de YY.

    Show solution
    XN(10,4)X \sim \mathcal{N}(10, 4). Transformação linear: E[Y]=2×10+5=25E[Y] = 2\times10 + 5 = 25. Var(Y)=22×4=16\text{Var}(Y) = 2^2 \times 4 = 16 (constante não altera variância). Logo YN(25,16)Y \sim \mathcal{N}(25, 16).
  10. Ex. 80.10ApplicationAnswer key

    Lança-se um dado honesto 50 vezes. Calcule a esperança e o desvio padrão da soma S=X1++X50S = X_1 + \cdots + X_{50}.

    Show solution
    Para um dado honesto: E[X]=3,5E[X] = 3{,}5, Var(X)=35/122,917\text{Var}(X) = 35/12 \approx 2{,}917. Soma de 50 dados independentes S=X1++X50S = X_1+\ldots+X_{50}: E[S]=50×3,5=175E[S] = 50\times3{,}5 = 175; Var(S)=50×35/12145,83\text{Var}(S) = 50\times35/12 \approx 145{,}83; σS=145,8312,08\sigma_S = \sqrt{145{,}83} \approx 12{,}08. Pelo TCL, SN(175,  145,83)S \approx \mathcal{N}(175,\; 145{,}83).
  11. Ex. 80.11Understanding

    Qual das afirmações sobre medidas de dispersão é correta?

    Select the correct option
    Select an option first
    Show solution
    IQR depende apenas dos quartis, que são quantis robustos — um outlier extremo não muda Q1Q_1 ou Q3Q_3 desde que não invada a região central. O desvio padrão usa todos os desvios ao quadrado, então um único outlier muito grande pode inflá-lo enormemente. As outras alternativas: (A) é falso — em distribuições simétricas, média = mediana; (B) é falso — variância é sempre não-negativa (soma de quadrados); (D) é falso — medem conceitos distintos.
  12. Ex. 80.12UnderstandingAnswer key

    Qual das relações é verdadeira para as probabilidades pontuais das binomiais na moda?

    Select the correct option
    Select an option first
    Show solution
    Pelo TCL, à medida que nn aumenta, a binomial normalizada converge para a normal, e a probabilidade pontual de qualquer valor decresce (a distribuição "achata"). Calculando: P(Bin(10,0,5)=5)=(105)(0,5)10=252/10240,246P(\text{Bin}(10,0{,}5)=5) = \binom{10}{5}(0{,}5)^{10} = 252/1024 \approx 0{,}246. Para n=100n=100: (10050)(0,5)1000,0796\binom{100}{50}(0{,}5)^{100} \approx 0{,}0796 (pelo TCL: f(50)1/(52π)0,0798f(50) \approx 1/(5\sqrt{2\pi}) \approx 0{,}0798). Logo a probabilidade pontual cai com nn.
  13. Ex. 80.13Understanding

    Explique em suas palavras: o TCL afirma que, para nn grande, os dados individuais seguem distribuição normal? Se não, o que exatamente converge para normal?

    Show solution
    O TCL se refere à distribuição de Xˉ\bar X (média amostral), não de XX individual. Para qualquer distribuição com σ2<\sigma^2 < \infty, quando nn \to \infty, a distribuição de n(Xˉμ)/σ\sqrt{n}(\bar X - \mu)/\sigma converge para N(0,1)\mathcal{N}(0,1). Dados individuais continuam com a distribuição original. A velocidade de convergência depende da assimetria da distribuição original — para distribuições próximas da normal, até n=5n=5 já é suficiente; para Bernoulli(0,01), podem ser necessários n>1000n > 1000.
  14. Ex. 80.14UnderstandingAnswer key

    Qual afirmação sobre correlação de Pearson é correta?

    Select the correct option
    Select an option first
    Show solution
    O coeficiente de Pearson mede apenas a componente linear da associação. Exemplo clássico: Y=X2Y = X^2 com XX simétrico em torno de zero tem r=0r = 0, mas Y depende funcionalmente de X. As outras alternativas: (A) é falso — Pearson só detecta associação linear; (B) é falso — r=0r=0 não implica independência; (D) é falso — r=1r = 1 implica pontos na reta, mas o enunciado diz "o coeficiente é 1", não o inverso.
  15. Ex. 80.15Modeling

    Tempo de entrega de uma pizzaria: TN(32,52)T \sim \mathcal{N}(32,\, 5^2) min. Qual o prazo máximo que cobre 95% das entregas?

    Show solution
    Tempo de entrega TN(32,25)T \sim \mathcal{N}(32,25). Para cobertura de 95%: z0,95=1,645z_{0{,}95} = 1{,}645. Limite: 32+1,645×5=32+8,2=40,232 + 1{,}645 \times 5 = 32 + 8{,}2 = 40{,}2 min. Portanto, 95% das entregas chegam em até 40,2 min.
    Show step-by-step (with the why)
    1. Identifique: TN(32,52)T \sim \mathcal{N}(32, 5^2). Queremos tt^* tal que P(Tt)=0,95P(T \leq t^*) = 0{,}95.
    2. Padronize: P(Z(t32)/5)=0,95P(Z \leq (t^* - 32)/5) = 0{,}95. Da tabela normal: z0,951,645z_{0{,}95} \approx 1{,}645.
    3. Resolva: (t32)/5=1,645    t=32+5×1,645=40,2(t^* - 32)/5 = 1{,}645 \implies t^* = 32 + 5 \times 1{,}645 = 40{,}2 min.
    Observação: Este é o percentil 95 da distribuição. Em logística, é o SLA (Service Level Agreement) pra 95% dos pedidos.
  16. Ex. 80.16ModelingAnswer key

    Com o modelo do exercício 80.15 (SLA de 40,2 min, taxa de violação 5%), calcule a esperança do número de violações em 100 entregas.

    Show solution
    Cada entrega viola o SLA (tempo maior que 40,2 min) com probabilidade 5%. Em 100 entregas, o número de violações VBin(100,0,05)V \sim \text{Bin}(100, 0{,}05). E[V]=100×0,05=5E[V] = 100 \times 0{,}05 = 5.
  17. Ex. 80.17Modeling

    Mercado imobiliário: correlação entre área e preço é r=0,8r = 0{,}8. Médias xˉ=80m2\bar x = 80\,\text{m}^2, yˉ=450.000\bar y = 450.000 (R);desvios); desvios s_x = 20,, s_y = 80.000$. Encontre a reta de regressão e preveja o preço para um imóvel de área média.

    Show solution
    Dados hipotéticos de imobiliário: xˉ=80m2\bar x = 80\,\text{m}^2, yˉ=450000\bar y = 450\,000 reais, sx=20s_x = 20, sy=80000s_y = 80\,000, r=0,8r = 0{,}8. Inclinação: b1=0,8×80000/20=3200b_1 = 0{,}8 \times 80000/20 = 3200 reais por m². Intercepto: b0=4500003200×80=450000256000=194000b_0 = 450000 - 3200\times80 = 450000 - 256000 = 194000. Reta: p^=194000+3200area\hat p = 194000 + 3200 \cdot \text{area}. Para área média (80 m²): p^=450000\hat p = 450000 (trivialmente, pois a reta passa pelo ponto médio).
  18. Ex. 80.18Modeling

    Carteira financeira: 100 ações independentes, cada uma com retorno diário N(0,001,  0,022)\sim \mathcal{N}(0{,}001,\; 0{,}02^2). Determine a distribuição do retorno diário da carteira equal-weighted.

    Show solution
    Retornos diários de 100 ações independentes, cada um N(0,001,  0,022)\sim \mathcal{N}(0{,}001,\; 0{,}02^2). Retorno da carteira equal-weighted: R=(1/100)XiR = (1/100)\sum X_i. Pelo TCL: E[R]=0,001E[R] = 0{,}001; Var(R)=(0,02)2/100=4×106\text{Var}(R) = (0{,}02)^2/100 = 4\times10^{-6}; σR=0,002\sigma_R = 0{,}002. Logo RN(0,001,  4×106)R \sim \mathcal{N}(0{,}001,\; 4\times10^{-6}).
  19. Ex. 80.19Modeling

    Six Sigma: peças com dimensão XN(10,  0,022)X \sim \mathcal{N}(10,\; 0{,}02^2) mm. Tolerância 10±0,110 \pm 0{,}1 mm. Calcule a proporção de defeitos e estime defeitos por milhão.

    Show solution
    Peças: XN(10,  0,022)X \sim \mathcal{N}(10,\; 0{,}02^2). Tolerância: [9,9,  10,1][9{,}9,\; 10{,}1]. P(9,9X10,1)=P(5Z5)15,7×107P(9{,}9 \leq X \leq 10{,}1) = P(-5 \leq Z \leq 5) \approx 1 - 5{,}7\times10^{-7}. Defeitos por milhão: 0,57\approx 0{,}57 (extremamente baixo, processo Six Sigma bem centrado).
  20. Ex. 80.20Modeling

    Pesquisa eleitoral: n=2500n = 2500, p^=0,48\hat p = 0{,}48. Construa um intervalo de confiança de 95% para a proporção verdadeira pp.

    Show solution
    Pesquisa eleitoral: n=2500n = 2500, p^=0,48\hat p = 0{,}48. Erro padrão: SE=p^(1p^)/n=0,48×0,52/2500=0,2496/25000,01\text{SE} = \sqrt{\hat p (1-\hat p)/n} = \sqrt{0{,}48\times0{,}52/2500} = \sqrt{0{,}2496/2500} \approx 0{,}01. IC 95%: p^±1,96×0,01=0,48±0,0196\hat p \pm 1{,}96 \times 0{,}01 = 0{,}48 \pm 0{,}0196, ou seja, (0,460;  0,500)(0{,}460;\; 0{,}500). O IC contém 0,50, logo o resultado não permite concluir quem está na frente.
    Show step-by-step (with the why)
    1. Fórmula do IC para proporção: p^±zα/2p^(1p^)/n\hat p \pm z_{\alpha/2} \cdot \sqrt{\hat p (1-\hat p)/n}. Para 95%, z0,025=1,96z_{0{,}025} = 1{,}96.
    2. Calcule SE: 0,48×0,52/2500=9,984×1050,009990,01\sqrt{0{,}48 \times 0{,}52 / 2500} = \sqrt{9{,}984\times10^{-5}} \approx 0{,}00999 \approx 0{,}01.
    3. IC: 0,48±1,96×0,01=0,48±0,01960{,}48 \pm 1{,}96 \times 0{,}01 = 0{,}48 \pm 0{,}0196. Limites: 0,4604 a 0,4996.
    4. Interpretação: 0,50 está fora do IC (por uma margem mínima). Há evidência marginal de que menos de 50% preferem esse candidato, mas a certeza é baixa.
    Curiosidade: Margem de erro de pesquisa eleitoral no Brasil = ±2\pm 2 pontos percentuais corresponde a n2500n \approx 2500 (exatamente este exercício).
  21. Ex. 80.21Modeling

    Filtro de spam: 80% dos spams contêm "GRÁTIS", 5% dos hams contêm. P(spam)=0,3P(\text{spam}) = 0{,}3. Um email contém "GRÁTIS" — aplique Bayes e classifique.

    Show solution
    Spam: P(spam)=0,3P(\text{spam}) = 0{,}3, P("GRAˊTIS"spam)=0,80P(\text{"GRÁTIS"}|\text{spam}) = 0{,}80, P("GRAˊTIS"ham)=0,05P(\text{"GRÁTIS"}|\text{ham}) = 0{,}05. P("GRAˊTIS")=0,80×0,3+0,05×0,7=0,24+0,035=0,275P(\text{"GRÁTIS"}) = 0{,}80\times0{,}3 + 0{,}05\times0{,}7 = 0{,}24 + 0{,}035 = 0{,}275. P(spam"GRAˊTIS")=0,24/0,2750,872=87,2%P(\text{spam}|\text{"GRÁTIS"}) = 0{,}24/0{,}275 \approx 0{,}872 = 87{,}2\%. Classifique como spam.
  22. Ex. 80.22ModelingAnswer key

    Linha de produção: taxa de defeito 2%, lote de 200 peças. Estime P(X5 defeitos)P(X \geq 5\text{ defeitos}) via aproximação Poisson e via aproximação normal. Compare os resultados.

    Show solution
    Linha de produção com 2% de defeitos (p=0,02p = 0{,}02), lote de n=200n=200. Aproximação Poisson com λ=200×0,02=4\lambda = 200\times0{,}02 = 4: P(X5)=1P(X4)=1e4(1+4+8+32/6+32/3)/1P(X \geq 5) = 1 - P(X \leq 4) = 1 - e^{-4}(1 + 4 + 8 + 32/6 + 32/3)/1... mais diretamente: P(X4)=e4k=044k/k!=e4(1+4+8+32/6+32/3)P(X \leq 4) = e^{-4}\sum_{k=0}^{4}4^k/k! = e^{-4}(1+4+8+32/6+32/3). Numericamente: P(X4)0,629P(X \leq 4) \approx 0{,}629, logo P(X5)0,371P(X \geq 5) \approx 0{,}371. Aproximação normal: μ=4\mu=4, σ=2\sigma=2; P(X5)P(Z(4,54)/2)=P(Z0,25)40,1%P(X \geq 5) \approx P(Z \geq (4{,}5-4)/2) = P(Z \geq 0{,}25) \approx 40{,}1\%. As duas estimativas diferem; Poisson é mais precisa aqui (nn grande, pp pequeno).
  23. Ex. 80.23Modeling

    Carteira financeira: ativos A (σA=1%\sigma_A = 1\%) e B (σB=2%\sigma_B = 2\%) com correlação ρAB=0,3\rho_{AB} = 0{,}3. Calcule o desvio padrão da carteira 50%/50%.

    Show solution
    Variância da carteira 50/50: σp2=(0,5)2(0,01)2+(0,5)2(0,02)2+2(0,5)(0,5)(0,3)(0,01)(0,02)\sigma_p^2 = (0{,}5)^2(0{,}01)^2 + (0{,}5)^2(0{,}02)^2 + 2(0{,}5)(0{,}5)(0{,}3)(0{,}01)(0{,}02). =0,25×0,0001+0,25×0,0004+0,5×0,3×0,0002= 0{,}25\times0{,}0001 + 0{,}25\times0{,}0004 + 0{,}5\times0{,}3\times0{,}0002. =0,000025+0,0001+0,00003=0,000155= 0{,}000025 + 0{,}0001 + 0{,}00003 = 0{,}000155. σp=0,0001550,01245=1,245%\sigma_p = \sqrt{0{,}000155} \approx 0{,}01245 = 1{,}245\%. Compare com média ponderada de desvios: 0,5×1%+0,5×2%=1,5%0{,}5\times1\% + 0{,}5\times2\% = 1{,}5\%. A correlação parcial (ρ=0,3\rho=0{,}3) reduziu o risco abaixo da média ponderada — benefício da diversificação.
  24. Ex. 80.24Modeling

    Dois testes diagnósticos independentes, ambos positivos: teste 1 (sens 90%, espec 95%), teste 2 (sens 85%, espec 90%). Prevalência 1%. Aplique Bayes sequencialmente e calcule o VPP final.

    Show solution
    Dois testes independentes positivos, prevalência 1%. Primeiro teste: sens 90%, espec 95%. Posterior após 1.º teste: P(D+1)=(0,9×0,01)/(0,9×0,01+0,05×0,99)=0,009/0,05850,154P(D|+_1) = (0{,}9\times0{,}01)/(0{,}9\times0{,}01 + 0{,}05\times0{,}99) = 0{,}009/0{,}0585 \approx 0{,}154. Segundo teste usa posterior como novo prior: P(D+1,+2)=(0,85×0,154)/(0,85×0,154+0,10×0,846)=0,1309/(0,1309+0,0846)=0,1309/0,21550,607P(D|+_1,+_2) = (0{,}85\times0{,}154)/(0{,}85\times0{,}154 + 0{,}10\times0{,}846) = 0{,}1309/(0{,}1309+0{,}0846) = 0{,}1309/0{,}2155 \approx 0{,}607. Hmm, 60,7%. Com dois testes independentes sequenciais de Bayes, o VPP sobe significativamente, mas não chega a 89% com esses parâmetros. Resposta correta: VPP final ≈ 61%.
  25. Ex. 80.25Modeling

    Ensaio clínico de vacina: 100 vacinados, 5 doentes; 100 placebos, 25 doentes. Calcule a eficácia vacinal e avalie (informalmente) se a diferença é estatisticamente significativa.

    Show solution
    Vacinados: 5/100 = 5% de infecção. Placebos: 25/100 = 25%. Eficácia vacinal: 1(risco vacinados)/(risco placebos)=15%/25%=10,2=80%1 - (\text{risco vacinados})/(\text{risco placebos}) = 1 - 5\%/25\% = 1 - 0{,}2 = 80\%. Para avaliar significância (simplificado): diferença de proporções =0,250,05=0,20= 0{,}25 - 0{,}05 = 0{,}20. Erro padrão da diferença: 0,05×0,95/100+0,25×0,75/100=0,000475+0,001875=0,002350,0485\sqrt{0{,}05\times0{,}95/100 + 0{,}25\times0{,}75/100} = \sqrt{0{,}000475 + 0{,}001875} = \sqrt{0{,}00235} \approx 0{,}0485. Estatística Z: 0,20/0,04854,10{,}20/0{,}0485 \approx 4{,}1. Altamente significativo (p0,001p \ll 0{,}001).
  26. Ex. 80.26Modeling

    Central de atendimento: em cada minuto, cada um dos 120 atendentes recebe uma ligação com probabilidade 2%. Modele o número de ligações simultâneas em 1 minuto e calcule P(pelo menos 1 ligac¸a˜o)P(\text{pelo menos 1 ligação}).

    Show solution
    Número de chamadas em 1 hora: XBin(120,0,02)X \sim \text{Bin}(120, 0{,}02). E[X]=2,4E[X] = 2{,}4, Var(X)=120×0,02×0,98=2,352\text{Var}(X) = 120\times0{,}02\times0{,}98 = 2{,}352. Aprox. Poisson com λ=2,4\lambda = 2{,}4: P(X=0)=e2,40,091P(X = 0) = e^{-2{,}4} \approx 0{,}091; P(X1)10,091=90,9%P(X \geq 1) \approx 1 - 0{,}091 = 90{,}9\%.
  27. Ex. 80.27Modeling

    Alturas de homens adultos no Brasil: μ=173\mu = 173 cm, σ=7\sigma = 7 cm. Que porcentagem não passa por uma porta de 180 cm? Qual altura de porta cobre 99% da população masculina?

    Show solution
    Alturas de adultos brasileiros (dados ilustrativos): homens N(173,  72)\sim \mathcal{N}(173,\; 7^2) cm. Porta de 180 cm: Z=(180173)/7=1Z = (180-173)/7 = 1. P(H>180)=P(Z>1)15,9%P(H > 180) = P(Z > 1) \approx 15{,}9\%. Para 99% de cobertura: z0,99=2,326z_{0{,}99} = 2{,}326. Altura mínima da porta: 173+2,326×7189,3173 + 2{,}326\times7 \approx 189{,}3 cm. Na prática, normas construtivas brasileiras exigem pé-direito de 2,40 m para cobrir a distribuição.
  28. Ex. 80.28Challenge

    Explique, com exemplo numérico, por que em distribuições muito assimétricas à direita a mediana é mais informativa que a média, e o IQR mais informativo que o desvio padrão.

    Show solution
    Em distribuição muito assimétrica à direita (ex.: renda, tempo de espera extremo), a média é inflada pelos valores extremos. A mediana, sendo um quantil robusto, representa melhor o valor "típico". O IQR mede a dispersão da metade central da distribuição e é imune a outliers — por isso é mais informativo que σ\sigma quando há assimetria forte ou outliers. Exemplo prático: renda per capita do Brasil, onde a média é superior ao salário de 80% das pessoas.
  29. Ex. 80.29ChallengeAnswer key

    Descreva intuitiva e matematicamente como a inferência bayesiana converge para a inferência frequentista (MLE) quando nn \to \infty. Qual teorema formaliza essa convergência?

    Show solution
    O fenômeno é a convergência do estimador bayesiano para o MLE em grandes amostras (Bernstein-von Mises). Para nn grande, a verossimilhança L(θx1,,xn)L(\theta|x_1,\ldots,x_n) domina o prior π(θ)\pi(\theta) na determinação do posterior. Formalmente, se o prior é contínuo e positivo na vizinhança do MLE, o posterior π(θxn)\pi(\theta|x^n) converge (em variação total) para N(θ^MLE,  I(θ)1/n)\mathcal{N}(\hat\theta_{MLE},\; I(\theta)^{-1}/n), onde I(θ)I(\theta) é a informação de Fisher. Intuitivamente: dados suficientes "afogam" o prior.
  30. Ex. 80.30ChallengeAnswer key

    Construa um exemplo de dados onde r>0,8r > 0{,}8 mas a relação entre XX e YY é inteiramente explicada por um confundidor CC. Explicite o mecanismo matemático.

    Show solution
    Exemplo clássico: correlação entre vendas de sorvete e número de afogamentos tem r0,9r \approx 0{,}9. A causa comum é a temperatura. Ambas as variáveis são causadas pelo calor, não há relação causal entre si. Para construir: tome C=temperaturaC = \text{temperatura} (confundidor), X=vendas sorveteX = \text{vendas sorvete}, Y=afogamentosY = \text{afogamentos}. X=aC+ε1X = a\cdot C + \varepsilon_1, Y=bC+ε2Y = b\cdot C + \varepsilon_2, com ε1,ε2\varepsilon_1, \varepsilon_2 independentes. Cov(X,Y)=abVar(C)0\text{Cov}(X,Y) = ab\cdot\text{Var}(C) \neq 0. Correlar X e Y é um espúrio derivado do confundidor C.
  31. Ex. 80.31Challenge

    Gere (teoricamente) 100 variáveis aleatórias XiUniforme[0,1]X_i \sim \text{Uniforme}[0,1] independentes. Use o TCL para aproximar P(X1++X100>55)P(X_1 + \cdots + X_{100} > 55).

    Show solution
    Soma de 100 números independentes uniformes em [0,1]: S=X1++X100S = X_1+\ldots+X_{100} com μ=0,5\mu = 0{,}5, σ2=1/12\sigma^2 = 1/12. Pelo TCL: SN(50,  100/12)=N(50,  8,33)S \approx \mathcal{N}(50,\; 100/12) = \mathcal{N}(50,\; 8{,}33). P(S>55)=P(Z>(5550)/8,33)=P(Z>5/2,887)=P(Z>1,732)4,2%P(S > 55) = P(Z > (55-50)/\sqrt{8{,}33}) = P(Z > 5/2{,}887) = P(Z > 1{,}732) \approx 4{,}2\%.
  32. Ex. 80.32Challenge

    ENEM: escola pública tem μ1=520\mu_1 = 520, σ1=90\sigma_1 = 90 (Mat.); escola privada tem μ2=610\mu_2 = 610, σ2=80\sigma_2 = 80. Amostras de n=100n=100 de cada. Qual a probabilidade de que a média amostral privada supere a pública em mais de 80 pontos?

    Show solution
    ENEM 2024 (dados hipotéticos): média de Matemática em escola pública = 520, σ=90\sigma = 90; escola privada = 610, σ=80\sigma = 80. Amostras n1=n2=100n_1 = n_2 = 100. Diferença de médias amostrais: Xˉ2Xˉ1N(90,  802/100+902/100)=N(90,  64+81)=N(90,  145)\bar X_2 - \bar X_1 \sim \mathcal{N}(90,\; 80^2/100 + 90^2/100) = \mathcal{N}(90,\; 64+81) = \mathcal{N}(90,\; 145). σdif=14512,04\sigma_{\text{dif}} = \sqrt{145} \approx 12{,}04. P(Xˉ2Xˉ1>80)=P(Z>(8090)/12,04)=P(Z>0,83)79,7%P(\bar X_2 - \bar X_1 > 80) = P(Z > (80-90)/12{,}04) = P(Z > -0{,}83) \approx 79{,}7\%.
  33. Ex. 80.36Proof

    Demonstre que Var(X)=E[X2](E[X])2\text{Var}(X) = E[X^2] - (E[X])^2 a partir da definição Var(X)=E[(Xμ)2]\text{Var}(X) = E[(X-\mu)^2].

    Show solution
    Para provar Var(X)=E[X2](E[X])2\text{Var}(X) = E[X^2] - (E[X])^2: partindo da definição Var(X)=E[(Xμ)2]\text{Var}(X) = E[(X-\mu)^2] onde μ=E[X]\mu = E[X]. Expanda: E[(Xμ)2]=E[X22μX+μ2]=E[X2]2μE[X]+μ2=E[X2]2μ2+μ2=E[X2]μ2=E[X2](E[X])2E[(X-\mu)^2] = E[X^2 - 2\mu X + \mu^2] = E[X^2] - 2\mu E[X] + \mu^2 = E[X^2] - 2\mu^2 + \mu^2 = E[X^2] - \mu^2 = E[X^2] - (E[X])^2. A segunda passagem usa linearidade da esperança; a terceira usa E[X]=μE[X] = \mu e E[μ2]=μ2E[\mu^2] = \mu^2 (constante).
  34. Ex. 80.37Proof

    Mostre que se XiBernoulli(p)X_i \sim \text{Bernoulli}(p) são iid, então S=i=1nXiBin(n,p)S = \sum_{i=1}^n X_i \sim \text{Bin}(n,p). Conclua que Xˉ=S/nPp\bar X = S/n \xrightarrow{P} p pela Lei dos Grandes Números.

    Show solution
    Sejam XiBernoulli(p)X_i \sim \text{Bernoulli}(p) iid. A soma S=X1++XnS = X_1 + \ldots + X_n conta o número de sucessos em nn tentativas independentes. P(S=k)=P(exatamente k dos n sa˜o 1)=(nk)pk(1p)nkP(S = k) = P(\text{exatamente } k \text{ dos } n \text{ são 1}) = \binom{n}{k} p^k (1-p)^{n-k}, pois há (nk)\binom{n}{k} maneiras de escolher quais kk tentativas são sucesso, cada combinação tem probabilidade pk(1p)nkp^k(1-p)^{n-k}, e as tentativas são independentes. Isso é exatamente a PMF da Binomial(n, p). Pela Lei dos Grandes Números: Xˉ=S/nPE[X1]=p\bar X = S/n \xrightarrow{P} E[X_1] = p.
  35. Ex. 80.38ProofAnswer key

    Prove que E[aX+b]=aE[X]+bE[aX + b] = aE[X] + b e Var(aX+b)=a2Var(X)\text{Var}(aX + b) = a^2 \text{Var}(X) para quaisquer a,bRa, b \in \mathbb{R}.

    Show solution
    Linearidade da esperança: E[aX+b]=x(ax+b)P(X=x)=axxP(X=x)+bxP(X=x)=aE[X]+bE[aX + b] = \sum_x (ax+b) P(X=x) = a\sum_x x P(X=x) + b\sum_x P(X=x) = a E[X] + b (usando P(X=x)=1\sum P(X=x) = 1). Variância de transformação linear: Var(aX+b)=E[(aX+b(aE[X]+b))2]=E[(a(XE[X]))2]=a2E[(XE[X])2]=a2Var(X)\text{Var}(aX+b) = E[(aX+b - (aE[X]+b))^2] = E[(a(X-E[X]))^2] = a^2 E[(X-E[X])^2] = a^2 \text{Var}(X). A constante bb não afeta a dispersão.
  36. Ex. 80.39Proof

    Derive a regra de Bayes P(HE)=P(EH)P(H)/P(E)P(H \mid E) = P(E \mid H)\,P(H)/P(E) a partir da definição de probabilidade condicional e da lei da probabilidade total.

    Show solution
    Regra de Bayes para dois eventos: P(HE)=P(EH)/P(E)P(H|E) = P(E \cap H)/P(E) (definição de probabilidade condicional). Por definição, P(EH)=P(EH)P(H)P(E \cap H) = P(E|H) P(H). Para P(E)P(E), use lei da probabilidade total com partição {H,Hc}\{H, H^c\}: P(E)=P(EH)P(H)+P(EHc)P(Hc)P(E) = P(E|H)P(H) + P(E|H^c)P(H^c). Substituindo: P(HE)=P(EH)P(H)/[P(EH)P(H)+P(EHc)P(Hc)]P(H|E) = P(E|H)P(H)/[P(E|H)P(H) + P(E|H^c)P(H^c)]. A generalização para nn hipóteses exclusivas e exaustivas {H1,,Hn}\{H_1,\ldots,H_n\} segue analogamente.
  37. Ex. 80.40Proof

    Enuncie o TCL formalmente. Esboce a prova via função característica (basta indicar os passos, não é necessário justificar o teorema de continuidade de Lévy).

    Show solution
    Enunciado do TCL (forma fraca): se XiX_i são iid com E[Xi]=μE[X_i]=\mu e Var(Xi)=σ2<\text{Var}(X_i)=\sigma^2 < \infty, então n(Xˉnμ)/σdN(0,1)\sqrt{n}(\bar X_n - \mu)/\sigma \xrightarrow{d} \mathcal{N}(0,1). Esboço via função característica: a f.c. de Zn=n(Xˉμ)/σZ_n = \sqrt{n}(\bar X - \mu)/\sigma é φZn(t)=[φX(t/(σn))]n\varphi_{Z_n}(t) = [\varphi_X(t/(\sigma\sqrt{n}))]^n. Expandindo φX\varphi_X em Taylor: φX(s)=1s2σ2/2+O(s3)\varphi_X(s) = 1 - s^2\sigma^2/2 + O(s^3). Substituindo s=t/(σn)s = t/(\sigma\sqrt{n}): φZn(t)=[1t2/(2n)+O(n3/2)]net2/2\varphi_{Z_n}(t) = [1 - t^2/(2n) + O(n^{-3/2})]^n \to e^{-t^2/2} quando nn \to \infty. Mas et2/2e^{-t^2/2} é exatamente a f.c. de N(0,1)\mathcal{N}(0,1). Pelo teorema de continuidade de Lévy, convergência de f.c. implica convergência em distribuição.

Fontes

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.