Math ClubMath Club
v1 · padrão canônico

Lição 72 — Variância e desvio padrão

Dispersão estatística: quanto os dados se afastam da média. Variância populacional e amostral, desvio padrão, fórmula computacional, propriedades de linearidade e independência.

Used in: 2.º ano do EM (16-17 anos) · Equiv. Stochastik LK alemão · Equiv. Math B japonês · Equiv. H2 Statistics singapurense

σ2=1ni=1n(xixˉ)2\sigma^2 = \frac{1}{n}\sum_{i=1}^{n}(x_i - \bar{x})^2
Choose your door

Rigorous notation, full derivation, hypotheses

严格定义

方差和标准差——总体与样本

"方差或多或少是每个数据点到均值的平均平方距离。与方差关联的单位是平方单位。为了使分散度量具有与数据相同的单位,我们取方差的平方根,称为标准差。" — OpenIntro Statistics §2.1,Diez et al.,CC-BY-SA。

"在统计问题中,我们通常无法获得整个总体,因此使用样本数据来估计总体参数。为此,我们除以样本的自由度n1n-1而不是nn。" — OpenStax Statistics §2.7,Illowsky & Dean,CC-BY。

代数性质

几何表示——散点图

高分散(大σ)μ低分散(小σ)μ

两个均值相同但分散不同的集合。远离虚线(均值)的点产生高方差;聚集的点产生低方差。

已解决的例子

Exercise list

40 exercises · 10 with worked solution (25%)

Application 24Understanding 3Modeling 9Proof 4
  1. Ex. 72.1Application

    计算{4,6,8}\{4, 6, 8\}的总体方差和标准差。

  2. Ex. 72.2Application

    计算{2,4,4,4,5,5,7,9}\{2, 4, 4, 4, 5, 5, 7, 9\}的样本方差s2s^2和样本标准差ss

  3. Ex. 72.3Application

    计算{5,6,7,8,9}\{5, 6, 7, 8, 9\}的总体标准差。

  4. Ex. 72.4ApplicationAnswer key

    {10,10,10,10}\{10, 10, 10, 10\}的方差是多少?从几何上解释。

  5. Ex. 72.5ApplicationAnswer key

    计算{0,100}\{0, 100\}的总体方差。

  6. Ex. 72.6Application

    薪资(千R$):3,3,4,4,5,203, 3, 4, 4, 5, 20。计算均值和样本标准差。评论异常值的影响。

  7. Ex. 72.7Application

    使用计算公式x2xˉ2\overline{x^2} - \bar{x}^2计算{1,2,3,4,5}\{1, 2, 3, 4, 5\}的方差。

  8. Ex. 72.8Application

    8次服务的等待时间(分):5,7,6,8,4,5,6,75, 7, 6, 8, 4, 5, 6, 7。计算样本标准差。

  9. Ex. 72.9ApplicationAnswer key

    6个西瓜的重量(公斤):8,9,9,10,11,138, 9, 9, 10, 11, 13。计算s2s^2ss

  10. Ex. 72.10Application

    XX取值1,2,31, 2, 3,概率为12,14,14\frac{1}{2}, \frac{1}{4}, \frac{1}{4}。计算Var(X)\text{Var}(X)

  11. Ex. 72.11Application

    6面公平骰子。计算Var(X)\text{Var}(X)

  12. Ex. 72.12ApplicationAnswer key

    两个独立公平骰子之和。使用独立性性质计算Var(S)\text{Var}(S)

  13. Ex. 72.13Application

    7天的最高温度(℃):10,7,4,9,8,11,510, 7, 4, 9, 8, 11, 5。计算样本方差。

  14. Ex. 72.14Application

    使用计算公式E[X2](E[X])2E[X^2] - (E[X])^2计算{1,3,5,7,9}\{1, 3, 5, 7, 9\}的方差。

  15. Ex. 72.15ApplicationAnswer key

    如果Var(X)=9\text{Var}(X) = 9,计算Var(2X+5)\text{Var}(2X + 5)

  16. Ex. 72.16Application

    如果σX=4\sigma_X = 43X3X的标准差是多少?

  17. Ex. 72.17ApplicationAnswer key

    Var(X)=4\text{Var}(X) = 4Var(Y)=9\text{Var}(Y) = 9XXYY独立。计算Var(X+Y)\text{Var}(X+Y)Var(XY)\text{Var}(X-Y)

  18. Ex. 72.18Application

    如果μ=70\mu = 70σ=5\sigma = 5,对X=80X = 80进行标准化。计算z分数。

  19. Ex. 72.19Application

    F=1.8C+32F = 1.8C + 32(摄氏度到华氏度转换)。如果σC=5\sigma_C = 5°C,σF\sigma_F是多少?

  20. Ex. 72.20Application

    计算高度(μ=170\mu = 170厘米、σ=8\sigma = 8厘米)和重量(μ=70\mu = 70公斤、σ=12\sigma = 12公斤)的变异系数CV=σ/μCV = \sigma/\mu。哪个集合相对变异性更大?

  21. Ex. 72.21Application

    使用μ=70,σ=10\mu = 70, \sigma = 10{60,70,80}\{60, 70, 80\}进行标准化。z分数的均值和标准差是多少?

  22. Ex. 72.22Application

    Var(X)=16\text{Var}(X) = 16Var(X)\text{Var}(-X)是多少?

  23. Ex. 72.23ApplicationAnswer key

    n=25n = 25个独立观测的样本均值,σ=10\sigma = 10。均值的标准差是多少?

  24. Ex. 72.24Application

    100个iid随机变量之和,σ=1\sigma = 1。和的标准差是多少?

  25. Ex. 72.25Understanding

    为什么样本方差使用除数n1n-1而不是nn

  26. Ex. 72.26Understanding

    为了比较薪资(R$)和高度(厘米)间的分散,更倾向σ\sigma还是CVCV?为什么?

  27. Ex. 72.27Understanding

    方差能是负数吗?

  28. Ex. 72.28Modeling

    生产线:平均质量500克、σ=5\sigma = 5克。容限±15\pm 15克。容限代表多少σ\sigma

  29. Ex. 72.29ModelingAnswer key

    两个基金期望回报8%,但σA=5%\sigma_A = 5\%σB=15%\sigma_B = 15\%。作为风险厌恶者,选择哪个?为什么?

  30. Ex. 72.30Modeling

    你测量电阻10次:Rˉ=100Ω\bar{R} = 100\,\Omegas=0.5Ωs = 0.5\,\Omega。估计均值的标准差。

  31. Ex. 72.31Modeling

    家到工作出行时间:μ=30\mu = 30分钟、σ=5\sigma = 5分钟。使用切比雪夫不等式作为保守界,提前多少分钟出发来保证至少95%的到达机会?

  32. Ex. 72.32Modeling

    Six Sigma过程:μ=10.00\mu = 10.00毫米,容限9.94至10.06毫米。仍满足Six Sigma要求的最大σ\sigma是多少?

  33. Ex. 72.33ModelingAnswer key

    股票A:σA=1%\sigma_A = 1\%;股票B:σB=2%\sigma_B = 2\%。50-50投资组合,零相关。投资组合方差。

  34. Ex. 72.34Modeling

    来自前一个练习的同一投资组合,但股票之间的相关为0.5-0.5。方差。与零相关的情况比较。

  35. Ex. 72.35Modeling

    在机器学习中,为什么应在训练基于梯度的模型前标准化具有不同尺度的特征?

  36. Ex. 72.36Modeling

    ENEM数学成绩:μ520\mu \approx 520σ110\sigma \approx 110分。一个学生得了740分。计算z分数并解释(他在均值上方多少个标准差?)。

  37. Ex. 72.37Proof

    从定义Var(X)=E[(Xμ)2]\text{Var}(X) = E[(X-\mu)^2]证明Var(X)=E[X2](E[X])2\text{Var}(X) = E[X^2] - (E[X])^2

  38. Ex. 72.38Proof

    对任意常数a,ba, b证明Var(aX+b)=a2Var(X)\text{Var}(aX + b) = a^2\,\text{Var}(X)

  39. Ex. 72.39ProofAnswer key

    XXYY独立时证明Var(X+Y)=Var(X)+Var(Y)\text{Var}(X + Y) = \text{Var}(X) + \text{Var}(Y)

  40. Ex. 72.40Proof

    证明切比雪夫不等式:对k>0k > 0P(Xμkσ)1k2P(|X - \mu| \geq k\sigma) \leq \dfrac{1}{k^2}

来源

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.