Lição 72 — Variância e desvio padrão
Dispersão estatística: quanto os dados se afastam da média. Variância populacional e amostral, desvio padrão, fórmula computacional, propriedades de linearidade e independência.
Used in: 2.º ano do EM (16-17 anos) · Equiv. Stochastik LK alemão · Equiv. Math B japonês · Equiv. H2 Statistics singapurense
Rigorous notation, full derivation, hypotheses
严格定义
方差和标准差——总体与样本
"方差或多或少是每个数据点到均值的平均平方距离。与方差关联的单位是平方单位。为了使分散度量具有与数据相同的单位,我们取方差的平方根,称为标准差。" — OpenIntro Statistics §2.1,Diez et al.,CC-BY-SA。
"在统计问题中,我们通常无法获得整个总体,因此使用样本数据来估计总体参数。为此,我们除以样本的自由度而不是。" — OpenStax Statistics §2.7,Illowsky & Dean,CC-BY。
代数性质
几何表示——散点图
两个均值相同但分散不同的集合。远离虚线(均值)的点产生高方差;聚集的点产生低方差。
已解决的例子
Exercise list
40 exercises · 10 with worked solution (25%)
- Ex. 72.1Application
计算的总体方差和标准差。
- Ex. 72.2Application
计算的样本方差和样本标准差。
- Ex. 72.3Application
计算的总体标准差。
- Ex. 72.4ApplicationAnswer key
的方差是多少?从几何上解释。
- Ex. 72.5ApplicationAnswer key
计算的总体方差。
- Ex. 72.6Application
薪资(千R$):。计算均值和样本标准差。评论异常值的影响。
- Ex. 72.7Application
使用计算公式计算的方差。
- Ex. 72.8Application
8次服务的等待时间(分):。计算样本标准差。
- Ex. 72.9ApplicationAnswer key
6个西瓜的重量(公斤):。计算和。
- Ex. 72.10Application
取值,概率为。计算。
- Ex. 72.11Application
6面公平骰子。计算。
- Ex. 72.12ApplicationAnswer key
两个独立公平骰子之和。使用独立性性质计算。
- Ex. 72.13Application
7天的最高温度(℃):。计算样本方差。
- Ex. 72.14Application
使用计算公式计算的方差。
- Ex. 72.15ApplicationAnswer key
如果,计算。
- Ex. 72.16Application
如果,的标准差是多少?
- Ex. 72.17ApplicationAnswer key
、、和独立。计算和。
- Ex. 72.18Application
如果、,对进行标准化。计算z分数。
- Ex. 72.19Application
(摄氏度到华氏度转换)。如果°C,是多少?
- Ex. 72.20Application
计算高度(厘米、厘米)和重量(公斤、公斤)的变异系数。哪个集合相对变异性更大?
- Ex. 72.21Application
使用对进行标准化。z分数的均值和标准差是多少?
- Ex. 72.22Application
。是多少?
- Ex. 72.23ApplicationAnswer key
个独立观测的样本均值,。均值的标准差是多少?
- Ex. 72.24Application
100个iid随机变量之和,。和的标准差是多少?
- Ex. 72.25Understanding
为什么样本方差使用除数而不是?
- Ex. 72.26Understanding
为了比较薪资(R$)和高度(厘米)间的分散,更倾向还是?为什么?
- Ex. 72.27Understanding
方差能是负数吗?
- Ex. 72.28Modeling
生产线:平均质量500克、克。容限克。容限代表多少?
- Ex. 72.29ModelingAnswer key
两个基金期望回报8%,但和。作为风险厌恶者,选择哪个?为什么?
- Ex. 72.30Modeling
你测量电阻10次:、。估计均值的标准差。
- Ex. 72.31Modeling
家到工作出行时间:分钟、分钟。使用切比雪夫不等式作为保守界,提前多少分钟出发来保证至少95%的到达机会?
- Ex. 72.32Modeling
Six Sigma过程:毫米,容限9.94至10.06毫米。仍满足Six Sigma要求的最大是多少?
- Ex. 72.33ModelingAnswer key
股票A:;股票B:。50-50投资组合,零相关。投资组合方差。
- Ex. 72.34Modeling
来自前一个练习的同一投资组合,但股票之间的相关为。方差。与零相关的情况比较。
- Ex. 72.35Modeling
在机器学习中,为什么应在训练基于梯度的模型前标准化具有不同尺度的特征?
- Ex. 72.36Modeling
ENEM数学成绩:、分。一个学生得了740分。计算z分数并解释(他在均值上方多少个标准差?)。
- Ex. 72.37Proof
从定义证明。
- Ex. 72.38Proof
对任意常数证明。
- Ex. 72.39ProofAnswer key
当和独立时证明。
- Ex. 72.40Proof
证明切比雪夫不等式:对有。
来源
-
OpenIntro Statistics(第4版) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA。本课的主要来源。 §2.1–§2.2涵盖样本方差、标准差、箱线图和应用例子。
-
Statistics(OpenStax) — Illowsky, Dean · CC-BY。§2.7涵盖分散度量、计算公式、计算器练习和教育/卫生数据。
-
Introduction to Probability — Grinstead & Snell (达特茅斯学院) — GNU FDL。第6章涵盖离散随机变量的方差、代数性质、切比雪夫和与大数定律的联系。