第一部分:知识框架
本章核心概念逻辑关系:
- 数学期望 (Expectation):描述随机变量的平均值或加权平均,是随机变量取值的中心
- 方差 (Variance):描述随机变量取值与其数学期望的偏离程度的平均值,衡量随机变量的不确定性或波动性
- 协方差 (Covariance):描述两个随机变量协同变化的趋势,即它们之间的线性相关方向
- 相关系数 (Correlation Coefficient):由协方差标准化得到,描述两个随机变量之间线性相关的强度和方向
逻辑关系:数学期望是基础,方差是基于数学期望定义的,协方差和相关系数则是基于数学期望和方差,用于描述两个随机变量之间的关系。
第二部分:详细内容
【4.1 数学期望】
定义
定义1 (离散型随机变量的数学期望):设离散型随机变量 X 的分布律为 P(X = x_k) = p_k, k=1,2,...。若无穷级数 \sum_{k=1}^{+\infty} x_k p_k 绝对收敛,则称 \sum_{k=1}^{+\infty} x_k p_k 为随机变量 X 的数学期望,记为 E(X)。
定义2 (连续型随机变量的数学期望):设连续型随机变量 X 的概率密度为 f(x)。若积分 \int_{-\infty}^{+\infty} x f(x) dx 绝对收敛,则称 \int_{-\infty}^{+\infty} x f(x) dx 为随机变量 X 的数学期望。
注:数学期望反映了随机变量取值的平均值,它是一种加权平均。
例题
题目:设某网店某购物节期间的订单 X \sim \text{Poi}(\lambda),求 E(X)。
解答:
X 的分布律为 P(X=k) = \frac{\lambda^k}{k!} e^{-\lambda}, k=0,1,2,...
最终答案:E(X) = \lambda
题目:设 X 服从参数为 p 的几何分布,求 E(X)。
解答:
X 的分布律为 P(X=k) = (1-p)^{k-1} p, k=1,2,...
令 S = \sum_{k=1}^{\infty} k (1-p)^{k-1},利用公式 \sum_{k=1}^{\infty} k r^{k-1} = \frac{1}{(1-r)^2} (对于 |r|<1):
因此,E(X) = p \cdot \frac{1}{p^2} = \frac{1}{p}
最终答案:E(X) = \frac{1}{p}
题目:设某电子元件的寿命 X 服从参数为 \lambda 的指数分布,求该电子元件的平均寿命。
解答:
X 的概率密度函数为 f(x) = \lambda e^{-\lambda x}, x>0。
【推导过程】:使用分部积分法。
令 u = x, dv = \lambda e^{-\lambda x} dx,则 du = dx, v = -e^{-\lambda x}。
最终答案:E(X) = \frac{1}{\lambda}
图表
常见分布的数学期望表 (离散型):
| 分布 | 概率分布 | 期望 |
|---|---|---|
| 参数为 p 的 0-1 分布 | P(X=1)=p, P(X=0)=1-p | p |
| B(n, p) | P(X=k)=C_n^k p^k (1-p)^{n-k}, k=0,1,2,\cdots,n | np |
| \text{Poi}(\lambda) | P(X=k)=\frac{\lambda^k}{k!} e^{-\lambda}, k=0,1,2,\cdots | \lambda |
| 参数为 p 的几何分布 | P(X=k)=p(1-p)^{k-1}, k=1,2,\cdots | \frac{1}{p} |
常见分布的数学期望表 (连续型):
| 分布 | 概率密度 | 期望 |
|---|---|---|
| 区间 [a,b] 上的均匀分布 | f(x) = \begin{cases} \frac{1}{b-a}, & a0 \\ 0, & \text{其他} \end{cases} | \frac{1}{\lambda} |
| N(\mu, \sigma^2) | f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} | \mu |
定理/公式
随机变量函数的数学期望定理:
-
设随机变量 Y 为 X 的连续函数,Y = g(X),且 E[g(X)] 存在。
- 若 X 是离散型随机变量,分布律为 P(X=x_k)=p_k,则 E[g(X)] = \sum_{k=1}^{+\infty} g(x_k) p_k
- 若 X 是连续型随机变量,概率密度为 f(x),则 E[g(X)] = \int_{-\infty}^{+\infty} g(x) f(x) dx
-
设 Z 是随机变量 X, Y 的函数 Z = g(X, Y),且 E[g(X,Y)] < +\infty
- 若 (X,Y) 是二维离散型随机变量,分布律为 P(X=x_i, Y=y_j)=p_{ij},则 E[Z] = E[g(X,Y)] = \sum_{i,j} g(x_i, y_j) p_{ij}
- 若 (X,Y) 是二维连续型随机变量,概率密度为 f(x,y),则 E[Z] = E[g(X,Y)] = \iint_{\mathbb{R}^2} g(x,y) f(x,y) dxdy
例题
题目:设二维随机变量 (X,Y) 的联合密度为 f(x,y) = \begin{cases} 3xy(x+y), & 0 \le x \le 1, 0 \le y \le 1 \\ 0, & \text{其他} \end{cases},试求 Z = X^2 Y 的数学期望。
解答:
根据定理:
最终答案:E(Z) = \frac{31}{80}
定理/公式
数学期望的性质:
设 X, Y 是随机变量,a, b, c 是常数。
- X 的期望存在 \iff E|X| < +\infty
- 设 X \le Y,则 E(X) \le E(Y)
- E(c) = c, E(cX) = c E(X)
- E(aX + bY + c) = a E(X) + b E(Y) + c
- 设 X, Y 是两个相互独立的随机变量,则 E(XY) = E(X) E(Y)
- (线性性)设 X_1, \cdots, X_n 为任意 n 个数学期望存在的随机变量,则 \sum_{i=1}^{n} X_i 的数学期望也存在,且 E\left( \sum_{i=1}^{n} X_i \right) = \sum_{i=1}^{n} E(X_i)
- (独立性推广)若 X_i (i=1,2,\cdots,n) 相互独立,则 E\left( \prod_{i=1}^{n} X_i \right) = \prod_{i=1}^{n} E(X_i)
注:性质 5 的逆命题不成立。即若 E(XY) = E(X)E(Y),X 与 Y 不一定独立。
例题
题目:将 4 个球随机地放入 4 个盒子中,每盒容纳的球数无限,求空盒子数的数学期望。
解答 (解法二):
利用指示随机变量和期望的线性性。
设 X_i = \begin{cases} 1, & \text{第 } i \text{ 个盒子为空} \\ 0, & \text{其他} \end{cases}, i=1,2,3,4。
则 X = X_1 + X_2 + X_3 + X_4。
E(X_i) = P(\text{第 } i \text{ 个盒子为空}) = \left( \frac{3}{4} \right)^4 = \frac{81}{256}
由期望的线性性:E(X) = E(X_1) + E(X_2) + E(X_3) + E(X_4) = 4 \times \frac{81}{256} = \frac{324}{256} = \frac{81}{64}
最终答案:E(X) = \frac{81}{64}
【4.2 方差】
定义
方差的定义:设随机变量 X 满足 E(X^2) < \infty,则称 D(X) := E\left[ (X - E(X))^2 \right] 为 X 的方差。
均方差 (标准差):\sigma_X = \sqrt{D(X)}
注:方差反映了随机变量相对其均值的偏离程度。
定理/公式
方差的计算:
-
用定义计算:
- 若 X 为离散型随机变量,分布律为 P(X=x_k)=p_k,则 D(X) = \sum_{k} (x_k - E(X))^2 p_k
- 若 X 为连续型随机变量,概率密度为 f(x),则 D(X) = \int_{-\infty}^{+\infty} (x - E(X))^2 f(x) dx
-
常用计算公式:
【推导过程】:
例题
题目:设 X \sim \text{Poi}(\lambda),求 D(X)。
解答:
已知 E(X) = \lambda。
需要计算 E(X^2)。 E(X^2) = E[X(X-1) + X] = E[X(X-1)] + E(X)。
E[X(X-1)] = \sum_{k=0}^{\infty} k(k-1) \frac{\lambda^k}{k!} e^{-\lambda} = e^{-\lambda} \lambda^2 \sum_{k=2}^{\infty} \frac{\lambda^{k-2}}{(k-2)!} = e^{-\lambda} \lambda^2 e^{\lambda} = \lambda^2
所以 E(X^2) = \lambda^2 + \lambda。
因此,D(X) = E(X^2) - [E(X)]^2 = (\lambda^2 + \lambda) - \lambda^2 = \lambda。
最终答案:D(X) = \lambda
题目:设 X \sim N(\mu, \sigma^2),求 D(X)。
解答:
D(X) = E[(X - \mu)^2] = \int_{-\infty}^{+\infty} (x - \mu)^2 \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} dx
【推导过程】:令 t = \frac{x - \mu}{\sigma},则 x = \mu + \sigma t, dx = \sigma dt。
利用标准正态分布的二阶矩:E(Z^2) = D(Z) + [E(Z)]^2 = 1 + 0 = 1,其中 Z \sim N(0,1)。
所以 \int_{-\infty}^{+\infty} t^2 \frac{1}{\sqrt{2\pi}} e^{-\frac{t^2}{2}} dt = 1。
因此,D(X) = \sigma^2 \cdot 1 = \sigma^2。
最终答案:D(X) = \sigma^2
图表
常见随机变量的方差表 (离散型):
| 分布 | 概率分布 | 期望 | 方差 |
|---|---|---|---|
| 参数为 p 的 0-1 分布 | P(X=1)=p, P(X=0)=1-p | p | p(1-p) |
| B(n, p) | P(X=k)=C_n^k p^k (1-p)^{n-k} | np | np(1-p) |
| \text{Poi}(\lambda) | P(X=k)=\frac{\lambda^k}{k!} e^{-\lambda} | \lambda | \lambda |
| 参数为 p 的几何分布 | P(X=k)=p(1-p)^{k-1} | \frac{1}{p} | \frac{1-p}{p^2} |
常见随机变量的方差表 (连续型):
| 分布 | 概率密度 | 期望 | 方差 |
|---|---|---|---|
| 区间 [a,b] 上的均匀分布 | f(x) = \begin{cases} \frac{1}{b-a}, & a0 \\ 0, & \text{其他} \end{cases} | \frac{1}{\lambda} | \frac{1}{\lambda^2} |
| N(\mu, \sigma^2) | f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} | \mu | \sigma^2 |
定理/公式
方差的性质:
设 X, Y 是随机变量,c 是常数。
- D(X) 存在 \iff E(X^2) < +\infty
- D(c) = 0
- D(cX) = c^2 D(X)
- 设 X, Y 是相互独立的随机变量,则 D(X \pm Y) = D(X) + D(Y)
- 对任意常数 a,有 D(X) \le E[(X-a)^2],且等号当且仅当 a = E(X) 时成立
推广:设 X_1, ..., X_n 相互独立,且 D(X_i) 存在,则 D\left( \sum_{i=1}^{n} c_i X_i \right) = \sum_{i=1}^{n} c_i^2 D(X_i)。
注:如果 D(X)=0,则 X 以概率 1 等于常数 c(即 P(X=c)=1)。
定义
标准化随机变量:设随机变量 X 的二阶矩存在,且 D(X) > 0,则称 X^* = \frac{X - E(X)}{\sqrt{D(X)}} 为 X 的标准化随机变量。
显然,E(X^*) = 0, D(X^*) = 1。
【4.3 协方差和相关系数】
定义
协方差的定义:若 E(X^2) < +\infty, E(Y^2) < +\infty,称 \text{Cov}(X, Y) = E\left[ (X - E(X))(Y - E(Y)) \right] 为 X, Y 的协方差。
相关系数的定义:若 D(X) > 0, D(Y) > 0,称 \rho_{X,Y} = \frac{\text{Cov}(X, Y)}{\sqrt{D(X) D(Y)}} 为 X, Y 的相关系数。
协方差矩阵:称 \begin{pmatrix} D(X) & \text{Cov}(X,Y) \\ \text{Cov}(Y,X) & D(Y) \end{pmatrix} 为 (X,Y) 的协方差矩阵。
定理/公式
协方差和相关系数的计算:
-
用定义计算:
- 若 (X,Y) 为离散型,分布律为 P(X=x_i, Y=y_j)=p_{ij},则 \text{Cov}(X,Y) = \sum_{i,j} (x_i - E(X))(y_j - E(Y)) p_{ij}
- 若 (X,Y) 为连续型,联合密度为 f(x,y),则 \text{Cov}(X,Y) = \iint_{\mathbb{R}^2} (x - E(X))(y - E(Y)) f(x,y) dxdy
-
用公式计算:
【推导过程】:
例题
题目:设 X, Y \sim N(0,1; 0,1; \rho),求 \rho_{X,Y}。
解答:
易知 E(X)=E(Y)=0, D(X)=D(Y)=1。
所以 \rho_{X,Y} = \frac{\text{Cov}(X,Y)}{\sqrt{D(X)D(Y)}} = \text{Cov}(X,Y) = E(XY)。
二维正态分布的 E(XY) = \rho。
最终答案:\rho_{X,Y} = \rho
定理/公式
协方差的性质:
- \text{Cov}(X, Y) = \text{Cov}(Y, X)
- \text{Cov}(aX, bY) = ab \text{Cov}(X, Y)
- \text{Cov}(X+Y, Z) = \text{Cov}(X, Z) + \text{Cov}(Y, Z)
- \text{Cov}(aX+bY, cX+dY) = ac D(X) + (ad+bc)\text{Cov}(X,Y) + bd D(Y)
- D(aX + bY) = a^2 D(X) + 2ab \text{Cov}(X,Y) + b^2 D(Y)
定理/公式
Cauchy-Schwarz 不等式:
【推导过程】:考虑 D(X + t Y) = E[(X + t Y - E(X) - t E(Y))^2] \ge 0 对于任意实数 t。
令 u = X - E(X), v = Y - E(Y),则 D(X + t Y) = E[(u + t v)^2] = E(u^2) + 2t E(uv) + t^2 E(v^2) \ge 0。
这是一个关于 t 的二次函数非负,所以其判别式 \Delta = [2E(uv)]^2 - 4 E(u^2) E(v^2) \le 0。
即 [E(uv)]^2 \le E(u^2) E(v^2),也就是 [\text{Cov}(X,Y)]^2 \le D(X) D(Y)。
相关系数的性质:
- |\rho_{X,Y}| \le 1
- |\rho_{X,Y}| = 1 的充要条件是:存在常数 a, b (a \ne 0) 使得 P(Y = a X + b) = 1
- 当 \rho_{X,Y} = 1 时,a > 0,正线性相关
- 当 \rho_{X,Y} = -1 时,a < 0,负线性相关
- 若 \rho_{X,Y} = 0,则称 X 与 Y 不相关
- D(X + t^* Y) = D(X) (1 - \rho_{X,Y}^2),其中 t^* = -\frac{\text{Cov}(X,Y)}{D(Y)}。这表明 |\rho_{X,Y}| 的大小反映了 X 和 Y 的线性关系的强弱
定理/公式
不相关的等价命题:
X 与 Y 不相关 \iff \rho_{X,Y} = 0 \iff \text{Cov}(X,Y)=0 \iff E(XY) = E(X)E(Y) \iff D(X+Y) = D(X) + D(Y)。
独立与不相关的关系:
- 若 X 与 Y 相互独立,则 X 与 Y 不相关。反之不一定成立
- 对于二维正态分布 (X,Y) \sim N(\mu_1, \sigma_1^2; \mu_2, \sigma_2^2; \rho),X 与 Y 相互独立 \iff X 与 Y 不相关 (\rho=0)
第三部分:习题与总结
课后习题解答
- 习题四:1, 4, 5, 10, 13, 17, 19, 20, 22, 28, 29, 31 (具体题目未提供,故无法解答)
本章总结
本章介绍了随机变量的四个核心数字特征:数学期望、方差、协方差和相关系数。数学期望描述了随机变量的平均取值水平,是加权平均的概念。方差则衡量了随机变量取值围绕其均值的波动程度或不确定性。协方差和相关系数则将视角扩展到两个随机变量,刻画它们之间的线性相关关系;协方差反映了相关的方向,而相关系数则进一步消除了量纲,反映了相关的强度。这些数字特征为我们理解和分析随机现象提供了强有力的工具,例如在风险评估、最优决策、数据相关性分析等领域都有广泛的应用。掌握这些概念的计算、性质以及它们之间的区别与联系,是深入学习概率论与数理统计的基础。
默认评论
Halo系统提供的评论