概率统计第四章

FengYuchen
2025-10-31
点 赞
0
热 度
4
评 论
0

文章摘要

智阅GPT

第一部分:知识框架

本章核心概念逻辑关系:

  • 数学期望 (Expectation):描述随机变量的平均值加权平均,是随机变量取值的中心
  • 方差 (Variance):描述随机变量取值与其数学期望的偏离程度的平均值,衡量随机变量的不确定性波动性
  • 协方差 (Covariance):描述两个随机变量协同变化的趋势,即它们之间的线性相关方向
  • 相关系数 (Correlation Coefficient):由协方差标准化得到,描述两个随机变量之间线性相关强度方向

逻辑关系:数学期望是基础,方差是基于数学期望定义的,协方差和相关系数则是基于数学期望和方差,用于描述两个随机变量之间的关系。


第二部分:详细内容

【4.1 数学期望】

定义

定义1 (离散型随机变量的数学期望):设离散型随机变量 X 的分布律为 P(X = x_k) = p_k, k=1,2,...。若无穷级数 \sum_{k=1}^{+\infty} x_k p_k 绝对收敛,则称 \sum_{k=1}^{+\infty} x_k p_k 为随机变量 X 的数学期望,记为 E(X)

E(X) = \sum_{k=1}^{+\infty} x_k p_k

定义2 (连续型随机变量的数学期望):设连续型随机变量 X 的概率密度为 f(x)。若积分 \int_{-\infty}^{+\infty} x f(x) dx 绝对收敛,则称 \int_{-\infty}^{+\infty} x f(x) dx 为随机变量 X 的数学期望。

E(X) := \int_{-\infty}^{+\infty} x f(x) dx

:数学期望反映了随机变量取值的平均值,它是一种加权平均。

例题

题目:设某网店某购物节期间的订单 X \sim \text{Poi}(\lambda),求 E(X)

解答
X 的分布律为 P(X=k) = \frac{\lambda^k}{k!} e^{-\lambda}, k=0,1,2,...

E(X) = \sum_{k=0}^{\infty} k \cdot \frac{\lambda^k}{k!} e^{-\lambda} = e^{-\lambda} \sum_{k=1}^{\infty} \frac{\lambda^k}{(k-1)!} = e^{-\lambda} \lambda \sum_{j=0}^{\infty} \frac{\lambda^j}{j!} = e^{-\lambda} \lambda e^{\lambda} = \lambda

最终答案E(X) = \lambda

题目:设 X 服从参数为 p 的几何分布,求 E(X)

解答
X 的分布律为 P(X=k) = (1-p)^{k-1} p, k=1,2,...

E(X) = \sum_{k=1}^{\infty} k (1-p)^{k-1} p = p \sum_{k=1}^{\infty} k (1-p)^{k-1}

S = \sum_{k=1}^{\infty} k (1-p)^{k-1},利用公式 \sum_{k=1}^{\infty} k r^{k-1} = \frac{1}{(1-r)^2} (对于 |r|<1):

S = \frac{1}{(1 - (1-p))^2} = \frac{1}{p^2}

因此,E(X) = p \cdot \frac{1}{p^2} = \frac{1}{p}

最终答案E(X) = \frac{1}{p}

题目:设某电子元件的寿命 X 服从参数为 \lambda 的指数分布,求该电子元件的平均寿命。

解答
X 的概率密度函数为 f(x) = \lambda e^{-\lambda x}, x>0

E(X) = \int_{0}^{+\infty} x \cdot \lambda e^{-\lambda x} dx

【推导过程】:使用分部积分法。
u = x, dv = \lambda e^{-\lambda x} dx,则 du = dx, v = -e^{-\lambda x}

E(X) = \left[ -x e^{-\lambda x} \right]_{0}^{+\infty} + \int_{0}^{+\infty} e^{-\lambda x} dx = 0 + \left[ -\frac{1}{\lambda} e^{-\lambda x} \right]_{0}^{+\infty} = \frac{1}{\lambda}

最终答案E(X) = \frac{1}{\lambda}

图表

常见分布的数学期望表 (离散型)

分布 概率分布 期望
参数为 p 的 0-1 分布 P(X=1)=p, P(X=0)=1-p p
B(n, p) P(X=k)=C_n^k p^k (1-p)^{n-k}, k=0,1,2,\cdots,n np
\text{Poi}(\lambda) P(X=k)=\frac{\lambda^k}{k!} e^{-\lambda}, k=0,1,2,\cdots \lambda
参数为 p 的几何分布 P(X=k)=p(1-p)^{k-1}, k=1,2,\cdots \frac{1}{p}

常见分布的数学期望表 (连续型)

分布 概率密度 期望
区间 [a,b] 上的均匀分布 f(x) = \begin{cases} \frac{1}{b-a}, & a0 \\ 0, & \text{其他} \end{cases} \frac{1}{\lambda}
N(\mu, \sigma^2) f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \mu

定理/公式

随机变量函数的数学期望定理

  • 设随机变量 YX 的连续函数,Y = g(X),且 E[g(X)] 存在。

    • X 是离散型随机变量,分布律为 P(X=x_k)=p_k,则 E[g(X)] = \sum_{k=1}^{+\infty} g(x_k) p_k
    • X 是连续型随机变量,概率密度为 f(x),则 E[g(X)] = \int_{-\infty}^{+\infty} g(x) f(x) dx
  • Z 是随机变量 X, Y 的函数 Z = g(X, Y),且 E[g(X,Y)] < +\infty

    • (X,Y) 是二维离散型随机变量,分布律为 P(X=x_i, Y=y_j)=p_{ij},则 E[Z] = E[g(X,Y)] = \sum_{i,j} g(x_i, y_j) p_{ij}
    • (X,Y) 是二维连续型随机变量,概率密度为 f(x,y),则 E[Z] = E[g(X,Y)] = \iint_{\mathbb{R}^2} g(x,y) f(x,y) dxdy

例题

题目:设二维随机变量 (X,Y) 的联合密度为 f(x,y) = \begin{cases} 3xy(x+y), & 0 \le x \le 1, 0 \le y \le 1 \\ 0, & \text{其他} \end{cases},试求 Z = X^2 Y 的数学期望。

解答
根据定理:

E(Z) = E(X^2 Y) = \iint_{\mathbb{R}^2} x^2 y \cdot f(x,y) dxdy = \int_{0}^{1} \int_{0}^{1} x^2 y \cdot 3xy(x+y) dxdy
= 3 \int_{0}^{1} \int_{0}^{1} x^3 y^2 (x+y) dxdy = 3 \int_{0}^{1} \int_{0}^{1} (x^4 y^2 + x^3 y^3) dxdy
= 3 \left[ \int_{0}^{1} x^4 dx \int_{0}^{1} y^2 dy + \int_{0}^{1} x^3 dx \int_{0}^{1} y^3 dy \right] = 3 \left[ \frac{1}{5} \cdot \frac{1}{3} + \frac{1}{4} \cdot \frac{1}{4} \right] = 3 \left( \frac{1}{15} + \frac{1}{16} \right) = 3 \cdot \frac{31}{240} = \frac{31}{80}

最终答案E(Z) = \frac{31}{80}

定理/公式

数学期望的性质
X, Y 是随机变量,a, b, c 是常数。

  1. X 的期望存在 \iff E|X| < +\infty
  2. X \le Y,则 E(X) \le E(Y)
  3. E(c) = c, E(cX) = c E(X)
  4. E(aX + bY + c) = a E(X) + b E(Y) + c
  5. X, Y 是两个相互独立的随机变量,则 E(XY) = E(X) E(Y)
  6. (线性性)设 X_1, \cdots, X_n 为任意 n 个数学期望存在的随机变量,则 \sum_{i=1}^{n} X_i 的数学期望也存在,且 E\left( \sum_{i=1}^{n} X_i \right) = \sum_{i=1}^{n} E(X_i)
  7. (独立性推广)若 X_i (i=1,2,\cdots,n) 相互独立,则 E\left( \prod_{i=1}^{n} X_i \right) = \prod_{i=1}^{n} E(X_i)

:性质 5 的逆命题不成立。即若 E(XY) = E(X)E(Y)XY 不一定独立。

例题

题目:将 4 个球随机地放入 4 个盒子中,每盒容纳的球数无限,求空盒子数的数学期望。

解答 (解法二)
利用指示随机变量和期望的线性性。
X_i = \begin{cases} 1, & \text{第 } i \text{ 个盒子为空} \\ 0, & \text{其他} \end{cases}, i=1,2,3,4
X = X_1 + X_2 + X_3 + X_4

E(X_i) = P(\text{第 } i \text{ 个盒子为空}) = \left( \frac{3}{4} \right)^4 = \frac{81}{256}

由期望的线性性:E(X) = E(X_1) + E(X_2) + E(X_3) + E(X_4) = 4 \times \frac{81}{256} = \frac{324}{256} = \frac{81}{64}

最终答案E(X) = \frac{81}{64}


【4.2 方差】

定义

方差的定义:设随机变量 X 满足 E(X^2) < \infty,则称 D(X) := E\left[ (X - E(X))^2 \right]X 的方差。

均方差 (标准差)\sigma_X = \sqrt{D(X)}

:方差反映了随机变量相对其均值的偏离程度。

定理/公式

方差的计算

  • 用定义计算

    • X 为离散型随机变量,分布律为 P(X=x_k)=p_k,则 D(X) = \sum_{k} (x_k - E(X))^2 p_k
    • X 为连续型随机变量,概率密度为 f(x),则 D(X) = \int_{-\infty}^{+\infty} (x - E(X))^2 f(x) dx
  • 常用计算公式

D(X) = E(X^2) - [E(X)]^2

【推导过程】

D(X) = E[(X - E(X))^2] = E[X^2 - 2X E(X) + (E(X))^2] = E(X^2) - 2E(X)E(X) + (E(X))^2 = E(X^2) - [E(X)]^2

例题

题目:设 X \sim \text{Poi}(\lambda),求 D(X)

解答
已知 E(X) = \lambda
需要计算 E(X^2)E(X^2) = E[X(X-1) + X] = E[X(X-1)] + E(X)

E[X(X-1)] = \sum_{k=0}^{\infty} k(k-1) \frac{\lambda^k}{k!} e^{-\lambda} = e^{-\lambda} \lambda^2 \sum_{k=2}^{\infty} \frac{\lambda^{k-2}}{(k-2)!} = e^{-\lambda} \lambda^2 e^{\lambda} = \lambda^2

所以 E(X^2) = \lambda^2 + \lambda
因此,D(X) = E(X^2) - [E(X)]^2 = (\lambda^2 + \lambda) - \lambda^2 = \lambda

最终答案D(X) = \lambda

题目:设 X \sim N(\mu, \sigma^2),求 D(X)

解答
D(X) = E[(X - \mu)^2] = \int_{-\infty}^{+\infty} (x - \mu)^2 \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} dx

【推导过程】:令 t = \frac{x - \mu}{\sigma},则 x = \mu + \sigma t, dx = \sigma dt

D(X) = \int_{-\infty}^{+\infty} (\sigma t)^2 \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{t^2}{2}} \sigma dt = \sigma^2 \int_{-\infty}^{+\infty} t^2 \frac{1}{\sqrt{2\pi}} e^{-\frac{t^2}{2}} dt

利用标准正态分布的二阶矩:E(Z^2) = D(Z) + [E(Z)]^2 = 1 + 0 = 1,其中 Z \sim N(0,1)
所以 \int_{-\infty}^{+\infty} t^2 \frac{1}{\sqrt{2\pi}} e^{-\frac{t^2}{2}} dt = 1
因此,D(X) = \sigma^2 \cdot 1 = \sigma^2

最终答案D(X) = \sigma^2

图表

常见随机变量的方差表 (离散型)

分布 概率分布 期望 方差
参数为 p 的 0-1 分布 P(X=1)=p, P(X=0)=1-p p p(1-p)
B(n, p) P(X=k)=C_n^k p^k (1-p)^{n-k} np np(1-p)
\text{Poi}(\lambda) P(X=k)=\frac{\lambda^k}{k!} e^{-\lambda} \lambda \lambda
参数为 p 的几何分布 P(X=k)=p(1-p)^{k-1} \frac{1}{p} \frac{1-p}{p^2}

常见随机变量的方差表 (连续型)

分布 概率密度 期望 方差
区间 [a,b] 上的均匀分布 f(x) = \begin{cases} \frac{1}{b-a}, & a0 \\ 0, & \text{其他} \end{cases} \frac{1}{\lambda} \frac{1}{\lambda^2}
N(\mu, \sigma^2) f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \mu \sigma^2

定理/公式

方差的性质
X, Y 是随机变量,c 是常数。

  1. D(X) 存在 \iff E(X^2) < +\infty
  2. D(c) = 0
  3. D(cX) = c^2 D(X)
  4. X, Y 是相互独立的随机变量,则 D(X \pm Y) = D(X) + D(Y)
  5. 对任意常数 a,有 D(X) \le E[(X-a)^2],且等号当且仅当 a = E(X) 时成立

推广:设 X_1, ..., X_n 相互独立,且 D(X_i) 存在,则 D\left( \sum_{i=1}^{n} c_i X_i \right) = \sum_{i=1}^{n} c_i^2 D(X_i)

:如果 D(X)=0,则 X 以概率 1 等于常数 c(即 P(X=c)=1)。

定义

标准化随机变量:设随机变量 X 的二阶矩存在,且 D(X) > 0,则称 X^* = \frac{X - E(X)}{\sqrt{D(X)}}X 的标准化随机变量。

显然,E(X^*) = 0, D(X^*) = 1


【4.3 协方差和相关系数】

定义

协方差的定义:若 E(X^2) < +\infty, E(Y^2) < +\infty,称 \text{Cov}(X, Y) = E\left[ (X - E(X))(Y - E(Y)) \right]X, Y 的协方差。

相关系数的定义:若 D(X) > 0, D(Y) > 0,称 \rho_{X,Y} = \frac{\text{Cov}(X, Y)}{\sqrt{D(X) D(Y)}}X, Y 的相关系数。

协方差矩阵:称 \begin{pmatrix} D(X) & \text{Cov}(X,Y) \\ \text{Cov}(Y,X) & D(Y) \end{pmatrix}(X,Y) 的协方差矩阵。

定理/公式

协方差和相关系数的计算

  • 用定义计算

    • (X,Y) 为离散型,分布律为 P(X=x_i, Y=y_j)=p_{ij},则 \text{Cov}(X,Y) = \sum_{i,j} (x_i - E(X))(y_j - E(Y)) p_{ij}
    • (X,Y) 为连续型,联合密度为 f(x,y),则 \text{Cov}(X,Y) = \iint_{\mathbb{R}^2} (x - E(X))(y - E(Y)) f(x,y) dxdy
  • 用公式计算

\text{Cov}(X, Y) = E(XY) - E(X)E(Y)

【推导过程】

\text{Cov}(X, Y) = E[(X - E(X))(Y - E(Y))] = E[XY - X E(Y) - Y E(X) + E(X)E(Y)] = E(XY) - E(X)E(Y) - E(Y)E(X) + E(X)E(Y) = E(XY) - E(X)E(Y)

例题

题目:设 X, Y \sim N(0,1; 0,1; \rho),求 \rho_{X,Y}

解答
易知 E(X)=E(Y)=0, D(X)=D(Y)=1
所以 \rho_{X,Y} = \frac{\text{Cov}(X,Y)}{\sqrt{D(X)D(Y)}} = \text{Cov}(X,Y) = E(XY)
二维正态分布的 E(XY) = \rho

最终答案\rho_{X,Y} = \rho

定理/公式

协方差的性质

  • \text{Cov}(X, Y) = \text{Cov}(Y, X)
  • \text{Cov}(aX, bY) = ab \text{Cov}(X, Y)
  • \text{Cov}(X+Y, Z) = \text{Cov}(X, Z) + \text{Cov}(Y, Z)
  • \text{Cov}(aX+bY, cX+dY) = ac D(X) + (ad+bc)\text{Cov}(X,Y) + bd D(Y)
  • D(aX + bY) = a^2 D(X) + 2ab \text{Cov}(X,Y) + b^2 D(Y)

定理/公式

Cauchy-Schwarz 不等式

|\text{Cov}(X, Y)|^2 \le D(X) D(Y)

【推导过程】:考虑 D(X + t Y) = E[(X + t Y - E(X) - t E(Y))^2] \ge 0 对于任意实数 t
u = X - E(X), v = Y - E(Y),则 D(X + t Y) = E[(u + t v)^2] = E(u^2) + 2t E(uv) + t^2 E(v^2) \ge 0
这是一个关于 t 的二次函数非负,所以其判别式 \Delta = [2E(uv)]^2 - 4 E(u^2) E(v^2) \le 0
[E(uv)]^2 \le E(u^2) E(v^2),也就是 [\text{Cov}(X,Y)]^2 \le D(X) D(Y)

相关系数的性质

  • |\rho_{X,Y}| \le 1
  • |\rho_{X,Y}| = 1 的充要条件是:存在常数 a, b (a \ne 0) 使得 P(Y = a X + b) = 1
    • \rho_{X,Y} = 1 时,a > 0,正线性相关
    • \rho_{X,Y} = -1 时,a < 0,负线性相关
  • \rho_{X,Y} = 0,则称 XY 不相关
  • D(X + t^* Y) = D(X) (1 - \rho_{X,Y}^2),其中 t^* = -\frac{\text{Cov}(X,Y)}{D(Y)}。这表明 |\rho_{X,Y}| 的大小反映了 XY 的线性关系的强弱

定理/公式

不相关的等价命题
XY 不相关 \iff \rho_{X,Y} = 0 \iff \text{Cov}(X,Y)=0 \iff E(XY) = E(X)E(Y) \iff D(X+Y) = D(X) + D(Y)

独立与不相关的关系

  • XY 相互独立,则 XY 不相关。反之不一定成立
  • 对于二维正态分布 (X,Y) \sim N(\mu_1, \sigma_1^2; \mu_2, \sigma_2^2; \rho)XY 相互独立 \iff XY 不相关 (\rho=0)

第三部分:习题与总结

课后习题解答

  • 习题四:1, 4, 5, 10, 13, 17, 19, 20, 22, 28, 29, 31 (具体题目未提供,故无法解答)

本章总结

本章介绍了随机变量的四个核心数字特征:数学期望、方差、协方差和相关系数。数学期望描述了随机变量的平均取值水平,是加权平均的概念。方差则衡量了随机变量取值围绕其均值的波动程度或不确定性。协方差和相关系数则将视角扩展到两个随机变量,刻画它们之间的线性相关关系;协方差反映了相关的方向,而相关系数则进一步消除了量纲,反映了相关的强度。这些数字特征为我们理解和分析随机现象提供了强有力的工具,例如在风险评估、最优决策、数据相关性分析等领域都有广泛的应用。掌握这些概念的计算、性质以及它们之间的区别与联系,是深入学习概率论与数理统计的基础。


用键盘敲击出的不只是字符,更是一段段生活的剪影、一个个心底的梦想。希望我的文字能像一束光,在您阅读的瞬间,照亮某个角落,带来一丝温暖与共鸣。

FengYuchen

estj 总经理

具有版权性

请您在转载、复制时注明本文 作者、链接及内容来源信息。 若涉及转载第三方内容,还需一同注明。

具有时效性

欢迎来到我的博客

26 文章数
8 分类数
2 评论数
10标签数