概率统计第二章

FengYuchen
2025-11-12
点 赞
0
热 度
6
评 论
0

文章摘要

智阅GPT

第二章 随机变量及其分布

2.1 随机变量的概念

随机变量的定义

随机变量是将样本空间中的每个样本点映射到实数的函数。设 E 为随机试验,(\Omega, \mathcal{F}, P) 为其概率空间,则随机变量 X 是定义在 \Omega 上的实值函数:

X: \Omega \to \mathbb{R}

满足对任意实数 x,集合 \{\omega : X(\omega) \leq x\} 都属于 \sigma-代数 \mathcal{F}

引例:掷一枚均匀硬币 5 次,样本空间为:

\Omega = \{HHHHH, THHHH, HTHHH, \dots, TTTTT\}

定义 X(\omega) 为正面朝上的次数,则 X 是随机变量。

案例 1:考查某超市的支付方式,样本空间 \Omega = \{现金支付, 微信支付, 支付宝\},其中现金支付占 20%,微信支付占 45%,支付宝支付占 35%。定义:

X(\omega) = \begin{cases} 0 & \omega = \text{现金支付} \\ 1 & \omega = \text{微信支付} \\ 2 & \omega = \text{支付宝支付} \end{cases}

X(\Omega, \mathcal{F}, P) 上的随机变量。

随机变量的分类

  • 离散型随机变量:可能取值为有限个或可列无穷多个
  • 非离散型随机变量:其中最重要类型为连续型随机变量
    本课程主要讨论离散型与连续型随机变量。

分布函数的定义

X(\Omega, \mathcal{F}, P) 上的随机变量,对每个实数 x,定义:

F(x) := P(X \leq x)

F(x) 为随机变量 X分布函数

案例 1(续):在超市支付案例中,求 X 的分布函数。
解答
由定义 F(x) = P(X \leq x),结合概率分布:

  • x < 0 时,P(X \leq x) = 0
  • 0 \leq x < 1 时,P(X \leq x) = P(X = 0) = 0.2
  • 1 \leq x < 2 时,P(X \leq x) = P(X = 0) + P(X = 1) = 0.2 + 0.45 = 0.65
  • x \geq 2 时,P(X \leq x) = 1
    因此:
F(x) = \begin{cases} 0 & x < 0 \\ 0.2 & 0 \leq x < 1 \\ 0.65 & 1 \leq x < 2 \\ 1 & x \geq 2 \end{cases}

分布函数的性质

  1. 单调性\forall x_1 < x_2,有 F(x_1) \leq F(x_2)

  2. 右连续性\lim_{\varepsilon \to 0^+} F(x + \varepsilon) = F(x)

  3. 极限性质

    \lim_{x \to -\infty} F(x) = 0, \quad \lim_{x \to +\infty} F(x) = 1

    0 \leq F(x) \leq 1 对所有 x 成立

重要结论:任意函数 G(x) 满足上述三条性质,均可作为某个随机变量的分布函数。

分布函数的概率计算

设随机变量 X 的分布函数为 F(x),则对任意 a < b

P(a < X \leq b) = F(b) - F(a)
P(a < X < b) = F(b-0) - F(a)
P(a \leq X < b) = F(b-0) - F(a-0)
P(X = a) = F(a) - F(a-0) = \lim_{\varepsilon \to 0^+} P(a - \varepsilon < X \leq a)

其中 F(x-0) = \lim_{\varepsilon \to 0^+} F(x - \varepsilon) 表示左极限。


2.2 离散型随机变量及其分布

离散型随机变量的定义

设随机变量 X 的可能取值为有限多个或可列无穷多个,则称 X离散型随机变量

分布列(分布律)

X 的可能取值为 x_1, x_2, \dots,则其概率分布可表示为:

X x_1 x_2 \cdots x_k \cdots
P p_1 p_2 \cdots p_k \cdots

其中 P(X = x_k) = p_k 称为分布列分布律,满足:

  1. p_k \geq 0, k = 1, 2, \dots
  2. \sum_{k} p_k = 1

重要性质:任意给定 p_k 满足上述两条性质,均可作为分布律。

分布函数与分布列的关系

对于离散型随机变量:

F(x) = P(X \leq x) = \sum_{x_k \leq x} P(X = x_k)

且在 X 的可能取值 x_k 处:

P(X = x_k) = F(x_k) - F(x_k - 0)

分布函数 F(x)分段阶梯函数,在 x_k 处有跳跃间断点,跃度为 p_k

常见离散分布

(1) 0-1 分布(两点分布)

设随机变量 X 的分布律为:

X 0 1
P q p

其中 p + q = 10 < p < 1,则称 X 服从参数为 p0-1 分布,记作 X \sim B(1, p)
其分布律可写为:

P(X = k) = p^k (1 - p)^{1 - k}, \quad k = 0, 1

应用场景:抛硬币、新生儿性别、设备故障检测等只有两种结果的试验。

(2) 二项分布

n 重伯努利试验中,事件 A 发生的概率为 P(A) = p (0 < p < 1),X 表示 A 发生的次数,则 X 服从参数为 n, p二项分布,记作 X \sim B(n, p),其分布律为:

P(X = k) = C_n^k p^k (1 - p)^{n - k}, \quad k = 0, 1, 2, \dots, n

其中 C_n^k = \binom{n}{k} 为组合数。

:0-1 分布是 n = 1 时的特例。

二项分布的特性

  • (n+1)p 为整数时,在 k = (n+1)pk = (n+1)p - 1 处概率取得最大值
  • (n+1)p 非整数时,在 k = \lfloor (n+1)p \rfloor 处概率最大
  • 固定 p 时,随着 n 增大,分布趋于对称

例题 1(几何分布):独立重复进行某随机试验,每次成功概率为 p,设 X 为首次成功所需的试验次数。求 X 的分布列。
解答
X 的可能取值为 1, 2, 3, \dots,事件 \{X = k\} 表示前 k-1 次失败且第 k 次成功,因此:

P(X = k) = (1 - p)^{k - 1} p, \quad k = 1, 2, 3, \dots

X 服从几何分布

案例 2:某网络游戏中击杀怪物可能掉落装备 A_1A_2(概率各 10%)或不掉落(80%)。收集齐 A_1A_2 各一件可合成套装。设 X 为合成一件套装所需击杀次数,求 X 的分布列。
解答
X 的可能取值为 2, 3, 4, \dots。事件 \{X = n\} 表示:

  • n-1 次中只掉落一种装备(且至少掉落一次),且第 n 次掉落缺失的装备。

B 为前 n-1 次只掉落 A_1 的事件,则:

P(B) = P(\text{每次掉落 } A_1 \text{ 或不掉落})^{n-1} - P(\text{全不掉落}) = (0.1 + 0.8)^{n-1} - (0.8)^{n-1} = (0.9)^{n-1} - (0.8)^{n-1}

同理,前 n-1 次只掉落 A_2 的概率也为 (0.9)^{n-1} - (0.8)^{n-1}
n 次掉落缺失装备的概率为 0.1,因此:

P(X = n) = 2 \left[ (0.9)^{n-1} - (0.8)^{n-1} \right] \times 0.1, \quad n = 2, 3, 4, \dots
(3) 泊松分布

泊松定理:若 \lim_{n \to \infty} np_n = \lambda > 0,则对固定 k = 0, 1, 2, \dots

\lim_{n \to \infty} C_n^k p_n^k (1 - p_n)^{n - k} = \frac{\lambda^k}{k!} e^{-\lambda}

n 较大、p 较小且 np = \lambda 适中时(如 n \geq 20, p \leq 0.05n \geq 100, np \leq 10),可用泊松分布近似二项分布:

P(X = k) \approx \frac{\lambda^k}{k!} e^{-\lambda}, \quad k = 0, 1, 2, \dots

定义:若随机变量 X 的分布律为:

P(X = k) = \frac{\lambda^k}{k!} e^{-\lambda}, \quad k = 0, 1, 2, \dots

其中 \lambda > 0,则称 X 服从参数为 \lambda泊松分布,记作 X \sim P(\lambda)X \sim \text{Poi}(\lambda)

应用场景:单位时间内的顾客数、容器中细菌数、交通事故次数等稀有事件计数。

案例:设有 90 台同类型设备,每台故障概率 0.01,相互独立。一台设备故障需一人维修,每人仅能修一台。比较“3 人共同负责 90 台”与“3 人各负责 30 台”两种方案下设备故障不能及时维修的概率。
解答
(1) 3 人共同负责 90 台
X 为故障设备数,则 X \sim B(90, 0.01)。不能及时维修当且仅当 X > 3,其概率为:

P(X > 3) = 1 - \sum_{k=0}^{3} C_{90}^k (0.01)^k (0.99)^{90 - k}

用泊松近似 \lambda = np = 90 \times 0.01 = 0.9

P(X > 3) \approx 1 - e^{-0.9} \left( 1 + 0.9 + \frac{0.9^2}{2!} + \frac{0.9^3}{3!} \right) = 1 - e^{-0.9} (1 + 0.9 + 0.405 + 0.1215) \approx 0.0135

(2) 3 人各负责 30 台
X_i 为第 i 人负责区域的故障设备数,则 X_i \sim B(30, 0.01)。第 i 人不能及时维修当 X_i > 1(因仅能修一台),其概率为:

P(X_i > 1) = 1 - P(X_i = 0) - P(X_i = 1)

用泊松近似 \lambda = 30 \times 0.01 = 0.3

P(X_i > 1) \approx 1 - e^{-0.3} (1 + 0.3) \approx 1 - 0.7408 = 0.2592

整个系统不能及时维修当至少一人无法及时维修,概率为:

P(\text{系统故障}) = 1 - [1 - P(X_i > 1)]^3 \approx 1 - (0.7408)^3 \approx 1 - 0.406 = 0.594

结论:共同负责方案概率更低(0.0135 < 0.594),应选择共同负责。

案例:某网店商品日点击顾客数 N \sim \text{Poi}(\lambda),点击后购买概率为 p。求日购买顾客数 X 的分布。
解答
X 的可能取值为 0, 1, 2, \dots,由全概率公式:

P(X = k) = \sum_{n=k}^{\infty} P(N = n) P(X = k \mid N = n)

其中 P(X = k \mid N = n) = C_n^k p^k (1 - p)^{n - k}(二项分布),代入:

\begin{align*} P(X = k) &= \sum_{n=k}^{\infty} e^{-\lambda} \frac{\lambda^n}{n!} \cdot \frac{n!}{k! (n - k)!} p^k (1 - p)^{n - k} \\ &= e^{-\lambda} \frac{p^k}{k!} \sum_{m=0}^{\infty} \frac{\lambda^{k + m}}{m!} (1 - p)^m \quad (\text{令 } m = n - k) \\ &= e^{-\lambda} \frac{(\lambda p)^k}{k!} e^{\lambda (1 - p)} \\ &= e^{-\lambda p} \frac{(\lambda p)^k}{k!} \end{align*}

X \sim \text{Poi}(\lambda p),即泊松分布的可加性


2.3 连续型随机变量及其分布

连续型随机变量的定义

X 为随机变量,其分布函数为 F(x)。若存在非负可积函数 f(x) 使得:

F(x) = \int_{-\infty}^{x} f(t) dt, \quad -\infty < x < +\infty

则称 X连续型随机变量f(x) 称为概率密度函数(简称密度函数)。

密度函数的性质

  1. 非负性f(x) \geq 0,对所有 x
  2. 归一性
    \int_{-\infty}^{+\infty} f(t) dt = 1
  3. 导数关系:在 f(x) 的连续点 x_0 处:
    f(x_0) = F'(x_0)
  4. 概率计算:对任意 a < b
    P(a < X \leq b) = P(a \leq X \leq b) = P(a < X < b) = \int_{a}^{b} f(t) dt
  5. 单点概率:对任意 aP(X = a) = 0

:连续型随机变量的分布函数 F(x) 处处连续,而密度函数 f(x) 在非连续点可能不唯一。

例题:设随机变量 X 的密度函数为:

f(x) = \begin{cases} c x (1 - x) & x \in [0, 1] \\ 0 & \text{其他} \end{cases}

(1) 求常数 c
(2) 求 P(X \in [0.4, 0.6])
(3) 设 Y 为 3 次独立观测中 "X \in [0.4, 0.6]" 发生的次数,求 P(Y = 1)
解答
(1) 由归一性:

\int_{-\infty}^{\infty} f(x) dx = \int_{0}^{1} c x (1 - x) dx = c \int_{0}^{1} (x - x^2) dx = c \left[ \frac{x^2}{2} - \frac{x^3}{3} \right]_{0}^{1} = c \left( \frac{1}{2} - \frac{1}{3} \right) = \frac{c}{6} = 1

解得 c = 6

(2) 计算概率:

P(0.4 \leq X \leq 0.6) = \int_{0.4}^{0.6} 6x(1 - x) dx = 6 \left[ \frac{x^2}{2} - \frac{x^3}{3} \right]_{0.4}^{0.6} = 6 \left( \left( \frac{0.36}{2} - \frac{0.216}{3} \right) - \left( \frac{0.16}{2} - \frac{0.064}{3} \right) \right) = 0.312

(3) 设事件 A = \{X \in [0.4, 0.6]\},则 P(A) = p = 0.312Y \sim B(3, p),故:

P(Y = 1) = C_3^1 p (1 - p)^2 = 3 \times 0.312 \times (1 - 0.312)^2 \approx 3 \times 0.312 \times 0.472 \approx 0.441

常见连续分布

(1) 均匀分布

X 的密度函数为:

f(x) = \begin{cases} \frac{1}{b - a} & a < x < b \\ 0 & \text{其他} \end{cases}

则称 X 服从区间 (a, b) 上的均匀分布,记作 X \sim U(a, b)

分布函数

F(x) = \begin{cases} 0 & x \leq a \\ \frac{x - a}{b - a} & a < x < b \\ 1 & x \geq b \end{cases}

[图:均匀分布密度函数和分布函数示意图]

(2) 指数分布

X 的密度函数为:

f(x) = \begin{cases} \lambda e^{-\lambda x} & x > 0 \\ 0 & x \leq 0 \end{cases}

其中 \lambda > 0,则称 X 服从参数为 \lambda指数分布,记作 X \sim E(\lambda)

分布函数

F(x) = \begin{cases} 1 - e^{-\lambda x} & x > 0 \\ 0 & x \leq 0 \end{cases}

无记忆性:对任意 s, t > 0

P(X > s + t \mid X > s) = P(X > t)

证明:

P(X > s + t \mid X > s) = \frac{P(X > s + t)}{P(X > s)} = \frac{e^{-\lambda (s + t)}}{e^{-\lambda s}} = e^{-\lambda t} = P(X > t)

此性质说明指数分布具有"永远年轻"的特性。

案例(酒店订单):设 N(t) 为长为 t 小时内的订单数,N(t) \sim \text{Poi}(\lambda t)。求相继两个订单的时间间隔 T 的分布。
解答
由泊松过程性质,T > t 当且仅当 [0, t] 内无订单,即:

P(T > t) = P(N(t) = 0) = e^{-\lambda t}

故分布函数:

F_T(t) = P(T \leq t) = 1 - e^{-\lambda t}, \quad t > 0

因此 T \sim E(\lambda)

(3) 正态分布

X 的密度函数为:

f(x) = \frac{1}{\sqrt{2\pi} \sigma} \exp\left(-\frac{(x - \mu)^2}{2\sigma^2}\right), \quad -\infty < x < +\infty

其中 \mu \in \mathbb{R}, \sigma > 0,则称 X 服从参数为 \mu, \sigma^2正态分布,记作 X \sim N(\mu, \sigma^2)

标准正态分布:当 \mu = 0, \sigma = 1 时,记作 X \sim N(0, 1),其密度函数和分布函数为:

\phi(x) = \frac{1}{\sqrt{2\pi}} e^{-x^2 / 2}, \quad \Phi(x) = \int_{-\infty}^{x} \phi(t) dt

\Phi(x) 的值可通过标准正态分布表查询,且满足 \Phi(-x) = 1 - \Phi(x)

标准化:若 X \sim N(\mu, \sigma^2),则:

Z = \frac{X - \mu}{\sigma} \sim N(0, 1)

因此:

P(a < X < b) = \Phi\left( \frac{b - \mu}{\sigma} \right) - \Phi\left( \frac{a - \mu}{\sigma} \right)

案例:某人群(40~50 岁)正常人空腹血糖指标 X \sim N(5.5, 0.4^2)。求血糖偏高概率 P(X > 6.2)
解答
标准化:

P(X > 6.2) = P\left( Z > \frac{6.2 - 5.5}{0.4} \right) = P(Z > 1.75) = 1 - \Phi(1.75)

查表得 \Phi(1.75) = 0.9599,故:

P(X > 6.2) = 1 - 0.9599 = 0.0401

案例(混合高斯模型):某人群中糖尿病人占 17%,正常人血糖指标 X \sim N(5.5, 0.4^2),糖尿病人血糖指标 X \sim N(6.9, 0.51^2)。求任取一人的血糖密度函数。
解答
A 为"任取人为糖尿病人",则 P(A) = 0.17P(A^c) = 0.83。由全概率公式:

f_X(x) = f_{X \mid A^c}(x) P(A^c) + f_{X \mid A}(x) P(A)

其中:

f_{X \mid A^c}(x) = \frac{1}{\sqrt{2\pi} \cdot 0.4} \exp\left(-\frac{(x - 5.5)^2}{2 \cdot 0.4^2}\right), \quad f_{X \mid A}(x) = \frac{1}{\sqrt{2\pi} \cdot 0.51} \exp\left(-\frac{(x - 6.9)^2}{2 \cdot 0.51^2}\right)

因此:

f_X(x) = 0.83 \cdot \frac{1}{0.4\sqrt{2\pi}} e^{-(x-5.5)^2 / 0.32} + 0.17 \cdot \frac{1}{0.51\sqrt{2\pi}} e^{-(x-6.9)^2 / 0.5202}

案例(贝叶斯医学诊断):同上设定,已知某人血糖指标 X = 6.1,求患糖尿病概率 P(A \mid X = 6.1)
解答
由贝叶斯公式:

P(A \mid X = 6.1) = \frac{f_{X \mid A}(6.1) P(A)}{f_X(6.1)}

计算:

  • f_{X \mid A^c}(6.1) = \frac{1}{0.4\sqrt{2\pi}} \exp\left(-\frac{(6.1 - 5.5)^2}{2 \cdot 0.4^2}\right) = \frac{1}{0.4\sqrt{2\pi}} e^{-1.125} \approx 0.482
  • f_{X \mid A}(6.1) = \frac{1}{0.51\sqrt{2\pi}} \exp\left(-\frac{(6.1 - 6.9)^2}{2 \cdot 0.51^2}\right) = \frac{1}{0.51\sqrt{2\pi}} e^{-1.235} \approx 0.463
  • f_X(6.1) = 0.83 \times 0.482 + 0.17 \times 0.463 \approx 0.478
  • P(A \mid X = 6.1) = \frac{0.463 \times 0.17}{0.478} \approx 0.164

因此,患糖尿病概率约为 16.4%。


2.4 随机变量函数的分布

问题描述

已知随机变量 X 的分布,Y = g(X),求 Y 的分布。

离散型情形

直接转换:若 X 取值 x_k 概率为 p_k,则 Y = g(x_k) 的概率为:

P(Y = y_j) = \sum_{\{k : g(x_k) = y_j\}} p_k

例题:已知 X 的概率分布为:

X -1 0 1 2
P 1/8 1/8 1/4 1/2

Y = X^2 的分布律。
解答
Y 的可能取值及对应概率:

  • Y = 0X = 0P(Y = 0) = P(X = 0) = 1/8
  • Y = 1X = -1X = 1P(Y = 1) = P(X = -1) + P(X = 1) = 1/8 + 1/4 = 3/8
  • Y = 4X = 2P(Y = 4) = P(X = 2) = 1/2
    Y 的分布律为:
    Y 0 1 4
    P 1/8 3/8 1/2

连续型情形

一般方法
  1. 先求 Y 的分布函数 F_Y(y) = P(g(X) \leq y)
  2. 再求密度函数 f_Y(y) = F_Y'(y)(在 F_Y 可导处)
单调函数情形

定理:设 X 的密度函数为 f_X(x)g(x)(-\infty, +\infty) 内严格单调可导函数,则 Y = g(X) 的密度函数为:

f_Y(y) = f_X(h(y)) \left| h'(y) \right|

其中 h(y) = g^{-1}(y) 为反函数,y 的取值范围为 (\alpha, \beta)\alpha = \min\{g(-\infty), g(+\infty)\}\beta = \max\{g(-\infty), g(+\infty)\}

重要特例
  • 线性变换:若 Y = aX + b (a \neq 0),则:
    f_Y(y) = \frac{1}{|a|} f_X\left( \frac{y - b}{a} \right)
  • 正态分布的线性变换:若 X \sim N(\mu, \sigma^2),则 Y = aX + b \sim N(a\mu + b, a^2 \sigma^2)
  • 标准化:若 X \sim N(\mu, \sigma^2),则 Z = \frac{X - \mu}{\sigma} \sim N(0, 1)

案例(分子动能):气体分子速度 X 服从麦克斯韦分布:

f_X(x) = \frac{2}{\sqrt{\pi} \sigma^3} x^2 e^{-x^2 / (2\sigma^2)}, \quad x > 0

动能 Y = \frac{1}{2} m X^2m 为质量),求 Y 的分布。
解答
YX 的单调函数(x > 0g(x) = \frac{1}{2} m x^2 严格增),反函数 x = h(y) = \sqrt{2y / m},导数 h'(y) = \frac{1}{\sqrt{2 m y}}
由定理:

f_Y(y) = f_X(h(y)) \left| h'(y) \right| = \frac{2}{\sqrt{\pi} \sigma^3} \left( \frac{2y}{m} \right) e^{-y / (m \sigma^2)} \cdot \frac{1}{\sqrt{2 m y}}, \quad y > 0

化简:

f_Y(y) = \frac{2}{\sqrt{2 \pi m} \sigma^3} \sqrt{\frac{2y}{m}} e^{-y / (m \sigma^2)} = \sqrt{\frac{2}{\pi m}} \frac{1}{\sigma^3} \sqrt{y} e^{-y / (m \sigma^2)}

例题:设 X 的分布函数 F(x) 为严格单调连续函数,求 Y = F(X) 的分布函数。
解答
F(x) 单调增且值域 [0,1]Y 的分布函数:

F_Y(y) = P(Y \leq y) = P(F(X) \leq y)

F 严格增,存在反函数 F^{-1},故:

F_Y(y) = P(X \leq F^{-1}(y)) = F(F^{-1}(y)) = y, \quad 0 \leq y \leq 1

因此 F_Y(y) = y0 \leq y \leq 1),即 Y \sim U(0, 1)
重要结论:对任意连续型随机变量 XF(X) \sim U(0, 1)

例题:设 U \sim U(0, 1)F(y) = 1 - e^{-\lambda y} (y \geq 0),令 Y = -\frac{1}{\lambda} \ln(1 - U),证明 Y \sim E(\lambda)
解答
F(y) = 1 - e^{-\lambda y}F^{-1}(u) = -\frac{1}{\lambda} \ln(1 - u)。由上例结论,Y = F^{-1}(U) 的分布函数为:

P(Y \leq y) = P(F^{-1}(U) \leq y) = P(U \leq F(y)) = F(y) = 1 - e^{-\lambda y}

Y \sim E(\lambda)
应用:此方法用于蒙特卡罗仿真,通过均匀分布生成任意分布的随机数。


用键盘敲击出的不只是字符,更是一段段生活的剪影、一个个心底的梦想。希望我的文字能像一束光,在您阅读的瞬间,照亮某个角落,带来一丝温暖与共鸣。

FengYuchen

estj 总经理

具有版权性

请您在转载、复制时注明本文 作者、链接及内容来源信息。 若涉及转载第三方内容,还需一同注明。

具有时效性

欢迎来到我的博客

29 文章数
8 分类数
2 评论数
10标签数