概率统计第四章

FengYuchen
2025-10-31
点 赞
0
热 度
15
评 论
0

文章摘要

智阅GPT

4.1 数学期望

定义

离散型随机变量的数学期望

设离散型随机变量 X 的分布律为:

\begin{array}{c|c|c|c|c} X & x_1 & x_2 & \cdots & x_k & \cdots \\ \hline P & p_1 & p_2 & \cdots & p_k & \cdots \end{array}

若无穷级数 \sum_{k=1}^{\infty} x_k p_k 绝对收敛,则称其为 X 的数学期望,记作:

E(X) = \sum_{k=1}^{\infty} x_k p_k

连续型随机变量的数学期望

设连续型随机变量 X 的概率密度函数为 f(x),若积分 \int_{-\infty}^{\infty} x f(x) dx 绝对收敛,则称其为 X 的数学期望:

E(X) = \int_{-\infty}^{\infty} x f(x) dx

:数学期望反映了随机变量取值的加权平均值。


典型分布的数学期望

离散型分布

分布 概率分布 期望
0-1 分布 P(X=1)=p,\ P(X=0)=1-p p
二项分布 B(n,p) P(X=k)=C_n^k p^k (1-p)^{n-k},\ k=0,1,\dots,n np
泊松分布 Poi(\lambda) P(X=k)=\frac{\lambda^k e^{-\lambda}}{k!},\ k=0,1,2,\dots \lambda
几何分布 P(X=k)=(1-p)^{k-1} p,\ k=1,2,\dots \frac{1}{p}

连续型分布

分布 概率密度函数 期望
均匀分布 U(a,b) f(x) = \begin{cases} \frac{1}{b-a}, & a < x < b \\ 0, & \text{其它} \end{cases} \frac{a+b}{2}
指数分布 E(\lambda) f(x) = \begin{cases} \lambda e^{-\lambda x}, & x > 0 \\ 0, & \text{其它} \end{cases} \frac{1}{\lambda}
正态分布 N(\mu,\sigma^2) f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \mu

例题解析

例题 1:泊松分布的期望

设随机变量 X \sim Poi(\lambda),求 E(X)

解答:
由泊松分布的定义,P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}

\begin{aligned} E(X) &= \sum_{k=0}^{\infty} k \cdot \frac{\lambda^k e^{-\lambda}}{k!} \\ &= e^{-\lambda} \sum_{k=1}^{\infty} k \cdot \frac{\lambda^k}{k!} \\ &= e^{-\lambda} \sum_{k=1}^{\infty} \frac{\lambda^k}{(k-1)!} \\ &= e^{-\lambda} \lambda \sum_{m=0}^{\infty} \frac{\lambda^m}{m!} \quad (\text{令 } m = k-1) \\ &= e^{-\lambda} \lambda e^{\lambda} \\ &= \lambda \end{aligned}

因此,E(X) = \lambda

例题 2:几何分布的期望

X 服从参数为 p 的几何分布,P(X=k)=(1-p)^{k-1}pk=1,2,\dots,求 E(X)

解答:

\begin{aligned} E(X) &= \sum_{k=1}^{\infty} k \cdot (1-p)^{k-1} p \\ &= p \sum_{k=1}^{\infty} k q^{k-1} \quad (\text{令 } q = 1-p) \\ &= p \cdot \frac{d}{dq} \left( \sum_{k=0}^{\infty} q^k \right) \\ &= p \cdot \frac{d}{dq} \left( \frac{1}{1-q} \right) \\ &= p \cdot \frac{1}{(1-q)^2} \\ &= p \cdot \frac{1}{p^2} \\ &= \frac{1}{p} \end{aligned}

因此,E(X) = \frac{1}{p}

例题 3:指数分布的期望

设某电子元件的寿命 X 服从参数为 \lambda 的指数分布,求平均寿命 E(X)

解答:
指数分布的概率密度函数为 f(x) = \lambda e^{-\lambda x} (x > 0),

\begin{aligned} E(X) &= \int_{0}^{\infty} x \cdot \lambda e^{-\lambda x} dx \\ &= \lambda \left[ -\frac{x}{\lambda} e^{-\lambda x} \right]_{0}^{\infty} + \int_{0}^{\infty} \frac{1}{\lambda} e^{-\lambda x} dx \quad (\text{分部积分}) \\ &= 0 + \frac{1}{\lambda} \left[ -e^{-\lambda x} \right]_{0}^{\infty} \\ &= \frac{1}{\lambda} \end{aligned}

因此,平均寿命为 \frac{1}{\lambda}

例题 4:麦克斯韦尔分布的期望

已知分子速度 X 服从麦克斯韦尔分布,概率密度函数为:

f(x) = \frac{4x^2}{a^3 \sqrt{\pi}} e^{-x^2 / a^2}, \quad x > 0

求平均速度 E(X)

解答:

\begin{aligned} E(X) &= \int_{0}^{\infty} x \cdot \frac{4x^2}{a^3 \sqrt{\pi}} e^{-x^2 / a^2} dx \\ &= \frac{4}{a^3 \sqrt{\pi}} \int_{0}^{\infty} x^3 e^{-x^2 / a^2} dx \\ &= \frac{4}{a^3 \sqrt{\pi}} \cdot \frac{a^4}{2} \int_{0}^{\infty} u e^{-u} du \quad (\text{令 } u = x^2 / a^2) \\ &= \frac{4}{a^3 \sqrt{\pi}} \cdot \frac{a^4}{2} \Gamma(2) \\ &= \frac{4}{a^3 \sqrt{\pi}} \cdot \frac{a^4}{2} \cdot 1 \\ &= \frac{2a}{\sqrt{\pi}} \end{aligned}

因此,平均速度为 \frac{2a}{\sqrt{\pi}}

例题 5:柯西分布的期望

若随机变量 X 服从柯西分布,概率密度函数为:

f(x) = \frac{1}{\pi} \frac{1}{1 + x^2}, \quad x \in (-\infty, \infty)

E(X)

解答:

E(X) = \int_{-\infty}^{\infty} x \cdot \frac{1}{\pi} \frac{1}{1 + x^2} dx

考虑绝对收敛性:

\int_{-\infty}^{\infty} |x| \cdot \frac{1}{\pi} \frac{1}{1 + x^2} dx = \frac{2}{\pi} \int_{0}^{\infty} \frac{x}{1 + x^2} dx

u = 1 + x^2,则 du = 2x dx,当 x=0u=1x \to \inftyu \to \infty

\int_{0}^{\infty} \frac{x}{1 + x^2} dx = \frac{1}{2} \int_{1}^{\infty} \frac{1}{u} du = \frac{1}{2} \left[ \ln u \right]_{1}^{\infty} = \infty

积分不绝对收敛,故 E(X) 不存在。


随机变量函数的数学期望

一维随机变量

Y = g(X),则:

  • 离散型:若 P(X = x_k) = p_k,则
    E[g(X)] = \sum_{k=1}^{\infty} g(x_k) p_k
  • 连续型:若 X 的概率密度为 f(x),则
    E[g(X)] = \int_{-\infty}^{\infty} g(x) f(x) dx

二维随机变量

Z = g(X, Y),则:

  • 离散型:若 P(X = x_i, Y = y_j) = p_{ij},则
    E[g(X, Y)] = \sum_{i,j} g(x_i, y_j) p_{ij}
  • 连续型:若 (X, Y) 的联合概率密度为 f(x, y),则
    E[g(X, Y)] = \iint_{\mathbb{R}^2} g(x, y) f(x, y) dx dy

例题解析(二维情形)

例题:二维随机变量函数的期望

设二维随机变量 (X, Y) 的联合概率密度为:

f(x, y) = \begin{cases} 3xy(x + y), & 0 \leq x \leq 1, 0 \leq y \leq 1 \\ 0, & \text{其它} \end{cases}

Z = X^2 Y 的数学期望 E(Z)

解答:
由二维连续型随机变量函数的期望公式:

\begin{aligned} E(Z) &= E(X^2 Y) = \iint_{\mathbb{R}^2} x^2 y \cdot f(x, y) dx dy \\ &= \int_{0}^{1} \int_{0}^{1} x^2 y \cdot 3xy(x + y) dx dy \\ &= 3 \int_{0}^{1} \int_{0}^{1} (x^4 y^2 + x^3 y^3) dx dy \\ &= 3 \int_{0}^{1} \left[ \frac{x^5 y^2}{5} + \frac{x^4 y^3}{4} \right]_{x=0}^{1} dy \\ &= 3 \int_{0}^{1} \left( \frac{y^2}{5} + \frac{y^3}{4} \right) dy \\ &= 3 \left[ \frac{y^3}{15} + \frac{y^4}{16} \right]_{0}^{1} \\ &= 3 \left( \frac{1}{15} + \frac{1}{16} \right) \\ &= 3 \left( \frac{16 + 15}{240} \right) = 3 \cdot \frac{31}{240} = \frac{93}{240} = \frac{31}{80} \end{aligned}

因此,E(Z) = \frac{31}{80}


数学期望的性质

  1. 线性性:设 X, Y 是随机变量,a, b, c 是常数,则

    E(aX + bY + c) = a E(X) + b E(Y) + c

    推广:对任意 n 个期望存在的随机变量 X_1, \dots, X_n

    E \left( \sum_{i=1}^{n} X_i \right) = \sum_{i=1}^{n} E(X_i)
  2. 常数期望E(c) = c,且 E(cX) = c E(X)

  3. 单调性:若 X \leq Y,则 E(X) \leq E(Y)

  4. 可积性X 的期望存在 \iff E(|X|) < +\infty

  5. 独立随机变量的乘积:若 X, Y 相互独立,则

    E(XY) = E(X) E(Y)

    推广:若 X_1, \dots, X_n 相互独立,则

    E \left( \prod_{i=1}^{n} X_i \right) = \prod_{i=1}^{n} E(X_i)

    注意E(XY) = E(X)E(Y) 不能推出 X, Y 独立。


例题解析(期望性质应用)

例题:空盒子数的期望

将 4 个球随机放入 4 个盒子中(每盒容量无限),求空盒子数 X 的数学期望。

解答(方法一):
X 为空盒子数,可能取值为 0,1,2,3

  • P(X=0):所有盒子非空(即双射),有 4! 种方式,
    P(X=0) = \frac{4!}{4^4} = \frac{24}{256} = \frac{3}{32}
  • P(X=1):选 1 个空盒 \binom{4}{1},其余 3 盒非空,
    P(X=1) = \binom{4}{1} \cdot \frac{3! \cdot S(4,3)}{4^4} = 4 \cdot \frac{6 \cdot 6}{256} = \frac{144}{256} = \frac{9}{16}
    (注:S(4,3) 为 Stirling 数,S(4,3)=6
  • P(X=2):选 2 个空盒 \binom{4}{2},其余 2 盒非空,
    P(X=2) = \binom{4}{2} \cdot \frac{2! \cdot S(4,2)}{4^4} = 6 \cdot \frac{2 \cdot 7}{256} = \frac{84}{256} = \frac{21}{64}
    S(4,2)=7
  • P(X=3):选 3 个空盒 \binom{4}{3},1 盒装 4 球,
    P(X=3) = \binom{4}{3} \cdot \frac{1}{4^4} = 4 \cdot \frac{1}{256} = \frac{4}{256} = \frac{1}{64}

\begin{aligned} E(X) &= 0 \cdot \frac{3}{32} + 1 \cdot \frac{9}{16} + 2 \cdot \frac{21}{64} + 3 \cdot \frac{1}{64} \\ &= 0 + \frac{36}{64} + \frac{42}{64} + \frac{3}{64} = \frac{81}{64} = 1.265625 \end{aligned}

解答(方法二):
定义指示随机变量:

X_i = \begin{cases} 1, & \text{第 } i \text{ 个盒子为空} \\ 0, & \text{否则} \end{cases}

X = X_1 + X_2 + X_3 + X_4
单个盒子为空的概率:P(X_i=1) = \left( \frac{3}{4} \right)^4 = \frac{81}{256}

E(X_i) = 1 \cdot \frac{81}{256} + 0 \cdot \frac{175}{256} = \frac{81}{256}

由期望的线性性,

E(X) = E\left( \sum_{i=1}^{4} X_i \right) = \sum_{i=1}^{4} E(X_i) = 4 \cdot \frac{81}{256} = \frac{324}{256} = \frac{81}{64}

结果与方法一一致。

例题:优惠券收集问题

掷一枚均匀骰子,平均要掷多少次才能使 6 个数字都至少出现一次?

解答:
X 为掷出 6 个点数的总次数,分解为:

X = X_0 + X_1 + X_2 + X_3 + X_4 + X_5

其中 X_0 = 1(第一次必得新点数),X_k 表示已有 k 个点数后,首次掷出第 (k+1) 个新点数所需的额外次数。

  • X_1 \sim \text{Geom}(p_1 = 5/6)E(X_1) = 6/5
  • X_2 \sim \text{Geom}(p_2 = 4/6)E(X_2) = 6/4
  • X_3 \sim \text{Geom}(p_3 = 3/6)E(X_3) = 6/3
  • X_4 \sim \text{Geom}(p_4 = 2/6)E(X_4) = 6/2
  • X_5 \sim \text{Geom}(p_5 = 1/6)E(X_5) = 6/1

由期望的线性性,

\begin{aligned} E(X) &= E(X_0) + \sum_{k=1}^{5} E(X_k) \\ &= 1 + \frac{6}{5} + \frac{6}{4} + \frac{6}{3} + \frac{6}{2} + \frac{6}{1} \\ &= 1 + 1.2 + 1.5 + 2 + 3 + 6 = 14.7 \end{aligned}

因此,平均需掷 14.7 次。


4.2 方差

定义与计算

方差的定义

设随机变量 X 满足 E(X^2) < \infty,则称

D(X) := E\left[ (X - E(X))^2 \right]

X 的方差。其平方根 \sigma_X = \sqrt{D(X)} 称为标准差(或均方差)。

:方差刻画随机变量相对均值的偏离程度。

方差的计算公式

  1. 定义式

    • 离散型:D(X) = \sum_{k} (x_k - E(X))^2 p_k
    • 连续型:D(X) = \int_{-\infty}^{\infty} (x - E(X))^2 f(x) dx
  2. 常用计算公式

    D(X) = E(X^2) - [E(X)]^2

    重要提示

    • E(X^2) \neq [E(X)]^2
    • D(X) 存在 \iff E(X^2) < +\infty

典型分布的方差

离散型分布

分布 概率分布 期望 方差
0-1 分布 P(X=1)=p,\ P(X=0)=1-p p p(1-p)
二项分布 B(n,p) P(X=k)=C_n^k p^k (1-p)^{n-k} np np(1-p)
泊松分布 Poi(\lambda) P(X=k)=\frac{\lambda^k e^{-\lambda}}{k!} \lambda \lambda
几何分布 P(X=k)=(1-p)^{k-1} p \frac{1}{p} \frac{1-p}{p^2}

连续型分布

分布 概率密度函数 期望 方差
均匀分布 U(a,b) f(x) = \frac{1}{b-a},\ a0 \frac{1}{\lambda} \frac{1}{\lambda^2}
正态分布 N(\mu,\sigma^2) f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \mu \sigma^2

例题解析

例题 1:泊松分布的方差

X \sim Poi(\lambda),求 D(X)

解答:
D(X) = E(X^2) - [E(X)]^2E(X) = \lambda
先求 E(X^2)

\begin{aligned} E(X^2) &= E[X(X-1) + X] = E[X(X-1)] + E(X) \\ E[X(X-1)] &= \sum_{k=0}^{\infty} k(k-1) \frac{\lambda^k e^{-\lambda}}{k!} \\ &= \lambda^2 e^{-\lambda} \sum_{k=2}^{\infty} \frac{\lambda^{k-2}}{(k-2)!} \\ &= \lambda^2 e^{-\lambda} e^{\lambda} = \lambda^2 \\ \therefore E(X^2) &= \lambda^2 + \lambda \\ D(X) &= (\lambda^2 + \lambda) - \lambda^2 = \lambda \end{aligned}

因此,D(X) = \lambda

例题 2:离散型随机变量的方差

设随机变量 X 的分布律为:

X -1 0 1
P p_1 p_2 p_3
已知 E(X) = \frac{1}{6}D(X) = \frac{29}{36},求 p_2

解答:
由分布律性质:p_1 + p_2 + p_3 = 1
期望:E(X) = -p_1 + p_3 = \frac{1}{6}
二阶矩:E(X^2) = (-1)^2 p_1 + 0^2 p_2 + 1^2 p_3 = p_1 + p_3
方差:D(X) = E(X^2) - [E(X)]^2 = p_1 + p_3 - \left( \frac{1}{6} \right)^2 = \frac{29}{36}
p_1 + p_3 = \frac{29}{36} + \frac{1}{36} = \frac{30}{36} = \frac{5}{6}
联立方程:

\begin{cases} p_1 + p_2 + p_3 = 1 \\ -p_1 + p_3 = \frac{1}{6} \\ p_1 + p_3 = \frac{5}{6} \end{cases} \implies \begin{cases} p_2 = 1 - \frac{5}{6} = \frac{1}{6} \\ p_3 = \frac{1}{2} \left( \frac{5}{6} + \frac{1}{6} \right) = \frac{1}{2} \\ p_1 = \frac{5}{6} - \frac{1}{2} = \frac{1}{3} \end{cases}

因此,p_2 = \frac{1}{6}

例题 3:正态分布的方差

X \sim N(\mu, \sigma^2),求 D(X)

解答:
标准化:令 Z = \frac{X - \mu}{\sigma},则 Z \sim N(0,1)
D(X) = E[(X - \mu)^2] = \sigma^2 E(Z^2)
对标准正态分布,

\begin{aligned} E(Z^2) &= \int_{-\infty}^{\infty} z^2 \cdot \frac{1}{\sqrt{2\pi}} e^{-z^2 / 2} dz \\ &= \frac{1}{\sqrt{2\pi}} \left[ -z e^{-z^2 / 2} \right]_{-\infty}^{\infty} + \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} e^{-z^2 / 2} dz \\ &= 0 + \frac{1}{\sqrt{2\pi}} \cdot \sqrt{2\pi} = 1 \quad (\text{因 } \int_{-\infty}^{\infty} e^{-z^2 / 2} dz = \sqrt{2\pi}) \end{aligned}

D(X) = \sigma^2 \cdot 1 = \sigma^2


方差的性质

  1. 非负性D(X) \geq 0;若 D(X) = 0,则 X = c (a.s.)。

  2. 常数方差D(c) = 0

  3. 齐次性D(cX) = c^2 D(X)

  4. 线性变换D(aX + b) = a^2 D(X)

  5. 独立随机变量的和:若 X, Y 相互独立,则

    D(X \pm Y) = D(X) + D(Y)

    推广:若 X_1, \dots, X_n 相互独立,则

    D \left( \sum_{i=1}^{n} c_i X_i \right) = \sum_{i=1}^{n} c_i^2 D(X_i)
  6. 一般随机变量的和:对任意随机变量 X, Y

    D(X + Y) = D(X) + D(Y) + 2 \operatorname{Cov}(X, Y)
  7. 最小方差性质:对任意常数 a

    D(X) \leq E[(X - a)^2]

    等号成立当且仅当 a = E(X)


例题解析(方差性质应用)

例题:二项分布的方差

X \sim B(n, p),求 D(X)

解答(方法一):
D(X) = E(X^2) - [E(X)]^2E(X) = np
先求 E[X(X-1)]

\begin{aligned} E[X(X-1)] &= \sum_{k=0}^{n} k(k-1) C_n^k p^k (1-p)^{n-k} \\ &= n(n-1)p^2 \sum_{k=2}^{n} C_{n-2}^{k-2} p^{k-2} (1-p)^{n-k} \\ &= n(n-1)p^2 (p + 1-p)^{n-2} = n(n-1)p^2 \end{aligned}

E(X^2) = E[X(X-1)] + E(X) = n(n-1)p^2 + np

D(X) = [n(n-1)p^2 + np] - (np)^2 = np(1-p)

解答(方法二):
X 分解为 n 个独立 0-1 随机变量之和:

X = \sum_{i=1}^{n} X_i, \quad X_i \sim \text{0-1 分布}(p)

由独立性,

D(X) = \sum_{i=1}^{n} D(X_i) = \sum_{i=1}^{n} p(1-p) = np(1-p)

例题:配对问题的方差

n 个编号为 1 \sim n 的球随机放入 n 个编号为 1 \sim n 的盒子中(每盒一球)。若球号与盒号一致,称为一个配对。求配对个数 X 的方差(以 n=4 为例)。

解答:
定义指示变量:

X_i = \begin{cases} 1, & \text{第 } i \text{ 个位置配对} \\ 0, & \text{否则} \end{cases}

X = \sum_{i=1}^{n} X_i

  • E(X_i) = P(X_i=1) = \frac{1}{n}
  • E(X_i^2) = E(X_i) = \frac{1}{n}(因 X_i^2 = X_i
  • D(X_i) = E(X_i^2) - [E(X_i)]^2 = \frac{1}{n} - \frac{1}{n^2} = \frac{n-1}{n^2}

协方差(i \neq j):

\begin{aligned} \operatorname{Cov}(X_i, X_j) &= E(X_i X_j) - E(X_i) E(X_j) \\ E(X_i X_j) &= P(X_i=1, X_j=1) = \frac{(n-2)!}{n!} = \frac{1}{n(n-1)} \\ \operatorname{Cov}(X_i, X_j) &= \frac{1}{n(n-1)} - \frac{1}{n} \cdot \frac{1}{n} = \frac{1}{n(n-1)} - \frac{1}{n^2} = \frac{1}{n^2(n-1)} \end{aligned}

由方差的分解公式:

\begin{aligned} D(X) &= \sum_{i=1}^{n} D(X_i) + 2 \sum_{1 \leq i < j \leq n} \operatorname{Cov}(X_i, X_j) \\ &= n \cdot \frac{n-1}{n^2} + 2 \binom{n}{2} \cdot \frac{1}{n^2(n-1)} \\ &= \frac{n-1}{n} + \frac{n(n-1)}{n^2(n-1)} = \frac{n-1}{n} + \frac{1}{n} = 1 \end{aligned}

n=4 时,D(X) = 1


标准化随机变量

设随机变量 X 满足 E(X^2) < \inftyD(X) > 0,则称

X^* = \frac{X - E(X)}{\sqrt{D(X)}}

X 的标准化随机变量。
易验证:

E(X^*) = 0, \quad D(X^*) = 1

4.3 协方差和相关系数

定义

协方差

E(X^2) < +\inftyE(Y^2) < +\infty,则称

\operatorname{Cov}(X, Y) = E[(X - E(X))(Y - E(Y))]

XY 的协方差。

  • \operatorname{Cov}(X, X) = D(X)
  • \operatorname{Cov}(Y, X) = \operatorname{Cov}(X, Y)

相关系数

D(X) > 0D(Y) > 0,则称

\rho_{X,Y} = \frac{\operatorname{Cov}(X, Y)}{\sqrt{D(X)} \sqrt{D(Y)}}

XY 的相关系数。

  • \rho_{X,Y} 无量纲
  • \rho_{X,Y} 的大小反映 XY 线性相关的强弱

协方差矩阵

n 维随机变量 (X_1, X_2, \dots, X_n),其协方差矩阵为:

\mathbf{\Sigma} = [\operatorname{Cov}(X_i, X_j)]_{n \times n} = \begin{pmatrix} D(X_1) & \cdots & \operatorname{Cov}(X_1, X_n) \\ \vdots & \ddots & \vdots \\ \operatorname{Cov}(X_n, X_1) & \cdots & D(X_n) \end{pmatrix}

:协方差矩阵是非负定的实对称矩阵。


计算方法

协方差的计算

  1. 定义式

    • 离散型:\operatorname{Cov}(X, Y) = \sum_{i,j} (x_i - E(X))(y_j - E(Y)) p_{ij}
    • 连续型:\operatorname{Cov}(X, Y) = \iint_{\mathbb{R}^2} (x - E(X))(y - E(Y)) f(x, y) dx dy
  2. 常用公式

    \operatorname{Cov}(X, Y) = E(XY) - E(X) E(Y)

例题解析

例题 1:联合分布的协方差

已知 X, Y 的联合分布:

Y \backslash X 0 2
0 0.3 q
3 p 0.4
要使 \operatorname{Cov}(X, Y) = 0.6,求 p, q

解答:
由联合分布性质:0.3 + q + p + 0.4 = 1 \implies p + q = 0.3
计算边缘分布:

  • P(X=0) = 0.3 + pP(X=2) = q + 0.4
  • P(Y=0) = 0.3 + qP(Y=3) = p + 0.4

期望:

\begin{aligned} E(X) &= 0 \cdot (0.3 + p) + 2 \cdot (q + 0.4) = 2(q + 0.4) \\ E(Y) &= 0 \cdot (0.3 + q) + 3 \cdot (p + 0.4) = 3(p + 0.4) \\ E(XY) &= 0 \cdot 0 \cdot 0.3 + 0 \cdot 2 \cdot q + 3 \cdot 0 \cdot p + 3 \cdot 2 \cdot 0.4 = 2.4 \end{aligned}

\operatorname{Cov}(X, Y) = E(XY) - E(X)E(Y) = 0.6

2.4 - [2(q + 0.4)] [3(p + 0.4)] = 0.6 \implies 6(q + 0.4)(p + 0.4) = 1.8 \implies (q + 0.4)(p + 0.4) = 0.3

联立 p + q = 0.3,令 s = p + 0.4t = q + 0.4,则 s + t = 1.1st = 0.3
解二次方程:u^2 - 1.1u + 0.3 = 0
判别式 \Delta = 1.21 - 1.2 = 0.01,根 u = \frac{1.1 \pm 0.1}{2} = 0.6 \text{ 或 } 0.5

  • s = 0.6t = 0.5,则 p = 0.2q = 0.1
  • s = 0.5t = 0.6,则 p = 0.1q = 0.2

验证:

  • 情形1:E(X)=2(0.1+0.4)=1.0E(Y)=3(0.2+0.4)=1.8E(X)E(Y)=1.8\operatorname{Cov}=2.4-1.8=0.6
  • 情形2:E(X)=2(0.2+0.4)=1.2E(Y)=3(0.1+0.4)=1.5E(X)E(Y)=1.8\operatorname{Cov}=2.4-1.8=0.6
    故解为 (p,q) = (0.2,0.1)(0.1,0.2)

例题 2:二维正态分布的相关系数

(X, Y) \sim N(0, 1; 0, 1; \rho),求 \rho_{X,Y}

解答:
已知 X \sim N(0,1)Y \sim N(0,1),故 E(X)=E(Y)=0D(X)=D(Y)=1
由协方差定义:

\operatorname{Cov}(X, Y) = E(XY) - E(X)E(Y) = E(XY)

二维正态密度函数为:

f(x,y) = \frac{1}{2\pi \sqrt{1-\rho^2}} \exp\left\{ -\frac{1}{2(1-\rho^2)} (x^2 - 2\rho xy + y^2) \right\}

计算 E(XY)

E(XY) = \iint_{\mathbb{R}^2} xy f(x,y) dx dy

利用标准结论:对 N(\mu_1, \sigma_1^2; \mu_2, \sigma_2^2; \rho),有 \operatorname{Cov}(X,Y) = \rho \sigma_1 \sigma_2
此处 \sigma_1 = \sigma_2 = 1,故 \operatorname{Cov}(X,Y) = \rho

\rho_{X,Y} = \frac{\operatorname{Cov}(X,Y)}{\sqrt{D(X)D(Y)}} = \frac{\rho}{1 \cdot 1} = \rho

因此,\rho_{X,Y} = \rho


协方差和相关系数的性质

协方差的性质

  1. 对称性\operatorname{Cov}(X, Y) = \operatorname{Cov}(Y, X)
  2. 齐次性\operatorname{Cov}(aX, bY) = ab \operatorname{Cov}(X, Y)
  3. 线性性\operatorname{Cov}(X + Y, Z) = \operatorname{Cov}(X, Z) + \operatorname{Cov}(Y, Z)
  4. 一般线性组合
    \operatorname{Cov}(aX + bY, cX + dY) = ac D(X) + (ad + bc) \operatorname{Cov}(X, Y) + bd D(Y)

相关系数的性质

  1. 有界性|\rho_{X,Y}| \leq 1

  2. 完全相关|\rho_{X,Y}| = 1 \iff \exists a,b 使 P(Y = aX + b) = 1

    • \rho_{X,Y} = 1:完全正相关
    • \rho_{X,Y} = -1:完全负相关
  3. 不相关\rho_{X,Y} = 0X, Y 不相关

    :不相关 \iff \operatorname{Cov}(X, Y) = 0 \iff E(XY) = E(X)E(Y)

  4. 最小方差性质:对任意 t

    D(X + tY) = D(X) + 2t \operatorname{Cov}(X, Y) + t^2 D(Y)

    t^* = -\frac{\operatorname{Cov}(X,Y)}{D(Y)} 时取最小值:

    D(X + t^* Y) = D(X) [1 - \rho_{X,Y}^2]
  5. 独立性与不相关的关系

    • X, Y 相互独立,则 \rho_{X,Y} = 0(不相关)
    • (X, Y) 服从二维正态分布,则不相关 \iff 独立
    • 一般分布中,不相关不能推出独立

例题解析

例题:二维正态分布的相关系数

(X, Y) \sim N(1, 4; 1, 4; 0.5)Z = X + Y,求 \rho_{X,Z}

解答:
先计算:

  • E(X) = 1D(X) = 4E(Y) = 1D(Y) = 4
  • \operatorname{Cov}(X, Y) = \rho \sqrt{D(X)D(Y)} = 0.5 \times 2 \times 2 = 2
  • E(Z) = E(X) + E(Y) = 2
  • D(Z) = D(X) + D(Y) + 2 \operatorname{Cov}(X, Y) = 4 + 4 + 4 = 12
  • \operatorname{Cov}(X, Z) = \operatorname{Cov}(X, X + Y) = \operatorname{Cov}(X, X) + \operatorname{Cov}(X, Y) = D(X) + \operatorname{Cov}(X, Y) = 4 + 2 = 6

\rho_{X,Z} = \frac{\operatorname{Cov}(X, Z)}{\sqrt{D(X) D(Z)}} = \frac{6}{\sqrt{4 \times 12}} = \frac{6}{\sqrt{48}} = \frac{6}{4\sqrt{3}} = \frac{\sqrt{3}}{2} \approx 0.866

例题:品牌选择的协方差

某购物网站,访客以概率 p 选 A 品牌,概率 q 选 B 品牌,概率 1-p-q 两者都不选。n 人独立访问,X 为选 A 人数,Y 为选 B 人数。求 \operatorname{Cov}(X, Y)

解答:
定义指示变量:

X_i = \begin{cases} 1, & \text{第 } i \text{ 人选 A} \\ 0, & \text{否则} \end{cases}, \quad Y_i = \begin{cases} 1, & \text{第 } i \text{ 人选 B} \\ 0, & \text{否则} \end{cases}

X = \sum_{i=1}^{n} X_iY = \sum_{i=1}^{n} Y_i
对单个顾客:

  • E(X_i) = pE(Y_i) = q
  • X_i Y_i = 0(因不能同时选 A 和 B),故 E(X_i Y_i) = 0
  • \operatorname{Cov}(X_i, Y_i) = E(X_i Y_i) - E(X_i) E(Y_i) = 0 - pq = -pq

i \neq j,由独立性 \operatorname{Cov}(X_i, Y_j) = 0
因此,

\operatorname{Cov}(X, Y) = \sum_{i=1}^{n} \operatorname{Cov}(X_i, Y_i) + \sum_{i \neq j} \operatorname{Cov}(X_i, Y_j) = n(-pq) + 0 = -npq

不相关的等价命题

以下命题等价:

  1. XY 不相关
  2. \rho_{X,Y} = 0
  3. \operatorname{Cov}(X, Y) = 0
  4. E(XY) = E(X) E(Y)
  5. D(X \pm Y) = D(X) + D(Y)

:在一般分布中,XY 独立 \implies 不相关,但逆命题不成立。例如:
X \sim N(0,1)Y = X^2,则 E(XY) = E(X^3) = 0 = E(X)E(Y),故不相关,但显然不独立。


例题:绝对值分布的协方差

设随机变量 X 的概率密度函数为 f(x) = \frac{1}{2} e^{-|x|}x \in \mathbb{R}
(1) 求 E(X), D(X)
(2) 求 \operatorname{Cov}(X, |X|),问 X|X| 是否不相关;
(3) 问 X|X| 是否独立?为什么?

解答:
(1) 期望与方差
f(x) 为偶函数,X 关于 0 对称,故 E(X) = 0

\begin{aligned} E(X^2) &= 2 \int_{0}^{\infty} x^2 \cdot \frac{1}{2} e^{-x} dx = \int_{0}^{\infty} x^2 e^{-x} dx = \Gamma(3) = 2! = 2 \\ D(X) &= E(X^2) - [E(X)]^2 = 2 - 0 = 2 \end{aligned}

(2) 协方差

\begin{aligned} \operatorname{Cov}(X, |X|) &= E[X |X|] - E(X) E(|X|) \\ E(X |X|) &= \int_{-\infty}^{\infty} x |x| \cdot \frac{1}{2} e^{-|x|} dx \\ &= \int_{-\infty}^{0} x (-x) \cdot \frac{1}{2} e^{x} dx + \int_{0}^{\infty} x \cdot x \cdot \frac{1}{2} e^{-x} dx \\ &= -\frac{1}{2} \int_{-\infty}^{0} x^2 e^{x} dx + \frac{1}{2} \int_{0}^{\infty} x^2 e^{-x} dx \\ &= -\frac{1}{2} \Gamma(3) + \frac{1}{2} \Gamma(3) = -1 + 1 = 0 \\ E(|X|) &= 2 \int_{0}^{\infty} x \cdot \frac{1}{2} e^{-x} dx = \int_{0}^{\infty} x e^{-x} dx = \Gamma(2) = 1 \\ \operatorname{Cov}(X, |X|) &= 0 - 0 \cdot 1 = 0 \end{aligned}

X|X| 不相关。

(3) 独立性
不独立。因为当 X > 0|X| = X,二者存在确定性关系。
反例:取 A = \{X > 1\}B = \{|X| < 1\}
P(A) > 0P(B) > 0,但 P(A \cap B) = 0 \neq P(A) P(B)
因此 X|X| 不独立。


用键盘敲击出的不只是字符,更是一段段生活的剪影、一个个心底的梦想。希望我的文字能像一束光,在您阅读的瞬间,照亮某个角落,带来一丝温暖与共鸣。

FengYuchen

estj 总经理

具有版权性

请您在转载、复制时注明本文 作者、链接及内容来源信息。 若涉及转载第三方内容,还需一同注明。

具有时效性

欢迎来到我的博客

29 文章数
8 分类数
2 评论数
10标签数