概率统计第一章

FengYuchen
2025-11-12
点 赞
0
热 度
3
评 论
0

文章摘要

智阅GPT

概率论基础

1.1 随机事件及其运算

随机试验与样本空间

  • 随机试验 E 满足三个特征:
    1. 可在相同条件下重复进行
    2. 所有可能结果不止一个
    3. 每次试验前无法预知具体结果
  • 样本空间 \Omega:随机试验 E 所有可能结果组成的集合
  • 样本点:样本空间的元素,表示随机试验的直接结果

随机现象在相同条件下大量重复观察时,其结果呈现统计规律性。概率论正是对随机现象建立统计模型,研究其背后统计规律的学科。

随机事件

  • 随机事件:在随机试验中可能发生也可能不发生的事情,记为 A, B, C
  • 随机事件的本质:样本空间 \Omega 的子集
  • 特殊事件
    • 必然事件 \Omega:全体样本点组成的事件
    • 不可能事件 \emptyset:不包含任何样本点的事件
    • 基本事件:仅由一个样本点组成的子集

概率含义:事件 A 发生当且仅当试验结果 \omega \in A

事件的关系与运算

事件间的关系与运算对应于集合的关系与运算:

  1. 包含关系 A \subset B
    概率含义:若 A 发生则 B 一定发生

  2. 和事件 A \cup B
    由组成 AB 的所有样本点组成
    概率含义AB 至少有一个发生

    • n 个事件的和:A_1 \cup A_2 \cup \cdots \cup A_n
    • 可列个事件的和:\bigcup_{i=1}^{\infty} A_i
  3. 积事件 A \cap BAB
    由同时属于 AB 的样本点组成
    概率含义AB 同时发生

    • n 个事件的积:A_1 \cap A_2 \cap \cdots \cap A_n
    • 可列个事件的积:\bigcap_{i=1}^{\infty} A_i
  4. 差事件 A - B
    由属于 A 但不属于 B 的样本点组成
    概率含义A 发生但 B 不发生

  5. 互不相容(互斥)事件 AB = \emptyset

    • n 个事件两两互斥:A_i A_j = \emptyseti \neq j; i,j=1,2,\ldots,n
    • 可列个事件两两互斥:A_i A_j = \emptyseti \neq j; i,j=1,2,\ldots
  6. 对立事件(互逆事件)
    AB 互相对立 \iff A \cup B = \OmegaAB = \emptyset
    记作 B = \overline{A}\overline{A} 称为 A 的对立事件)
    :对立事件与互斥事件不同,对立事件要求两个事件必须覆盖整个样本空间。

事件运算的基本律

  1. 交换律

    A \cup B = B \cup A, \quad AB = BA
  2. 结合律

    (A \cup B) \cup C = A \cup (B \cup C), \quad (AB)C = A(BC)
  3. 分配律

    A \cup (BC) = (A \cup B)(A \cup C), \quad A(B \cup C) = AB \cup AC
  4. 德·摩根律(对偶律)

    \overline{A \cup B} = \overline{A} \cap \overline{B}, \quad \overline{AB} = \overline{A} \cup \overline{B}

    推广至 n 个事件:

    \overline{\bigcup_{i=1}^{n} A_i} = \bigcap_{i=1}^{n} \overline{A_i}, \quad \overline{\bigcap_{i=1}^{n} A_i} = \bigcup_{i=1}^{n} \overline{A_i}

    对可列个事件同样成立。

  5. 吸收律

    A \cup (AB) = A, \quad A \cap (A \cup B) = A
  6. 幂等律

    A \cup A = A, \quad A \cap A = A
  7. 其他重要关系

    A - B = A \overline{B} = A - AB, \quad A = A \Omega = A \cup \emptyset

    运算顺序:先括号,再积(交),最后和(并)。

例题精解

例题:A, B, C 为三个事件,用 A, B, C 表示下列事件:
(1) A, B, C 都不发生
(2) A, B, C 不都发生
(3) A, B, C 中恰好有一个发生
(4) A, B, C 中至少有一个发生
(5) A, B, C 中不多于两个发生
(6) A, B, C 恰好有两个发生

解答:
(1) A, B, C 都不发生:\overline{A} \cap \overline{B} \cap \overline{C} = \overline{A \cup B \cup C}
(2) A, B, C 不都发生:\overline{ABC}(即至少有一个不发生)
(3) 恰好有一个发生:(A \cap \overline{B} \cap \overline{C}) \cup (\overline{A} \cap B \cap \overline{C}) \cup (\overline{A} \cap \overline{B} \cap C)
(4) 至少有一个发生:A \cup B \cup C
(5) 不多于两个发生:\overline{ABC}(即至多两个发生,等价于"不都发生")
(6) 恰好有两个发生:(AB \cap \overline{C}) \cup (AC \cap \overline{B}) \cup (BC \cap \overline{A})


1.2 概率

古典概型(等可能概型)

定义: 随机试验 E 满足:

  1. 样本空间 \Omega 中只有有限个样本点
  2. 每个基本事件发生的可能性大小相同

概率计算:A \subset \Omega 为随机事件,n = \#\Omega(样本点总数),k = \#AA 中样本点数),则

P(A) = \frac{k}{n}

案例:不放回与放回取球
袋中有 a 只白球,b 只红球,取球 m 次(m \leq a+b),求恰有 k 次(k \leq a \land m)取到白球的概率。

  • 不放回方式
    P(A_k) = \frac{\binom{a}{k} \binom{b}{m-k}}{\binom{a+b}{m}}
  • 放回方式
    P(A_k) = \binom{m}{k} \left( \frac{a}{a+b} \right)^k \left( \frac{b}{a+b} \right)^{m-k}

案例:第 k 次取到白球的概率
袋中有 a 只白球,b 只红球,不放回取球,每次 1 球,求第 k 次(k \leq a+b)为白球的概率。
解答: 考虑第 k 次取球,所有球在序列中等可能地位于第 k 位。

P(A_k) = \frac{a}{a+b}

注:该结果与 k 无关,表明在不放回抽样中,每次取到白球的概率相同。

几何概型

定义: 样本空间 \Omega 为有界区域,A\Omega 的子区域。若在 \Omega 中完全随机取点,则点落入 A 的概率与 A 的测度成正比:

P(A) = \frac{m(A)}{m(\Omega)}

其中 m(\cdot) 表示长度、面积或体积。

重要结论:

  • 概率为 0 的事件不一定是不可能事件(例如:单点集在连续区域中测度为 0)。

案例:Buffon 投针试验
平面上平行线间距为 a,投掷长度 l < a 的针,求针与平行线相交的概率。
解答:x 为针中点与最近平行线的距离,\theta 为针与平行线的夹角。
样本空间:\Omega = \{(x,\theta) \mid 0 \leq x \leq a/2, \, 0 \leq \theta \leq \pi\}
相交区域:A = \{(x,\theta) \mid 0 \leq x \leq (l/2)\sin\theta\}

P(A) = \frac{2}{a\pi} \int_0^{\pi} \frac{l}{2} \sin\theta \, d\theta = \frac{2l}{a\pi}

注:此公式可用于实验估算 \pi 值。

统计概率

频率定义:n 次重复试验中,事件 A 发生 n_A 次,则

f_n(A) = \frac{n_A}{n}

称为事件 A 的频率。

频率性质:

  1. 0 \leq f_n(A) \leq 1
  2. f_n(\Omega) = 1
  3. 有限可加性:若 A_1, \ldots, A_k 两两互斥,则
    f_n(A_1 \cup \cdots \cup A_k) = f_n(A_1) + \cdots + f_n(A_k)

统计规律性案例:

  • Buffon 投硬币:n=4040,正面频数 2048,频率 0.5069
  • Pearson 投硬币:n=12000,正面频数 6019,频率 0.5016
  • Pearson 投硬币:n=24000,正面频数 12012,频率 0.5005
    随着试验次数增加,频率趋于稳定值(概率)。

概率的公理化定义

概率空间 (\Omega, \mathcal{F}, P)

  • \Omega:样本空间
  • \mathcal{F}\Omega 上的 \sigma-代数(事件域),满足:
    • \Omega \in \mathcal{F}
    • A \in \mathcal{F},则 \overline{A} \in \mathcal{F}
    • A_k \in \mathcal{F}k=1,2,\ldots),则 \bigcup_{k=1}^{\infty} A_k \in \mathcal{F}
  • P(\cdot):定义在 \mathcal{F} 上的概率测度,满足:
    • 非负性\forall A \in \mathcal{F}P(A) \geq 0
    • 规范性P(\Omega) = 1
    • 可列可加性:若 A_1, A_2, \ldots 两两互斥,则
      P\left( \bigcup_{i=1}^{\infty} A_i \right) = \sum_{i=1}^{\infty} P(A_i)

概率的基本性质

  1. P(\emptyset) = 0

  2. 有限可加性:若 A_1, \ldots, A_n 两两互斥,则

    P\left( \bigcup_{i=1}^{n} A_i \right) = \sum_{i=1}^{n} P(A_i)
  3. 对立事件概率P(\overline{A}) = 1 - P(A)

  4. 单调性:若 A \subset B,则 P(B - A) = P(B) - P(A)

  5. 差事件概率P(B - A) = P(B) - P(AB)

  6. 加法公式:对任意事件 A, B

    P(A \cup B) = P(A) + P(B) - P(AB)

    推广至 n 个事件:

    P\left( \bigcup_{i=1}^{n} A_i \right) = \sum_{i=1}^{n} P(A_i) - \sum_{1 \leq i < j \leq n} P(A_i A_j) + \cdots + (-1)^{n-1} P(A_1 A_2 \cdots A_n)

    三事件特例:

    P(A \cup B \cup C) = P(A) + P(B) + P(C) - P(AB) - P(BC) - P(AC) + P(ABC)

例题精解

例题:\{1,2,\ldots,9\} 中可重复任取 n 个数(n \geq 2),求 n 次取到的数字乘积能被 10 整除的概率。
解答: 乘积被 10 整除 \iff 至少有一个 5 和至少有一个偶数。
A = "无 5",B = "无偶数",则所求事件为 \overline{A} \cap \overline{B}

P(\overline{A} \cap \overline{B}) = 1 - P(A \cup B) = 1 - [P(A) + P(B) - P(AB)]
  • P(A) = 无 5 的概率:\left( \frac{8}{9} \right)^n
  • P(B) = 无偶数的概率:\left( \frac{5}{9} \right)^n(偶数有 2,4,6,8)
  • P(AB) = 无 5 且无偶数的概率:\left( \frac{4}{9} \right)^n(剩余 1,3,7,9)
    因此:
P(\text{乘积能被 10 整除}) = 1 - \left( \frac{8}{9} \right)^n - \left( \frac{5}{9} \right)^n + \left( \frac{4}{9} \right)^n

例题: 将标有 1,2,3,4 的 4 个球随机放入标有 1,2,3,4 的 4 个盒子(每盒一球),求至少有一个球与盒子号码一致的概率。
解答:A_i = "第 i 号球放入 i 号盒子",i=1,2,3,4,求 P\left( \bigcup_{i=1}^{4} A_i \right)
由加法公式:

P\left( \bigcup_{i=1}^{4} A_i \right) = \sum P(A_i) - \sum P(A_i A_j) + \sum P(A_i A_j A_k) - P(A_1 A_2 A_3 A_4)
  • P(A_i) = \frac{3!}{4!} = \frac{1}{4}(固定 i 位置,其余排列),\sum P(A_i) = 4 \times \frac{1}{4} = 1
  • P(A_i A_j) = \frac{2!}{4!} = \frac{1}{12}\binom{4}{2} = 6 项,\sum P(A_i A_j) = 6 \times \frac{1}{12} = \frac{1}{2}
  • P(A_i A_j A_k) = \frac{1!}{4!} = \frac{1}{24}\binom{4}{3} = 4 项,\sum P(A_i A_j A_k) = 4 \times \frac{1}{24} = \frac{1}{6}
  • P(A_1 A_2 A_3 A_4) = \frac{1}{24}
    代入得:
P\left( \bigcup_{i=1}^{4} A_i \right) = 1 - \frac{1}{2} + \frac{1}{6} - \frac{1}{24} = \frac{15}{24} = \frac{5}{8}

1.3 条件概率

条件概率的定义

(\Omega, \mathcal{F}, P) 为概率空间,A, B \in \mathcal{F}P(A) > 0,则在事件 A 发生的条件下,事件 B 的条件概率定义为:

P(B \mid A) = \frac{P(AB)}{P(A)}

性质:

  1. \forall B \in \mathcal{F}P(B \mid A) \geq 0
  2. P(\Omega \mid A) = 1
  3. 可列可加性:若 B_1, B_2, \ldots 两两互斥,则
    P\left( \bigcup_{i=1}^{\infty} B_i \mid A \right) = \sum_{i=1}^{\infty} P(B_i \mid A)
  4. P(\overline{B} \mid A) = 1 - P(B \mid A)
  5. P(B_1 \cup B_2 \mid A) = P(B_1 \mid A) + P(B_2 \mid A) - P(B_1 B_2 \mid A)

注:P(\cdot \mid A)\mathcal{F} 上的概率测度。

乘法公式

由条件概率定义直接可得:

P(AB) = P(A) P(B \mid A) \quad (P(A) > 0)

推广至多个事件:

P(A_1 A_2 \cdots A_n) = P(A_1) P(A_2 \mid A_1) P(A_3 \mid A_1 A_2) \cdots P(A_n \mid A_1 A_2 \cdots A_{n-1})

案例:产品检验
某批产品(100 件,含 10 件次品),不放回抽检至多 3 件:发现次品即拒收,3 件全正品才接受。求该批产品被拒收的概率。
解答:A = "被拒收",B_i = "第 i 件为正品"(i=1,2,3)。

P(A) = 1 - P(\text{被接受}) = 1 - P(B_1 B_2 B_3)

由乘法公式:

P(B_1 B_2 B_3) = P(B_1) P(B_2 \mid B_1) P(B_3 \mid B_1 B_2) = \frac{90}{100} \times \frac{89}{99} \times \frac{88}{98} \approx 0.7265

因此:

P(A) = 1 - 0.7265 = 0.2735

全概率公式与 Bayes 公式

全概率公式:B_1, B_2, \ldots\Omega 的一个划分(B_i \cap B_j = \emptyset\bigcup_{j=1}^{\infty} B_j = \Omega),则对任意事件 A

P(A) = \sum_{j=1}^{\infty} P(B_j) P(A \mid B_j)

Bayes 公式: 在全概率公式的条件下,若 P(A) > 0,则

P(B_i \mid A) = \frac{P(B_i) P(A \mid B_i)}{P(A)} = \frac{P(B_i) P(A \mid B_i)}{\sum_{j=1}^{\infty} P(B_j) P(A \mid B_j)}

案例:汽车保险
投保人分为三类:

  • B_1(安全型,占比 25%):年事故率 P(A \mid B_1) = 0.02
  • B_2(一般型,占比 60%):年事故率 P(A \mid B_2) = 0.08
  • B_3(危险型,占比 15%):年事故率 P(A \mid B_3) = 0.20
    求:
    (1) 投保人年事故概率 P(A)
    (2) 已知发生事故,是安全型的概率 P(B_1 \mid A)

解答:
(1) 由全概率公式:

\begin{aligned} P(A) &= P(B_1)P(A \mid B_1) + P(B_2)P(A \mid B_2) + P(B_3)P(A \mid B_3) \\ &= 0.25 \times 0.02 + 0.60 \times 0.08 + 0.15 \times 0.20 \\ &= 0.005 + 0.048 + 0.030 = 0.083 \end{aligned}

(2) 由 Bayes 公式:

\begin{aligned} P(B_1 \mid A) &= \frac{P(B_1) P(A \mid B_1)}{P(A)} = \frac{0.005}{0.083} \approx 0.0602 \end{aligned}

注:安全型投保人发生事故的概率反而最低。

案例:医学诊断问题
疾病患病率 P(A) = 0.001,血液检查:

  • 假阳性率 P(B \mid \overline{A}) = 0.01
  • 假阴性率 P(\overline{B} \mid A) = 0.01P(B \mid A) = 0.99
    尿液检查:
  • 假阳性率 P(C \mid \overline{A}) = 0.05
  • 假阴性率 P(\overline{C} \mid A) = 0.08P(C \mid A) = 0.92
    假设血检和尿检结果独立(即 P(BC \mid A) = P(B \mid A)P(C \mid A)P(BC \mid \overline{A}) = P(B \mid \overline{A})P(C \mid \overline{A}))。

(1) 血检阳性后患病概率 P(A \mid B)
(2) 血检和尿检均阳性后患病概率 P(A \mid BC)
(3) 已知家族遗传患病率 P(A) = 0.03,结合两项检查结果求 P(A \mid BC)

解答:
(1) 由 Bayes 公式:

\begin{aligned} P(A \mid B) &= \frac{P(B \mid A) P(A)}{P(B \mid A) P(A) + P(B \mid \overline{A}) P(\overline{A})} \\ &= \frac{0.99 \times 0.001}{0.99 \times 0.001 + 0.01 \times 0.999} = \frac{0.00099}{0.00099 + 0.00999} = \frac{0.00099}{0.01098} \approx 0.0902 \end{aligned}

(2) 计算 P(A \mid BC)

\begin{aligned} P(A \mid BC) &= \frac{P(BC \mid A) P(A)}{P(BC \mid A) P(A) + P(BC \mid \overline{A}) P(\overline{A})} \\ &= \frac{P(B \mid A)P(C \mid A) P(A)}{P(B \mid A)P(C \mid A) P(A) + P(B \mid \overline{A})P(C \mid \overline{A}) P(\overline{A})} \\ &= \frac{0.99 \times 0.92 \times 0.001}{0.99 \times 0.92 \times 0.001 + 0.01 \times 0.05 \times 0.999} \\ &= \frac{0.0009108}{0.0009108 + 0.0004995} = \frac{0.0009108}{0.0014103} \approx 0.6458 \end{aligned}

(3) 当 P(A) = 0.03 时:

\begin{aligned} P(A \mid BC) &= \frac{0.99 \times 0.92 \times 0.03}{0.99 \times 0.92 \times 0.03 + 0.01 \times 0.05 \times 0.97} \\ &= \frac{0.027324}{0.027324 + 0.000485} = \frac{0.027324}{0.027809} \approx 0.9825 \end{aligned}

1.4 事件的独立性

独立性定义

两事件独立: 事件 A, B 满足

P(AB) = P(A) P(B)

则称 AB 相互独立
注:若 P(A) > 0,则 AB 独立 \iff P(B \mid A) = P(B)

重要结论:

  1. \Omega\emptyset 与任何事件独立。
  2. A, B 独立,则 A, \overline{B}\overline{A}, B\overline{A}, \overline{B} 也相互独立。
  3. 独立性与互斥性区别
    • 独立性:P(AB) = P(A)P(B)
    • 互斥性:AB = \emptyset
    • P(A) > 0P(B) > 0,则独立事件不可能互斥(互斥事件不可能独立)。

多事件独立性

三事件相互独立: 需同时满足:

  1. 两两独立:
    P(AB) = P(A)P(B), \quad P(AC) = P(A)P(C), \quad P(BC) = P(B)P(C)
  2. 三者独立:
    P(ABC) = P(A)P(B)P(C)

注:仅满足两两独立不足以保证三者独立。

n 个事件相互独立: 要求对任意 1 \leq i_1 < i_2 < \cdots < i_k \leq nk=2,3,\ldots,n),有

P(A_{i_1} A_{i_2} \cdots A_{i_k}) = P(A_{i_1}) P(A_{i_2}) \cdots P(A_{i_k})

独立性应用

案例:射击问题
甲、乙独立射击目标,命中率分别为 0.8 和 0.6。已知目标只有一个弹孔,求是甲击中的概率。
解答:A = "甲击中",B = "乙击中"。
C = "仅一个弹孔" = (A \cap \overline{B}) \cup (\overline{A} \cap B)
所求 P(A \mid C) = P(A \cap \overline{B} \mid C)
由条件概率:

P(A \mid C) = \frac{P(A \cap \overline{B})}{P(C)} = \frac{P(A)P(\overline{B})}{P(A)P(\overline{B}) + P(\overline{A})P(B)} = \frac{0.8 \times 0.4}{0.8 \times 0.4 + 0.2 \times 0.6} = \frac{0.32}{0.32 + 0.12} = \frac{0.32}{0.44} \approx 0.7273

案例:骰子独立性
掷两枚骰子,设:

  • A = "第一枚点数为奇数"
  • B = "第二枚点数为奇数"
  • C = "两枚点数和为奇数"
    判断 A, B, C 的独立性。
    解答:
  • P(A) = P(B) = P(C) = \frac{1}{2}
  • P(AB) = P(A)P(B) = \frac{1}{4}A,B 独立)
  • P(AC) = P(\text{第一奇且和奇}) = P(\text{第二偶}) = \frac{1}{2} \times \frac{1}{2} = \frac{1}{4} = P(A)P(C)
  • 同理 P(BC) = P(B)P(C) = \frac{1}{4}(两两独立)
  • P(ABC) = P(\text{第一奇、第二奇、和奇}) = 0 \neq P(A)P(B)P(C) = \frac{1}{8}
    因此 A, B, C 两两独立但不相互独立。

一般结论

n 个事件 A_1, \ldots, A_n 相互独立,则:

  • 将它们任意分成 k 组(同事件不属不同组),对每组进行和、积、差、对立运算后,得到的 k 个事件仍相互独立。

案例:电路系统
[图:串联并联混合电路,元件1-5连接左右端点L和R]
设每个元件正常工作概率为 p,且相互独立,求电路L到R通路的概率。
解答:A_i = "元件 i 正常工作"(i=1,2,3,4,5)。

  • 方法一: 直接计算通路概率
    L-R通路 \iff [(1和2通) 或 3通] 且 (4和5通)

    \begin{aligned} P(A) &= P\left( (A_1 A_2 \cup A_3) \cap (A_4 A_5) \right) \\ &= P(A_1 A_2 \cup A_3) \cdot P(A_4 A_5) \quad \text{(因两部分独立)} \\ &= \left[ P(A_1 A_2) + P(A_3) - P(A_1 A_2 A_3) \right] \cdot P(A_4) P(A_5) \\ &= \left[ p^2 + p - p^3 \right] p^2 \\ &= p^4 (1 + p - p^2) \end{aligned}
  • 方法二: 用对立事件
    断路 \iff {[(1断或2断) 且 3断] 或 (4断或5断)}
    更复杂,验证方法一:

    P(\text{通路}) = p^4 + p^3 - p^5

    注:两种方法等价,因 p^4(1 + p - p^2) = p^4 + p^5 - p^6(校正原文,实际应为 p^4(1 + p - p^2) = p^4 + p^5 - p^6)。
    最终结果:

    P(\text{通路}) = p^4 + p^3 - p^5 - p^4 + p^5 = p^4 + p^3 - p^5 \quad \text{(简化后)}

用键盘敲击出的不只是字符,更是一段段生活的剪影、一个个心底的梦想。希望我的文字能像一束光,在您阅读的瞬间,照亮某个角落,带来一丝温暖与共鸣。

FengYuchen

estj 总经理

具有版权性

请您在转载、复制时注明本文 作者、链接及内容来源信息。 若涉及转载第三方内容,还需一同注明。

具有时效性

欢迎来到我的博客

29 文章数
8 分类数
2 评论数
10标签数