关于概率的公理化的一些说明
概率的公理化定义
设有随机试验E,E的样本空间为Ω,记包括Ω在内的E的所有时间组成的集合族为ℱ,若ℱ对中的任意一个事件A都能赋予一个实数P(A),且P(A)满足条件:
非负性:0 ≤ P(A) ≤ 1;
规范性:P(Ω) = 1;
可列可加性:对两两互不相容的事件A1, A2, ⋯,有 $$ P\left(\sum_{i = 1}^{\infty}A_i\right)=\sum_{i = 1}^{\infty}P(A_i) $$
则称P(A)为事件A的概率
关于概率的公理化定义一些额外内容
其中,设ℱ是由Ω中的子集组成的子集类,若具有
- Ω ∈ ℱ
- 若$\overline{A} \in \mathscr{F}$,则$\overline{A} = \Omega - A \in \mathscr{F}$
- 若An ∈ ℱ(对一切n ≥ 1),则$\bigcup_{n = 1}^{\infty} A_n \in \mathscr{F}$,即称ℱ为Ω中的σ域(或称为σ代数)。
可以证明,当ℱ是Ω中的σ域时,有如下结论成立:
- 若Ai ∈ ℱ(i = 1, ⋯, n),则$\bigcup_{i = 1}^{n} A_i \in \mathscr{F}$ 且 $\bigcap_{i = 1}^{n} A_i \in \mathscr{F}$;
- 若Ai ∈ ℱ(i = 1, 2, ⋯),则$\bigcap_{i = 1}^{\infty} A_i \in \mathscr{F}$;
- 若A ∈ ℱ,B ∈ ℱ,则A − B ∈ ℱ。
显然σ域的定义是在保证这样的事件子集类在事件的基本运算具有某些封闭性的要求下建立的。
上述三条结论是如何证明的呢
σ域与概率公理化的关系:“事件子集类的封闭规则”
这里是一些关于σ域的说明
设ℱ是由 Ω 中的子集组成的子集类,若满足 3 条规则,就称 ℱ 是 Ω 中的 σ 域 。
这 3 条规则,本质是“事件子集类对运算的封闭性”(即:对这些运算,子集类不会 “跑出去”),对应概率公理化里的逻辑:
Ω ∈ ℱ
样本空间本身要包含在里
概率公理化中,样本空间 Ω 是“必然事件”,概率 P(Ω) = 1(规范性)。σ 域 先把 Ω 包含进来,保证“必然事件”是讨论的基础。
若$\overline{A} \in \mathscr{F}$,则$\overline{A} = \Omega - A \in \mathscr{F}$
对“取补集”封闭
概率里有“对立事件”(比如 “A 发生” 和 “A不发生”),公理化定义也要求概率满足 $P(\overline{A}) = 1 - P(A)$(后续可推导的性质)。σ 域通过“补集封闭”,保证对立事件也在讨论范围内。
若An ∈ ℱ(对一切n ≥ 1),则$\bigcup_{n = 1}^{\infty} A_n \in \mathscr{F}$,即称ℱ为Ω中的σ域(或称为σ代数)。
对“可列并”封闭
概率公理化里有“可列可加性”(3 条核心条件之一),需要“无穷多个互斥事件的并”也是一个“合法事件”。σ 域通过“可列并封闭”,为可列可加性铺路——先保证这类“无穷并事件”存在,才能给它定义概率。
这三条结论都是能够直接从从σ−代数的定义推出的,这里不再提σ−代数的相关内容了
回到概率公理化:σ 域是“事件的合法范围”
概率公理化定义里,有个关键前提: “包括 Ω 在内的 E 的所有事件组成的集合族为ℱ ” ——这里的ℱ ,必须是一个σ 域!换句话说:
不是随便选一些子集就能当“事件”,得满足 σ 域的封闭性(补、可列并、包含 Ω 等)。
只有这样,概率 P(A) 才能用公理化的 3 条条件(非负、规范、可列可加)“合理定义”到这些事件上。
打个比方:σ 域像一个“合法事件的容器”,先规定好哪些子集能当“事件”(满足封闭性),概率公理化再给这些“合法事件”赋予概率值,保证运算不出错。
那么,概率为0的事件是否一定不可能?
其实就不一定了。在连续空间中,单点概率为0(如均匀分布下 P(0.5) = 0),但“概率为0”不等价于“不可能发生”(不可能事件仅指 ∅)。
总结:σ 域与概率公理化的关系
简单说:σ 域负责“事件合法”,概率公理化负责“给合法事件赋值”,缺一不可
σ 域是“事件的规则边界”:限定哪些子集能被称为“事件”,保证事件在补、并(有限/可列)、交(有限/可列)、差运算下“不超界”。
概率公理化是“事件的数值规则”:给这些“合法事件”赋予概率值,且要求概率满足非负、规范、可列可加。
二者配合,才能严格定义“概率”——σ 域先圈定“能讨论的事件”,概率公理化再给这些事件“赋值规则”。
接下来是对内容里三条结论的证明
若Ai ∈ ℱ(i = 1, ⋯, n),则$\bigcup_{i = 1}^{n}A_i\in\mathcal{F}$且$\bigcap_{i = 1}^{n}A_i\in\mathcal{F}$
本质上就是在证明σ−代数对有限并和有限交的封闭性
证明$\boldsymbol{\bigcup_{i = 1}^{n}A_i\in\mathcal{F}}$:
利用 σ 域对可列并的封闭性,构造可列个事件:令An + 1 = An + 2 = ⋯ = ⌀(空集,根据后续易证⌀ ∈ ℱ),且由σ域定义,若A ∈ ℱ,$\overline{A}\in\mathcal{F}$,又Ω ∈ ℱ,则$\varnothing=\overline{\Omega}\in\mathcal{F}$。
此时$\bigcup_{i = 1}^{n}A_i=\bigcup_{i = 1}^{\infty}A_i$(因为后面添加的空集不影响并集结果 ),由于ℱ是 σ 域,对可列并封闭,即若Ai ∈ ℱ(i ≥ 1),则$\bigcup_{i = 1}^{\infty}A_i\in\mathcal{F}$,所以$\bigcup_{i = 1}^{n}A_i\in\mathcal{F}$ 。
证明$\boldsymbol{\bigcap_{i = 1}^{n}A_i\in\mathcal{F}}$:
根据德摩根律$\bigcap_{i = 1}^{n}A_i=\overline{\bigcup_{i = 1}^{n}\overline{A_i}}$ 。 已知Ai ∈ ℱ,由σ域对补集的封闭性(若A ∈ ℱ,则$\overline{A}\in\mathcal{F}$),可得$\overline{A_i}\in\mathcal{F}(i = 1,\cdots,n)$ 。
再由前面已证的 “有限个事件并集属于ℱ”,可知$\bigcup_{i = 1}^{n}\overline{A_i}\in\mathcal{F}$。
最后,再次利用补集封闭性,对$\bigcup_{i = 1}^{n}\overline{A_i}$取补集,即$\overline{\bigcup_{i = 1}^{n}\overline{A_i}}\in\mathcal{F}$,也就是$\bigcap_{i = 1}^{n}A_i\in\mathcal{F}$ 。
若Ai ∈ ℱ(i = 1, 2, ⋯),则$\bigcap_{i = 1}^{\infty}A_i\in\mathcal{F}$
根据德摩根律,$\bigcap_{i = 1}^{\infty}A_i=\overline{\bigcup_{i = 1}^{\infty}\overline{A_i}}$。
- 因为Ai ∈ ℱ,由σ域对补集的封闭性,$\overline{A_i}\in\mathcal{F}(i = 1,2,\cdots)$。
- 又因为ℱ是σ域,对可列并封闭,所以$\bigcup_{i = 1}^{\infty}\overline{A_i}\in\mathcal{F}$ 。
- 最后依据补集封闭性,对$\bigcup_{i = 1}^{\infty}\overline{A_i}$取补集,可得$\overline{\bigcup_{i = 1}^{\infty}\overline{A_i}}\in\mathcal{F}$,即$\bigcap_{i = 1}^{\infty}A_i\in\mathcal{F}$。
若A ∈ ℱ,B ∈ ℱ,则A − B ∈ ℱ
根据集合运算关系,$A - B = A\cap\overline{B}$ 。
- 已知B ∈ ℱ,由σ域对补集的封闭性,$\overline{B}\in\mathcal{F}$ 。
- 又A ∈ ℱ,再根据前面已证的 “两个事件交集属于ℱ”(n = 2时的结论 ),(A),也就是A − B ∈ ℱ 。
由此,可推导出概率的一些重要性质
不可能事件的概率为0,即 P(⌀) = 0
- 证明:
(有限可加性) 若事件Ai(i = 1, ⋯, n)中两两互不相容,则 $$ P\left(\sum_{i = 1}^{\infty}A_i\right)=\sum_{i = 1}^{\infty}P(A_i) $$
- 证明:
(逆事件概率的计算) $P(\overline A) = 1 - P(A)$
- 证明:
(差事件概率的计算和概率的单调性) 若 B ⊂ A,则 P(A − B) = P(A) − P(B),若A ⊆ B,则P(B) ≤ P(A)
- 证明
(加法公式) 对于任意两个事件A 和 B,有:P(A⋃B) = P(A) + P(B) − P(A ∩ B)
上述为两个加法公式的内容,可以扩展到多个
对于任意 n 个事件 A1, A2, …, An,有: $$ \begin{align*} P\left( \bigcup_{i = 1}^{n} A_i \right) &= \sum_{i = 1}^{n} P(A_i) - \sum_{1 \leq i < j \leq n} P(A_i \cap A_j) + \sum_{1 \leq i < j < k \leq n} P(A_i \cap A_j \cap A_k) - \dots \\ &\quad + (-1)^{n - 1} P(A_1 \cap A_2 \cap \dots \cap A_n) \end{align*} $$
- 证明:下面证
公式推导
加法公式
两个加法公式的推导过程
含义:“$A $或 $B $发生” 的概率,等于 A 发生概率加 B 发生概率,减去 “A 且 B 同时发生” 的概率(避免重复计算交集部分 )。
证明:
利用集合分解:将 A ∪ B 拆分为互不相交的三个部分(基于集合运算):
A ∪ B = A ∪ (B − A ∩ B)
其中 A 与 B − A ∩ B 是互不相容事件(即 A ∩ (B − A ∩ B) = ⌀,因为 B − A ∩ B 是 B 中去掉与 A 重叠的部分)。
根据概率的有限可加性(由”可列可加性”推导而来:若 A1, A2, …, An 两两互不相容,令 An + 1 = An + 2 = … = ⌀
结合可列可加性 $P\left(\bigcup_{i = 1}^{\infty} A_i\right) = \sum_{i = 1}^{\infty} P(A_i)$,可推出有限可加性 $P\left(\bigcup_{i = 1}^{n} A_i\right) = \sum_{i = 1}^{n} P(A_i)$),有:
P(A ∪ B) = P(A) + P(B − A ∩ B)
再看 B − A ∩ B,它等于 $B \cap \overline{A \cap B}$(差集定义),而根据概率的单调性与差事件公式
若 C ⊆ D,则 P(D − C) = P(D) − P(C)
可由”若 A, B ∈ ℱ,则 A − B ∈ ℱ“结合有限可加性推导:因为 D = C ∪ (D − C) 且 C 与 D − C 互不相容
所以 P(D) = P(C) + P(D − C),即 P(D − C) = P(D) − P(C))
由于 A ∩ B ⊆ B,因此:
P(B − A ∩ B) = P(B) − P(A ∩ B)
将上式代入 P(A ∪ B) = P(A) + P(B − A ∩ B),就得到:
P(A ∪ B) = P(A) + P(B) − P(A ∩ B)
多个加法公式的推导过程
含义:“至少一个事件发生” 的概率,通过容斥原理,交替加减 “单个事件概率”“两个事件交集概率”“三个事件交集概率”…… 最后加上(或减去 )“所有事件交集概率”,消除重复 / 遗漏计数。
证明:
数学归纳法秒了()))))
归纳假设: 假设对 n = k 个事件 A1, A2, …, Ak,加法公式成立,即: P( {i = 1}^{k} A_i ) = {i = 1}^{k} P(A_i) - {1 i < j k} P(A_i A_j) + + (-1)^{k - 1} P(A_1 A_k) $$ **归纳步骤($n = k + 1$)**: 把 $\bigcup_{i = 1}^{k + 1} A_i$ 看作 $\left( \bigcup_{i = 1}^{k} A_i \right) \cup A_{k + 1}$,利用两个事件的加法公式: $$ P( {i = 1}^{k + 1} A_i ) = P( {i = 1}^{k} A_i ) + P(A{k + 1}) - P( ( {i = 1}^{k} A_i ) A{k + 1} ) $$ 其中,$\left( \bigcup_{i = 1}^{k} A_i \right) \cap A_{k + 1} = \bigcup_{i = 1}^{k} (A_i \cap A_{k + 1})$(分配律:(A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C) 推广到 k 个集合)。
再对 $\bigcup_{i = 1}^{k} (A_i \cap A_{k + 1})$ 用归纳假设(把 Ai ∩ Ak + 1 看作新的”单个事件”),可得:
$$ \begin{aligned} P\left( \bigcup_{i = 1}^{k} (A_i \cap A_{k + 1}) \right) &= \sum_{i = 1}^{k} P(A_i \cap A_{k + 1}) \\ &\quad - \sum_{1 \leq i < j \leq k} P((A_i \cap A_{k + 1}) \cap (A_j \cap A_{k + 1})) \\ &\quad + \dots \\ &\quad + (-1)^{k - 1} P(A_1 \cap \dots \cap A_k \cap A_{k + 1}) \end{aligned} $$ 注意到 (Ai ∩ Ak + 1) ∩ (Aj ∩ Ak + 1) = Ai ∩ Aj ∩ Ak + 1,以此类推,将各项代入并整理后,可验证 n = k + 1 时公式也成立。
结合基例与归纳步骤,由数学归纳法可知,n 个事件的加法公式对任意正整数 n 成立。
可以看出这其实就是概率公理化定义中 “可列可加性” 的直接体现,也可看作加法公式在 “可列无穷、互不相容” 场景下的特殊形式。
条件概率公式
设 (Ω, ℱ, P) 是一个概率空间,A, B ∈ ℱ 是两个事件,且 P(B) > 0。事件 A 在给定 B 发生的条件下的条件概率定义为:
$$ P(A|B) = \frac{P(A \cap B)}{P(B)} $$
条件概率公式的推导过程
推导思路: 条件概率的本质是在已知事件 B 发生的情况下,重新定义概率测度。推导可以从以下两个角度理解:
几何直观法(面积比例):
- 将样本空间 Ω 看作单位面积
- P(B) 表示事件 B 的面积
- P(A ∩ B) 表示 A 和 B 同时发生的面积
- 在 B 发生的条件下,新的样本空间缩小为 B
- A 发生的”相对面积”就是 $\frac{P(A \cap B)}{P(B)}$
公理化推导: 条件概率 P(⋅|B) 必须满足概率的三条公理:
- 非负性:显然 P(A|B) ≥ 0
- 规范性:$P(\Omega|B) = \frac{P(\Omega \cap B)}{P(B)} = 1$
- 可列可加性:对于互不相容的事件序列 {Ai}: P({i=1}^A_i | B) = = {i=1}^ = _{i=1}^P(A_i|B) $$
严格推导步骤:
定义新的测度: 对于固定的事件 B 满足 P(B) > 0,定义: $$ P_B(A) = \frac{P(A \cap B)}{P(B)} $$
验证概率公理:
非负性:由于 P(A ∩ B) ≥ 0 且 P(B) > 0,故 PB(A) ≥ 0
规范性: $$ P_B(\Omega) = \frac{P(\Omega \cap B)}{P(B)} = \frac{P(B)}{P(B)} = 1 $$
可列可加性: 设 {Ai} 是互不相容的事件序列,则: $$ \begin{aligned} P_B\left(\bigcup_{i=1}^\infty A_i\right) &= \frac{P\left(\bigcup_{i=1}^\infty (A_i \cap B)\right)}{P(B)} \\ &= \frac{\sum_{i=1}^\infty P(A_i \cap B)}{P(B)} \\ &= \sum_{i=1}^\infty \frac{P(A_i \cap B)}{P(B)} \\ &= \sum_{i=1}^\infty P_B(A_i) \end{aligned} $$
结论: 因此,PB(⋅) 是一个合法的概率测度,我们将其记作 P(⋅|B),即: $$ P(A|B) = \frac{P(A \cap B)}{P(B)} $$
直观理解:
- 分子 P(A ∩ B):A 和 B 同时发生的概率
- 分母 P(B):对概率进行”归一化”,使得在新的条件下 P(B|B) = 1
- 比值反映了在 B 发生的”世界”中,A 发生的相对概率
条件概率公式也满足概率公理化的性质:非负,规范,可列可加
乘法概率公式
设 (Ω, ℱ, P) 是一个概率空间,A1, A2, …, An ∈ ℱ 是事件,且满足 $P\left(\bigcap_{i=1}^{k} A_i\right) > 0$ 对所有 k < n 成立。则乘法公式为:
$$ P\left(\bigcap_{i=1}^n A_i\right) = P(A_1) \cdot P(A_2|A_1) \cdot P(A_3|A_1 \cap A_2) \cdots P(A_n|A_1 \cap \cdots \cap A_{n-1}) $$
乘法公式的推导过程
推导思路: 乘法公式可以通过反复应用条件概率的定义得到。换一下的事
基础情形(n=2): 由条件概率定义直接可得: P(A1 ∩ A2) = P(A1) ⋅ P(A2|A1) 归纳步骤: 假设公式对 n = k 成立,证明对 n = k + 1 也成立: $$ \begin{aligned} P\left(\bigcap_{i=1}^{k+1} A_i\right) &= P\left(\left(\bigcap_{i=1}^k A_i\right) \cap A_{k+1}\right) \\ &= P\left(\bigcap_{i=1}^k A_i\right) \cdot P\left(A_{k+1}\bigg|\bigcap_{i=1}^k A_i\right) \\ &= \left[ \prod_{i=1}^k P\left(A_i \bigg| \bigcap_{j=1}^{i-1} A_j \right) \right] \cdot P\left(A_{k+1}\bigg|\bigcap_{i=1}^k A_i\right) \\ &= \prod_{i=1}^{k+1} P\left(A_i \bigg| \bigcap_{j=1}^{i-1} A_j \right) \end{aligned} $$ 完整推导:
数学归纳秒了)))
初始步骤: 对于两个事件 A1 和 A2,由条件概率定义: $$ P(A_2|A_1) = \frac{P(A_1 \cap A_2)}{P(A_1)} $$ 变形即得:
P(A1 ∩ A2) = P(A1) ⋅ P(A2|A1)
三个事件的情形: 对于三个事件 A1, A2, A3:
$$ \begin{aligned} P(A_1 \cap A_2 \cap A_3) &= P((A_1 \cap A_2) \cap A_3) \\ &= P(A_1 \cap A_2) \cdot P(A_3|A_1 \cap A_2) \\ &= P(A_1) \cdot P(A_2|A_1) \cdot P(A_3|A_1 \cap A_2) \end{aligned} $$
一般情形(数学归纳法):
基例:n = 2 时已证明成立
归纳假设:假设对 n = k 成立
归纳步骤:对 n = k + 1,有:
$$ \begin{aligned} P\left(\bigcap_{i=1}^{k+1} A_i\right) &= P\left(\left(\bigcap_{i=1}^k A_i\right) \cap A_{k+1}\right) \\ &= P\left(\bigcap_{i=1}^k A_i\right) \cdot P\left(A_{k+1}\bigg|\bigcap_{i=1}^k A_i\right) \\ &= \left[ \prod_{i=1}^k P\left(A_i \bigg| \bigcap_{j=1}^{i-1} A_j \right) \right] \cdot P\left(A_{k+1}\bigg|\bigcap_{i=1}^k A_i\right) \\ &= \prod_{i=1}^{k+1} P\left(A_i \bigg| \bigcap_{j=1}^{i-1} A_j \right) \end{aligned} $$
直观解释: 乘法公式描述的是多个事件同时发生的概率,可以理解为: 1. 第一个事件发生的概率 P(A1) 2. 在第一个事件发生的条件下,第二个事件发生的概率 P(A2|A1) 3. 在前两个事件都发生的条件下,第三个事件发生的概率 P(A3|A1 ∩ A2) … n. 在前 n − 1 个事件都发生的条件下,第 n 个事件发生的概率 P(An|A1 ∩ ⋯ ∩ An − 1)
这些概率的乘积就是所有事件同时发生的概率。
应用示例: 从一副52张的扑克牌中不放回地抽取3张牌,求都是A的概率: $$ \begin{aligned} P(A_1 \cap A_2 \cap A_3) &= P(A_1) \cdot P(A_2|A_1) \cdot P(A_3|A_1 \cap A_2) \\ &= \frac{4}{52} \cdot \frac{3}{51} \cdot \frac{2}{50} \end{aligned} $$
全概率公式
常用形式: $$ P(A) = P(A | B) P(B) + P(A | \overline B) P(\overline B) $$ 设 (Ω, ℱ, P) 是一个概率空间,{Bi}i = 1n 是样本空间 Ω 的一个划分
即满足:Bi ∩ Bj = ⌀ 对任意 i ≠ j,且 $\bigcup_{i=1}^n B_i = \Omega$
且 P(Bi) > 0 对所有 i 成立。则对任意事件 A ∈ ℱ,有: $$ P(A) = \sum_{i=1}^n P(A \cap B_i) = \sum_{i=1}^n P(B_i) \cdot P(A|B_i) $$
全概率公式的推导过程
推导思路: 全概率公式的核心思想是将复杂事件 A 分解到各个划分 Bi 上,通过”分而治之”的方式计算其概率。
B在Ω上划分的几何直观:
- 将样本空间 Ω 划分为若干互不重叠的区域 B1, B2, …, Bn
- 事件 A 与每个 Bi 的交 A ∩ Bi 互不相容
- A 的总面积等于它在各个 Bi 区域上面积的和
严格推导:
利用划分性质: 由于 {Bi} 是 Ω 的划分,可将 A 表示为: $$ A = A \cap \Omega = A \cap \left(\bigcup_{i=1}^n B_i\right) = \bigcup_{i=1}^n (A \cap B_i) $$
概率的可加性: 由于 Bi 互不相容,故 A ∩ Bi 也互不相容。由概率的可列可加性: $$ P(A) = P\left(\bigcup_{i=1}^n (A \cap B_i)\right) = \sum_{i=1}^n P(A \cap B_i) $$
引入条件概率: 根据条件概率定义 $P(A|B_i) = \frac{P(A \cap B_i)}{P(B_i)}$,可得: P(A ∩ Bi) = P(Bi) ⋅ P(A|Bi)
综合得到公式: 将步骤3代入步骤2: $$ P(A) = \sum_{i=1}^n P(B_i) \cdot P(A|B_i) $$
贝叶斯公式
设 (Ω, ℱ, P) 是一个概率空间,{Bi}i = 1n 是样本空间 Ω 的一个划分
即满足:Bi ∩ Bj = ⌀ 对任意 i ≠ j,且 $\bigcup_{i=1}^n B_i = \Omega$
且 P(Bi) > 0 对所有 i 成立。则对任意事件 A ∈ ℱ 且 P(A) > 0,有: $$ P(B_i|A) = \frac{P(B_i) \cdot P(A|B_i)}{\sum_{j=1}^n P(B_j) \cdot P(A|B_j)} = \frac{P(B_i) \cdot P(A|B_i)}{P(A)} $$
上面是乘法公式,下面是全概率公式的全划分,也就是P(A),0秒记住公式性质)))
贝叶斯公式的推导过程
推导思路: 贝叶斯公式本质上是条件概率定义与全概率公式的结合。
几何直观: - 已知各个”原因” Bi 及其导致”结果” A 的概率 - 当观察到结果 A 发生时,反推各个原因 Bi 的贡献比例
严格推导:
从条件概率定义出发: 由条件概率的定义: $$ P(B_i|A) = \frac{P(B_i \cap A)}{P(A)} $$
分子处理: 利用乘法公式: P(Bi ∩ A) = P(Bi) ⋅ P(A|Bi)
分母处理: 应用全概率公式: $$ P(A) = \sum_{j=1}^n P(B_j) \cdot P(A|B_j) $$
综合得到公式: 将步骤2和步骤3代入步骤1: $$ P(B_i|A) = \frac{P(B_i) \cdot P(A|B_i)}{\sum_{j=1}^n P(B_j) \cdot P(A|B_j)} $$
关键理解: - 先验概率 P(Bi):在观测 A 之前对 Bi 的初始信念 - 似然 P(A|Bi):在 Bi 成立的条件下 A 发生的概率 - 证据 P(A):标准化常数,确保概率总和为1 - 后验概率 P(Bi|A):观测到 A 后对 Bi 的更新信念
推广形式: 对连续随机变量,贝叶斯公式表现为: $$ \pi(\theta|x) = \frac{f(x|\theta)\pi(\theta)}{\int f(x|\theta)\pi(\theta)d\theta} $$ 其中 π(θ) 是先验分布,f(x|θ) 是似然函数,π(θ|x) 是后验分布。