原点矩
定义
设 X 是随机变量,k 为正整数,则 k 阶原点矩 定义为:
离散型原点矩 $$ v_k = \sum_{i = 1}^{n} x_i^k p_i $$
连续型原点矩: vk = ∫−∞+∞xikf(x) dx
解释
物理上,我们习惯把矩看作一杆能够取得两侧平衡的秤
在概率论中,有一杆无处不在的“秤”。因为这把“秤”的存在,所以我们有了“矩”。
这个矩可以理解为距离的意思,原点矩就是与原点,也就是与X轴上0点的距离。中心距,中心指的是变量的均值,那中心距就是与X轴上均值处的距离。
类比一下,将概率分布看作质量分布: - E[X1](一阶矩):系统的质心位置(均值),在概率论中直接反映随机变量的集中趋势(期望) - E[X2](二阶矩):质量分布的「转动惯量」,反映数据相对于原点的分散程度 - 。。。。。。。更高阶有更高阶的用途了
首先,E[Xk]是什么意思呢
对于离散型随机变量 X,其 k 阶原点矩 E[Xk] 的计算公式为: E[Xk] = ∑ixik ⋅ P(X = xi) 其中: - xi 是 X 的所有可能取值 - P(X = xi) 是对应的概率
那么很明显了,就是随机变量$ X^k$的期望
例子:掷骰子的结果 X(取值 1~6,等概率 1/6)
二阶矩计算: $$
E[X^2] = \sum_{i=1}^6 i^2 \cdot \frac{1}{6} = \frac{1+4+9+16+25+36}{6} =
\frac{91}{6} \approx 15.17
$$ 离散型的我们理解了,那么连续型的也是一样,对于连续型随机变量
X 的概率密度函数 f(x),其 k 阶原点矩为: E[Xk] = ∫−∞∞xkf(x) dx
k 阶原点矩是 Xk 以概率密度 f(x) 为权重的 “加权积分”
例子:X ∼ Uniform(0, 1)
二阶矩计算: $$
E[X^2] = \int_0^1 x^2 \cdot 1 \, dx = \left. \frac{x^3}{3} \right|_0^1 =
\frac{1}{3}
$$
性质
- 各阶原点矩的含义
- 一阶原点矩:m1 = E[X] = ∫−∞∞xf(x),易知就是期望
- 二阶原点矩:μ2 = E[X2],易知就是X2的期望,是计算方差的基础
- 三阶原点矩:一样,X3的期望
- 低阶矩对存在性的推导
- 若随机变量 X 的 k 阶原点矩存在(即 E[|Xk|] < +∞ ),则对于任意 0 < m < k,$m $ 阶原点矩也一定存在。这是因为 |Xm| ≤ 1 + |Xk|(当 |X| ≥ 1 时,|Xm| ≤ |Xk|;当 |X| < 1 时,|Xm| < 1 ),由期望的单调性可推出低阶矩存在,但反之不成立(高阶矩存在不能保证低阶矩存在,不过实际应用中通常先看低阶矩 )。
中心距
定义
设X为随机变量,k为正整数,则称 E[(X − EX)k] 为随机变量X的k阶中心矩,记为 ,k = 1, 2...
显而易见:一阶中心矩等于0,二阶中心矩就是方差DX。
离散型中心矩: $$ \mu_k = \sum_{i=1}^{n} (x_i - EX)^k p_i $$ 连续型中心矩: μk = ∫−∞+∞(x − EX)kf(x) dx
解释
基于上面的原点矩的解释,我们可以知道原点矩是与X轴上原点的距离。
那么中心距,中心指的是变量的均值,那中心距就是与X轴上均值处的距离。
可能这个东西计算上会一些抽象,我找一道例题做一下
离散型三阶中心距的计算
设离散型随机变量 X 的概率分布如下:
X | P(X) |
---|---|
-1 | 0.2 |
0 | 0.5 |
1 | 0.3 |
求 X 的三阶中心矩 μ3 = E[(X − E[X])3]
先计算期望 E[X] $$ \begin{aligned} E[X] &= \sum x_i P(X=x_i) \\ &= (-1) \times 0.2 + 0 \times 0.5 + 1 \times 0.3 \\ &= -0.2 + 0 + 0.3 \\ &= 0.1 \end{aligned} $$ 然后计算 Y = X − E[X] 的分布
定义 Y = X − 0.1,其分布为:
Y | P(Y) |
---|---|
-1 - 0.1 = -1.1 | 0.2 |
0 - 0.1 = -0.1 | 0.5 |
1 - 0.1 = 0.9 | 0.3 |
然后计算 E[Y3] $$ \begin{aligned} \mu_3 &= E[Y^3] = \sum y_i^3 P(Y=y_i) \\ &= (-1.1)^3 \times 0.2 + (-0.1)^3 \times 0.5 + (0.9)^3 \times 0.3 \\ &= -1.331 \times 0.2 + (-0.001) \times 0.5 + 0.729 \times 0.3 \\ &= -0.2662 - 0.0005 + 0.2187 \\ &= -0.048 \end{aligned} $$ 通过中心矩与原点矩的关系验证: μ3 = E[X3] − 3E[X]E[X2] + 2(E[X])3
计算 E[X2]: E[X2] = (−1)2 × 0.2 + 02 × 0.5 + 12 × 0.3 = 0.5
计算 E[X3]: E[X3] = (−1)3 × 0.2 + 03 × 0.5 + 13 × 0.3 = 0.1
代入公式: μ3 = 0.1 − 3 × 0.1 × 0.5 + 2 × (0.1)3 = 0.1 − 0.15 + 0.002 = −0.048
验证结果一致。
连续型二阶中心距的计算
设连续型随机变量 X 服从指数分布,其概率密度函数为: $$ f(x) = \begin{cases} \lambda e^{-\lambda x}, & x \geq 0 \\ 0, & x < 0 \end{cases} $$ 其中参数 λ > 0。
求 X 的二阶中心矩 μ2 = Var(X) = E[(X − E[X])2]
还是先计算期望E(X) $$ \begin{aligned} E[X] &= \int_{-\infty}^{\infty} x f(x) dx \\ &= \int_0^{\infty} x \cdot \lambda e^{-\lambda x} dx \\ &= \lambda \left[ \left. -x \cdot \frac{e^{-\lambda x}}{\lambda} \right|_0^{\infty} + \int_0^{\infty} \frac{e^{-\lambda x}}{\lambda} dx \right] \quad \text{(分部积分)} \\ &= \lambda \left[ 0 + \frac{1}{\lambda} \cdot \frac{1}{\lambda} \right] \\ &= \frac{1}{\lambda} \end{aligned} $$ 然后计算E(X2) $$ \begin{aligned} E[X^2] &= \int_0^{\infty} x^2 \cdot \lambda e^{-\lambda x} dx \\ &= \lambda \left[ \left. -x^2 \cdot \frac{e^{-\lambda x}}{\lambda} \right|_0^{\infty} + \int_0^{\infty} \frac{2x e^{-\lambda x}}{\lambda} dx \right] \quad \text{(分部积分)} \\ &= \lambda \left[ 0 + \frac{2}{\lambda} E[X] \right] \\ &= \frac{2}{\lambda} \cdot \frac{1}{\lambda} \\ &= \frac{2}{\lambda^2} \end{aligned} $$ 分部积分的公式我总忘,贴一下 ∫u dv = uv − ∫v du, u = xn, 在这里dv = e−λx dx 计算二阶中心矩 μ2 $$ \begin{aligned} \mu_2 &= \text{Var}(X) = E[X^2] - (E[X])^2 \\ &= \frac{2}{\lambda^2} - \left( \frac{1}{\lambda} \right)^2 \\ &= \frac{1}{\lambda^2} \end{aligned} $$ 直接积分验证
也可直接计算 $E[(X-\frac{1}{\lambda})^2]$: $$ \begin{aligned} \mu_2 &= \int_0^{\infty} \left(x - \frac{1}{\lambda}\right)^2 \lambda e^{-\lambda x} dx \\ &= \lambda \int_0^{\infty} \left(x^2 - \frac{2x}{\lambda} + \frac{1}{\lambda^2}\right) e^{-\lambda x} dx \\ &= \lambda E[X^2] - 2 E[X] + \frac{1}{\lambda} \\ &= \lambda \cdot \frac{2}{\lambda^2} - 2 \cdot \frac{1}{\lambda} + \frac{1}{\lambda} \\ &= \frac{1}{\lambda^2} \quad \text{(结果一致)} \end{aligned} $$
$$
$$
性质
显而易见:一阶中心矩等于0,二阶中心矩就是方差DX。(在概率论与数理统计中常用的低阶矩,高于4阶的极少使用。)
中心矩 计算公式 统计意义 μ1 E[X − E[X]] = 0 均值偏差恒为零 μ2 E[(X − E[X])2] = D(X) 方差 μ3 E[(X − E[X])3] 标准化后得偏度 μ4 E[(X − E[X])4] 标准化后得峰度