前言

在这里主要是进行求一些常见分布的一些数字特性,包括期望,方差等

主要写的是计算过程,这些分布的数字特征是怎么计算来的,我个人喜欢把计算过程写的比较详细,感觉多的大概扫一眼就知道这东西其实都是怎么求的了

两点分布

重复一下分布表示

设随机变量 X 服从参数为 p 的两点分布(也称为伯努利分布),其概率质量函数为:

P(X = 1) = p,  P(X = 0) = 1 − p

其中 0 ≤ p ≤ 1

期望(数学期望)

期望 E[X] 的计算公式为:

E[X] = ∑xx ⋅ P(X = x) = 0 ⋅ P(X = 0) + 1 ⋅ P(X = 1)

代入概率质量函数:

E[X] = 0 ⋅ (1 − p) + 1 ⋅ p = p

因此,两点分布的期望为:

E[X] = p

方差

方差 D(X) 的计算公式为:

D(X) = E[X2] − (E[X])2

计算 E[X2] E[X2] = ∑xx2 ⋅ P(X = x) = 02 ⋅ P(X = 0) + 12 ⋅ P(X = 1)

代入概率质量函数:

E[X2] = 0 ⋅ (1 − p) + 1 ⋅ p = p

E[X2] = pE[X] = p 代入方差公式:

D(X) = p − p2 = p(1 − p)

因此,两点分布的方差为:

D(X) = p(1 − p)

标准差

标准差是方差的平方根:

$$ \sigma_X = \sqrt{\text{Var}(X)} = \sqrt{p(1 - p)} $$

矩生成函数(MGF)

矩生成函数 MX(t) 的定义为:

MX(t) = E[etX] = ∑xetxP(X = x)

代入概率质量函数:

MX(t) = et ⋅ 0P(X = 0) + et ⋅ 1P(X = 1) = (1 − p) + etp

因此,矩生成函数为:

MX(t) = 1 − p + pet

特征函数

特征函数 ϕX(t) 的定义为:

ϕX(t) = E[eitX] = ∑xeitxP(X = x)

代入概率质量函数:

ϕX(t) = eit ⋅ 0P(X = 0) + eit ⋅ 1P(X = 1) = (1 − p) + eitp

因此,特征函数为:

ϕX(t) = 1 − p + peit

总结

对于两点分布 X ∼ Bernoulli(p),其数字特征为:

  • 期望:E[X] = p
  • 方差:D(X) = p(1 − p)
  • 标准差:$\sigma_X = \sqrt{p(1 - p)}$
  • 矩生成函数:MX(t) = 1 − p + pet
  • 特征函数:ϕX(t) = 1 − p + peit

二项分布

重复一下分布表示

设随机变量 X 服从参数为 np 的二项分布,记作 X ∼ Binomial(n, p),其概率质量函数为:

$$ P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}, \quad k = 0, 1, \dots, n $$

其中 0 ≤ p ≤ 1n 为正整数。

期望(数学期望)

期望 E[X] 的计算公式为:

$$ E[X] = \sum_{k=0}^n k \cdot P(X = k) = \sum_{k=0}^n k \binom{n}{k} p^k (1 - p)^{n - k} $$

利用组合恒等式 $k \binom{n}{k} = n \binom{n - 1}{k - 1}$k ≥ 1),重新表示求和:

$$ E[X] = \sum_{k=1}^n n \binom{n - 1}{k - 1} p^k (1 - p)^{n - k} $$

提取 np,并令 j = k − 1

$$ E[X] = n p \sum_{j=0}^{n - 1} \binom{n - 1}{j} p^j (1 - p)^{n - 1 - j} $$

求和部分是二项式展开 (p + (1 − p))n − 1 = 1,因此:

E[X] = np

因此,二项分布的期望为:

E[X] = np

方差

方差 D(X) 的计算公式为:

D(X) = E[X2] − (E[X])2

计算 E[X2]

首先计算 E[X(X − 1)]

$$ E[X(X - 1)] = \sum_{k=0}^n k (k - 1) \binom{n}{k} p^k (1 - p)^{n - k} $$

对于 k ≥ 2,利用恒等式 $k (k - 1) \binom{n}{k} = n (n - 1) \binom{n - 2}{k - 2}$

$$ E[X(X - 1)] = \sum_{k=2}^n n (n - 1) \binom{n - 2}{k - 2} p^k (1 - p)^{n - k} $$

提取 n(n − 1)p2,并令 j = k − 2

$$ E[X(X - 1)] = n (n - 1) p^2 \sum_{j=0}^{n - 2} \binom{n - 2}{j} p^j (1 - p)^{n - 2 - j} $$

求和部分是二项式展开 (p + (1 − p))n − 2 = 1,因此:

E[X(X − 1)] = n(n − 1)p2

注意到 E[X2] = E[X(X − 1)] + E[X],因此:

E[X2] = n(n − 1)p2 + np

E[X2]E[X] = np 代入方差公式:

D(X) = n(n − 1)p2 + np − (np)2 = np(1 − p)

因此,二项分布的方差为:

D(X) = np(1 − p)

标准差

标准差是方差的平方根:

$$ \sigma_X = \sqrt{D(X)} = \sqrt{n p (1 - p)} $$

矩生成函数(MGF)

矩生成函数 MX(t) 的定义为:

$$ M_X(t) = E[e^{tX}] = \sum_{k=0}^n e^{t k} \binom{n}{k} p^k (1 - p)^{n - k} $$

etkpk 合并:

$$ M_X(t) = \sum_{k=0}^n \binom{n}{k} (p e^t)^k (1 - p)^{n - k} $$

根据二项式定理,求和结果为:

MX(t) = (1 − p + pet)n

因此,矩生成函数为:

MX(t) = (1 − p + pet)n

特征函数

特征函数 ϕX(t) 的定义为:

$$ \phi_X(t) = E[e^{i t X}] = \sum_{k=0}^n e^{i t k} \binom{n}{k} p^k (1 - p)^{n - k} $$

类似矩生成函数的推导:

$$ \phi_X(t) = \sum_{k=0}^n \binom{n}{k} (p e^{i t})^k (1 - p)^{n - k} = \left(1 - p + p e^{i t}\right)^n $$

因此,特征函数为:

ϕX(t) = (1 − p + peit)n

总结

对于二项分布 X ∼ Binomial(n, p),其数字特征为:

  • 期望:E[X] = np
  • 方差:D(X) = np(1 − p)
  • 标准差:$\sigma_X = \sqrt{n p (1 - p)}$
  • 矩生成函数:MX(t) = (1 − p + pet)n
  • 特征函数:ϕX(t) = (1 − p + peit)n

泊松分布

重复一下分布表示

设随机变量 X 服从参数为 λ 的泊松分布,记作 X ∼ Poisson(λ),其概率质量函数为:

$$ P(X = k) = \frac{e^{-\lambda} \lambda^k}{k!}, \quad k = 0, 1, 2, \dots $$

其中 λ > 0

期望(数学期望)

期望 E[X] 的计算公式为:

$$ E[X] = \sum_{k=0}^\infty k \cdot \frac{e^{-\lambda} \lambda^k}{k!} $$

计算期望 $ E[X] :$ E[X] = {k=0}^k P(X=k) = {k=0}^k $$ 当 $ k=0$ 时,首项为 0: $$ 0 = 0 $$ 因此求和下限从 $ k=1 $ 开始: $$ E[X] = _{k=1}^k $$

化简 $ :$ = $$

代入原式得: $$ E[X] = e^{-\lambda} \sum_{k=1}^\infty \frac{\lambda^k}{(k-1)!} $$ 其中令 j = k − 1,并利用 eλ 的泰勒展开,

变量替换 $ j = k-1 $:

当 $ k=1 $ 时,$ j=0 $;当 $ k $ 时,$ j $。

同时,$ k = j+1 $ E[X] = e^{-} {j=0}^ = e^{-} {j=0}^ $$ 之后利用指数函数的泰勒展开:

已知指数函数的泰勒级数为: $$ e^x = \sum_{j=0}^\infty \frac{x^j}{j!} $$ 令 $ x = $ _{j=0}^ = e^ E[X] = e^{-} e^= e^{-+ } = = $$ 因此,泊松分布的期望为:

E[X] = λ

方差

方差 D(X) 的计算公式为:

D(X) = E[X2] − (E[X])2

计算 E[X2]

通过 E[X(X − 1)] 计算:

$$ E[X(X-1)] = \sum_{k=0}^\infty k(k-1) \frac{e^{-\lambda} \lambda^k}{k!} = e^{-\lambda} \lambda^2 \sum_{k=2}^\infty \frac{\lambda^{k-2}}{(k-2)!} = \lambda^2 $$

因此:

E[X2] = E[X(X − 1)] + E[X] = λ2 + λ

那么方差 D(X) = (λ2 + λ) − λ2 = λ

因此,泊松分布的方差为:

D(X) = λ

标准差

标准差是方差的平方根:

$$ \sigma_X = \sqrt{D(X)} = \sqrt{\lambda} $$

矩生成函数(MGF)

矩生成函数 MX(t) 的定义为:

$$ M_X(t) = E[e^{tX}] = \sum_{k=0}^\infty e^{tk} \frac{e^{-\lambda} \lambda^k}{k!} = e^{-\lambda} \sum_{k=0}^\infty \frac{(\lambda e^t)^k}{k!} $$

根据指数函数的泰勒展开:

MX(t) = eλeλet = eλ(et − 1)

因此,矩生成函数为:

MX(t) = eλ(et − 1)

特征函数

特征函数 ϕX(t) 的定义为:

$$ \phi_X(t) = E[e^{itX}] = \sum_{k=0}^\infty e^{itk} \frac{e^{-\lambda} \lambda^k}{k!} = e^{-\lambda} \sum_{k=0}^\infty \frac{(\lambda e^{it})^k}{k!} $$

同样利用指数函数的展开:

ϕX(t) = eλeλeit = eλ(eit − 1)

因此,特征函数为:

ϕX(t) = eλ(eit − 1)

总结

对于泊松分布 X ∼ Poisson(λ),其数字特征为:

  • 期望:E[X] = λ
  • 方差:D(X) = λ
  • 标准差:$\sigma_X = \sqrt{\lambda}$
  • 矩生成函数:MX(t) = eλ(et − 1)
  • 特征函数:ϕX(t) = eλ(eit − 1)

均匀分布

重复一下分布表示

上面都是离散的,这次是连续的

设随机变量 X 服从区间 [a, b] 上的均匀分布,记作 X ∼ U(a, b),其概率密度函数为:

$$ f(x) = \begin{cases} \frac{1}{b-a}, & a \leq x \leq b \\ 0, & \text{其他} \end{cases} $$

其中 −∞ < a < b < ∞

期望(数学期望)

期望 E[X] 的计算公式为:

$$ E[X] = \int_{-\infty}^{\infty} x f(x) dx = \int_a^b x \cdot \frac{1}{b-a} dx $$

计算积分:

$$ E[X] = \frac{1}{b-a} \int_a^b x dx = \frac{1}{b-a} \left[ \frac{x^2}{2} \right]_a^b = \frac{b^2 - a^2}{2(b-a)} = \frac{a + b}{2} $$

因此,均匀分布的期望为:

$$ E[X] = \frac{a + b}{2} $$

方差

方差 D(X) 的计算公式为:

D(X) = E[X2] − (E[X])2

计算 E[X2] $$ E[X^2] = \int_{-\infty}^{\infty} x^2 f(x) dx = \int_a^b x^2 \cdot \frac{1}{b-a} dx $$

计算积分:

$$ E[X^2] = \frac{1}{b-a} \int_a^b x^2 dx = \frac{1}{b-a} \left[ \frac{x^3}{3} \right]_a^b = \frac{b^3 - a^3}{3(b-a)} $$

因式分解分子:

b3 − a3 = (b − a)(b2 + ab + a2)

因此:

$$ E[X^2] = \frac{b^2 + ab + a^2}{3} $$

E[X2]$E[X] = \frac{a+b}{2}$ 代入:

$$ D(X) = \frac{b^2 + ab + a^2}{3} - \left( \frac{a+b}{2} \right)^2 = \frac{4(b^2 + ab + a^2) - 3(a^2 + 2ab + b^2)}{12} = \frac{(b-a)^2}{12} $$

因此,均匀分布的方差为:

$$ D(X) = \frac{(b - a)^2}{12} $$

标准差

标准差是方差的平方根:

$$ \sigma_X = \sqrt{D(X)} = \frac{b - a}{2\sqrt{3}} $$

矩生成函数(MGF)

矩生成函数 MX(t) 的定义为:

$$ M_X(t) = E[e^{tX}] = \int_a^b e^{tx} \cdot \frac{1}{b-a} dx $$

计算积分(当 t ≠ 0 时):

$$ M_X(t) = \frac{1}{b-a} \left[ \frac{e^{tx}}{t} \right]_a^b = \frac{e^{tb} - e^{ta}}{t(b-a)} $$

t = 0 时:

MX(0) = E[e0] = 1

因此,矩生成函数为:

$$ M_X(t) = \begin{cases} \frac{e^{tb} - e^{ta}}{t(b-a)}, & t \neq 0 \\ 1, & t = 0 \end{cases} $$

特征函数

特征函数 ϕX(t) 的定义为:

$$ \phi_X(t) = E[e^{itX}] = \int_a^b e^{itx} \cdot \frac{1}{b-a} dx $$

计算积分:

$$ \phi_X(t) = \frac{1}{b-a} \left[ \frac{e^{itx}}{it} \right]_a^b = \frac{e^{itb} - e^{ita}}{it(b-a)} $$

因此,特征函数为:

$$ \phi_X(t) = \frac{e^{itb} - e^{ita}}{it(b-a)} $$

总结

对于均匀分布 X ∼ U(a, b),其数字特征为:

  • 期望:$E[X] = \frac{a + b}{2}$
  • 方差:$D(X) = \frac{(b - a)^2}{12}$
  • 标准差:$\sigma_X = \frac{b - a}{2\sqrt{3}}$
  • 矩生成函数: $$ M_X(t) = \begin{cases} \frac{e^{tb} - e^{ta}}{t(b-a)}, & t \neq 0 \\ 1, & t = 0 \end{cases} $$
  • 特征函数:$\phi_X(t) = \frac{e^{itb} - e^{ita}}{it(b-a)}$

指数分布的数字特征

重复一下分布表示

设随机变量 X 服从参数为 λ 的指数分布,记作 X ∼ Exp(λ),其概率密度函数为:

$$ f(x) = \begin{cases} \lambda e^{-\lambda x}, & x \geq 0 \\ 0, & x < 0 \end{cases} $$

其中 λ > 0

期望(数学期望)

期望 E[X] 的计算公式为:

E[X] = ∫−∞xf(x)dx = ∫0xλeλxdx

使用分部积分法计算: 设 u = xdv = λeλxdx,则 du = dxv = −eλx

$$ E[X] = \left[ -x e^{-\lambda x} \right]_0^{\infty} + \int_0^{\infty} e^{-\lambda x} dx = 0 + \left[ -\frac{1}{\lambda} e^{-\lambda x} \right]_0^{\infty} = \frac{1}{\lambda} $$

因此,指数分布的期望为:

$$ E[X] = \frac{1}{\lambda} $$

方差

方差 D(X) 的计算公式为:

D(X) = E[X2] − (E[X])2

计算 E[X2] E[X2] = ∫0x2λeλxdx

使用分部积分法: 设 u = x2dv = λeλxdx,则 du = 2xdxv = −eλx

$$ E[X^2] = \left[ -x^2 e^{-\lambda x} \right]_0^{\infty} + 2\int_0^{\infty} x e^{-\lambda x} dx = 0 + \frac{2}{\lambda} E[X] = \frac{2}{\lambda^2} $$

计算方差 $$ D(X) = \frac{2}{\lambda^2} - \left( \frac{1}{\lambda} \right)^2 = \frac{1}{\lambda^2} $$

因此,指数分布的方差为:

$$ D(X) = \frac{1}{\lambda^2} $$

标准差

标准差是方差的平方根:

$$ \sigma_X = \sqrt{D(X)} = \frac{1}{\lambda} $$

矩生成函数(MGF)

矩生成函数 MX(t) 的定义为:

MX(t) = E[etX] = ∫0etxλeλxdx = λ0e−(λ − t)xdx

t < λ 时积分收敛:

$$ M_X(t) = \lambda \left[ \frac{e^{-(\lambda - t)x}}{-(\lambda - t)} \right]_0^{\infty} = \frac{\lambda}{\lambda - t} $$

因此,矩生成函数为:

$$ M_X(t) = \frac{\lambda}{\lambda - t}, \quad t < \lambda $$

特征函数

特征函数 ϕX(t) 的定义为:

ϕX(t) = E[eitX] = ∫0eitxλeλxdx = λ0e−(λ − it)xdx

计算积分:

$$ \phi_X(t) = \lambda \left[ \frac{e^{-(\lambda - it)x}}{-(\lambda - it)} \right]_0^{\infty} = \frac{\lambda}{\lambda - it} $$

因此,特征函数为:

$$ \phi_X(t) = \frac{\lambda}{\lambda - it} $$

总结

对于指数分布 X ∼ Exp(λ),其数字特征为:

  • 期望:$E[X] = \frac{1}{\lambda}$
  • 方差:$D(X) = \frac{1}{\lambda^2}$
  • 标准差:$\sigma_X = \frac{1}{\lambda}$
  • 矩生成函数:$M_X(t) = \frac{\lambda}{\lambda - t}, \quad t < \lambda$
  • 特征函数:$\phi_X(t) = \frac{\lambda}{\lambda - it}$

正态分布

重复一下分布形式

设随机变量 X 服从参数为 μσ2 的正态分布,记作 X ∼ N(μ, σ2),其概率密度函数为:

$$ f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}}, \quad -\infty < x < \infty $$

其中 μ ∈ ℝσ > 0

期望(数学期望)

期望 E[X] 的计算公式为:

$$ E[X] = \int_{-\infty}^{\infty} x f(x) dx = \frac{1}{\sqrt{2\pi}\sigma} \int_{-\infty}^{\infty} x e^{-\frac{(x-\mu)^2}{2\sigma^2}} dx $$

作变量替换 $z = \frac{x-\mu}{\sigma}$,则 x = μ + σzdx = σdz

$$ E[X] = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} (\mu + \sigma z) e^{-\frac{z^2}{2}} dz $$

拆分为两个积分:

$$ E[X] = \mu \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} e^{-\frac{z^2}{2}} dz + \frac{\sigma}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z e^{-\frac{z^2}{2}} dz $$

第一个积分等于1(标准正态分布的全概率),第二个积分是奇函数在对称区间积分为0:

$$ E[X] = \mu \cdot 1 + \frac{\sigma}{\sqrt{2\pi}} \cdot 0 = \mu $$

因此,正态分布的期望为:

E[X] = μ

方差

方差 D(X) 的计算公式为:

$$ D(X) = E[(X-\mu)^2] = \frac{1}{\sqrt{2\pi}\sigma} \int_{-\infty}^{\infty} (x-\mu)^2 e^{-\frac{(x-\mu)^2}{2\sigma^2}} dx $$

同样作变量替换 $z = \frac{x-\mu}{\sigma}$

$$ D(X) = \frac{\sigma^2}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z^2 e^{-\frac{z^2}{2}} dz $$

利用分部积分法,设 u = z$dv = z e^{-\frac{z^2}{2}}dz$,则 du = dz$v = -e^{-\frac{z^2}{2}}$

$$ \int z^2 e^{-\frac{z^2}{2}} dz = -z e^{-\frac{z^2}{2}} \Big|_{-\infty}^{\infty} + \int e^{-\frac{z^2}{2}} dz = \sqrt{2\pi} $$

因此:

$$ D(X) = \frac{\sigma^2}{\sqrt{2\pi}} \cdot \sqrt{2\pi} = \sigma^2 $$

因此,正态分布的方差为:

D(X) = σ2

标准差

标准差是方差的平方根:

$$ \sigma_X = \sqrt{D(X)} = \sigma $$

矩生成函数(MGF)

矩生成函数 MX(t) 的定义为:

$$ M_X(t) = E[e^{tX}] = \frac{1}{\sqrt{2\pi}\sigma} \int_{-\infty}^{\infty} e^{tx} e^{-\frac{(x-\mu)^2}{2\sigma^2}} dx $$

合并指数项并配方:

$$ tx - \frac{(x-\mu)^2}{2\sigma^2} = -\frac{x^2 - 2\mu x + \mu^2 - 2\sigma^2 t x}{2\sigma^2} = -\frac{x^2 - 2(\mu + \sigma^2 t)x + \mu^2}{2\sigma^2} $$

配方得:

$$ = -\frac{[x - (\mu + \sigma^2 t)]^2 - (\mu + \sigma^2 t)^2 + \mu^2}{2\sigma^2} = -\frac{[x - (\mu + \sigma^2 t)]^2}{2\sigma^2} + \mu t + \frac{\sigma^2 t^2}{2} $$

因此:

$$ M_X(t) = e^{\mu t + \frac{\sigma^2 t^2}{2}} \cdot \frac{1}{\sqrt{2\pi}\sigma} \int_{-\infty}^{\infty} e^{-\frac{[x - (\mu + \sigma^2 t)]^2}{2\sigma^2}} dx = e^{\mu t + \frac{\sigma^2 t^2}{2}} $$

因此,矩生成函数为:

$$ M_X(t) = e^{\mu t + \frac{\sigma^2 t^2}{2}} $$

特征函数

特征函数 ϕX(t) 的定义为:

$$ \phi_X(t) = E[e^{itX}] = M_X(it) = e^{\mu it + \frac{\sigma^2 (it)^2}{2}} = e^{i\mu t - \frac{\sigma^2 t^2}{2}} $$

因此,特征函数为:

$$ \phi_X(t) = e^{i\mu t - \frac{\sigma^2 t^2}{2}} $$

总结

对于正态分布 X ∼ N(μ, σ2),其数字特征为:

  • 期望:E[X] = μ
  • 方差:D(X) = σ2
  • 标准差:σX = σ
  • 矩生成函数:$M_X(t) = e^{\mu t + \frac{\sigma^2 t^2}{2}}$
  • 特征函数:$\phi_X(t) = e^{i\mu t - \frac{\sigma^2 t^2}{2}}$

χ2分布

重复一下分布形式

Z1, Z2, …, Zn 是独立同分布的标准正态随机变量(即 Zi ∼ N(0, 1)),则随机变量: $$ \chi^2 = \sum_{i=1}^n Z_i^2 $$ 服从自由度为 n 的卡方分布,记作 X ∼ χ2(n)

对于 x > 0,其概率密度函数为: $$ f(x;n) = \frac{1}{2^{n/2}\Gamma(n/2)} x^{n/2-1} e^{-x/2} $$ 其中 Γ(⋅) 是Gamma函数,满足: - Γ(k) = (k − 1)!k 为正整数 - $\Gamma(1/2) = \sqrt{\pi}$

数学期望

推导过程$$ \begin{aligned} E[X] &= E\left[\sum_{i=1}^n Z_i^2\right] \\ &= \sum_{i=1}^n E[Z_i^2] \quad \text{(线性性质)} \\ &= n \cdot E[Z_1^2] \quad \text{(同分布)} \\ &= n \cdot \left(\text{Var}(Z_1) + (E[Z_1])^2\right) \\ &= n \cdot (1 + 0) = n \end{aligned} $$

方差

推导过程: 先计算 E[X2]$$ \begin{aligned} E[X^2] &= E\left[\left(\sum_{i=1}^n Z_i^2\right)^2\right] \\ &= E\left[\sum_{i=1}^n Z_i^4 + 2\sum_{i<j} Z_i^2 Z_j^2\right] \\ &= n E[Z_1^4] + 2\binom{n}{2} E[Z_1^2]E[Z_2^2] \quad \text{(独立性)} \end{aligned} $$

计算 E[Z14](标准正态的四阶矩): 通过特征函数或直接积分: $$ E[Z^4] = \int_{-\infty}^\infty z^4 \frac{1}{\sqrt{2\pi}} e^{-z^2/2} dz = 3 $$

因此: $$ \begin{aligned} E[X^2] &= n \cdot 3 + n(n-1) \cdot 1 \cdot 1 \\ &= 3n + n^2 - n = n^2 + 2n \end{aligned} $$

最终方差: D(X) = E[X2] − (E[X])2 = (n2 + 2n) − n2 = 2n

矩母函数 (MGF)

矩母函数定义为 MX(t) = E[etX]$$ \begin{aligned} M_X(t) &= E\left[\exp\left(t \sum_{i=1}^n Z_i^2\right)\right] \\ &= \prod_{i=1}^n E\left[e^{t Z_i^2}\right] \quad \text{(独立性)} \\ &= \left(E[e^{t Z_1^2}]\right)^n \quad \text{(同分布)} \end{aligned} $$

计算单个 E[etZ2]t < 1/2): $$ \begin{aligned} E[e^{t Z^2}] &= \int_{-\infty}^\infty e^{t z^2} \frac{1}{\sqrt{2\pi}} e^{-z^2/2} dz \\ &= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^\infty e^{-(1/2 - t)z^2} dz \\ &= (1 - 2t)^{-1/2} \quad \text{(高斯积分)} \end{aligned} $$

因此: $$ M_X(t) = (1 - 2t)^{-n/2}, \quad t < \frac{1}{2} $$

总结

对于 X ∼ χ2(n),数字特征为

  • 期望:n
  • 方差:2n
  • MGF:MX(t) = (1 − 2t)n/2

t分布

重复一下分布形式

Z ∼ N(0, 1)V ∼ χ2(n) 相互独立,则随机变量: $$ T = \frac{Z}{\sqrt{V/n}} $$ 服从自由度为 n 的t分布,记作 T ∼ t(n)

对于 −∞ < t < ∞,其概率密度函数为: $$ f(t;n) = \frac{\Gamma\left(\frac{n+1}{2}\right)}{\sqrt{n\pi}\Gamma\left(\frac{n}{2}\right)} \left(1 + \frac{t^2}{n}\right)^{-(n+1)/2} $$

期望计算

n > 1E[T] = 0

推导过程$$ \begin{aligned} E[T] &= E\left[\frac{Z}{\sqrt{V/n}}\right] \\ &= E[Z] \cdot E\left[\frac{1}{\sqrt{V/n}}\right] \quad \text{(独立性)} \\ &= 0 \cdot E\left[\frac{1}{\sqrt{V/n}}\right] = 0 \end{aligned} $$ 注:当 n = 1 时(柯西分布),期望不存在

方差计算

n > 2$$ \text{Var}(T) = \frac{n}{n-2} $$

推导过程: 先计算 E[T2]$$ \begin{aligned} E[T^2] &= E\left[\frac{Z^2}{V/n}\right] \\ &= n E[Z^2] E\left[\frac{1}{V}\right] \quad \text{(独立性)} \\ &= n \cdot 1 \cdot E\left[\frac{1}{V}\right] \end{aligned} $$

计算 E[1/V],其中 V ∼ χ2(n)$$ \begin{aligned} E\left[\frac{1}{V}\right] &= \int_0^\infty \frac{1}{v} \frac{v^{n/2-1}e^{-v/2}}{2^{n/2}\Gamma(n/2)} dv \\ &= \frac{1}{2^{n/2}\Gamma(n/2)} \int_0^\infty v^{n/2-2} e^{-v/2} dv \\ &= \frac{\Gamma(n/2-1)}{2\Gamma(n/2)} \cdot 2^{n/2-1} \quad \text{(令 $u=v/2$)} \\ &= \frac{1}{2(n/2 - 1)} = \frac{1}{n-2} \end{aligned} $$

因此: $$ \text{Var}(T) = E[T^2] - (E[T])^2 = \frac{n}{n-2} - 0 = \frac{n}{n-2} $$

注:当 n ≤ 2 时方差不存在

高阶矩

k < n 时,k阶矩存在

  • 奇数阶矩为0(对称性)
  • 偶数阶矩: $$ E[T^{2m}] = n^m \frac{\Gamma(m+1/2)\Gamma((n-2m)/2)}{\sqrt{\pi}\Gamma(n/2)}, \quad 2m < n $$

特例(峰度): 当 n > 4 时: $$ \text{Kurtosis} = \frac{6}{n-4} $$

Γ分布

重复一下分布形式

设随机变量 X 服从形状参数为 α、尺度参数为 β 的Gamma分布,记作 X ∼ Gamma(α, β),其概率密度函数为:

$$ f(x) = \begin{cases} \frac{\beta^\alpha}{\Gamma(\alpha)} x^{\alpha-1} e^{-\beta x}, & x > 0 \\ 0, & x \leq 0 \end{cases} $$

其中 α > 0β > 0Γ(α) 是Gamma函数。

期望(数学期望)

期望 E[X] 的计算公式为:

$$ E[X] = \int_{0}^{\infty} x f(x) dx = \frac{\beta^\alpha}{\Gamma(\alpha)} \int_{0}^{\infty} x^{\alpha} e^{-\beta x} dx $$

利用Gamma函数的定义 Γ(α + 1) = αΓ(α) 和积分性质:

$$ \int_{0}^{\infty} x^{\alpha} e^{-\beta x} dx = \frac{\Gamma(\alpha+1)}{\beta^{\alpha+1}} = \frac{\alpha \Gamma(\alpha)}{\beta^{\alpha+1}} $$

因此:

$$ E[X] = \frac{\beta^\alpha}{\Gamma(\alpha)} \cdot \frac{\alpha \Gamma(\alpha)}{\beta^{\alpha+1}} = \frac{\alpha}{\beta} $$

方差

方差 D(X) 的计算公式为:

D(X) = E[X2] − (E[X])2

计算 E[X2] $$ E[X^2] = \frac{\beta^\alpha}{\Gamma(\alpha)} \int_{0}^{\infty} x^{\alpha+1} e^{-\beta x} dx $$

利用Gamma函数性质:

$$ \int_{0}^{\infty} x^{\alpha+1} e^{-\beta x} dx = \frac{\Gamma(\alpha+2)}{\beta^{\alpha+2}} = \frac{(\alpha+1)\alpha \Gamma(\alpha)}{\beta^{\alpha+2}} $$

因此:

$$ E[X^2] = \frac{\beta^\alpha}{\Gamma(\alpha)} \cdot \frac{(\alpha+1)\alpha \Gamma(\alpha)}{\beta^{\alpha+2}} = \frac{\alpha(\alpha+1)}{\beta^2} $$

计算方差 $$ D(X) = \frac{\alpha(\alpha+1)}{\beta^2} - \left( \frac{\alpha}{\beta} \right)^2 = \frac{\alpha}{\beta^2} $$

矩生成函数(MGF)

矩生成函数 MX(t) 的定义为:

$$ M_X(t) = E[e^{tX}] = \frac{\beta^\alpha}{\Gamma(\alpha)} \int_{0}^{\infty} x^{\alpha-1} e^{-(\beta-t)x} dx $$

t < β 时积分收敛:

$$ M_X(t) = \frac{\beta^\alpha}{\Gamma(\alpha)} \cdot \frac{\Gamma(\alpha)}{(\beta-t)^\alpha} = \left( \frac{\beta}{\beta-t} \right)^\alpha $$

特征函数

特征函数 ϕX(t) 的定义为:

$$ \phi_X(t) = E[e^{itX}] = M_X(it) = \left( \frac{\beta}{\beta-it} \right)^\alpha $$

总结

对于Gamma分布 X ∼ Gamma(α, β),其数字特征为:

  • 期望:$E[X] = \frac{\alpha}{\beta}$
  • 方差:$D(X) = \frac{\alpha}{\beta^2}$
  • 矩生成函数:$M_X(t) = \left( \frac{\beta}{\beta-t} \right)^\alpha, \quad t < \beta$
  • 特征函数:$\phi_X(t) = \left( \frac{\beta}{\beta-it} \right)^\alpha$

F 分布

重复一下分布形式

U ∼ χ2(d1)V ∼ χ2(d2) 相互独立,则随机变量: $$ F = \frac{U/d_1}{V/d_2} $$ 服从自由度为 (d1, d2) 的F分布,记作 F ∼ F(d1, d2)

对于 x > 0,其概率密度函数为: $$ f(x;d_1,d_2) = \frac{\Gamma\left(\frac{d_1+d_2}{2}\right)}{\Gamma\left(\frac{d_1}{2}\right)\Gamma\left(\frac{d_2}{2}\right)} \left(\frac{d_1}{d_2}\right)^{d_1/2} \frac{x^{d_1/2-1}}{\left(1 + \frac{d_1}{d_2}x\right)^{(d_1+d_2)/2}} $$

1. 与t分布的关系

T ∼ t(n),则: T2 ∼ F(1, n)

证明: 设 $T = Z/\sqrt{V/n}$,则: $$ T^2 = \frac{Z^2/1}{V/n} \sim F(1,n) $$ 因为 Z2 ∼ χ2(1)

倒数分布

F ∼ F(d1, d2),则: $$ \frac{1}{F} \sim F(d_2,d_1) $$

与t分布的关系

T ∼ t(n),则: T2 ∼ F(1, n)

证明: 设 $T = Z/\sqrt{V/n}$,则: $$ T^2 = \frac{Z^2/1}{V/n} \sim F(1,n) $$ 因为 Z2 ∼ χ2(1)

期望计算

d2 > 2$$ E[F] = \frac{d_2}{d_2 - 2} $$

推导过程$$ \begin{aligned} E[F] &= E\left[\frac{U/d_1}{V/d_2}\right] \\ &= \frac{d_2}{d_1} E[U] E\left[\frac{1}{V}\right] \quad \text{(独立性)} \\ &= \frac{d_2}{d_1} \cdot d_1 \cdot \frac{1}{d_2 - 2} \quad \text{(利用 $\chi^2$ 分布的矩)} \\ &= \frac{d_2}{d_2 - 2} \end{aligned} $$

方差计算

d2 > 4$$ \text{Var}(F) = \frac{2d_2^2(d_1 + d_2 - 2)}{d_1(d_2 - 2)^2(d_2 - 4)} $$

推导过程: 先计算 E[F2]$$ \begin{aligned} E[F^2] &= \left(\frac{d_2}{d_1}\right)^2 E[U^2] E\left[\frac{1}{V^2}\right] \\ &= \left(\frac{d_2}{d_1}\right)^2 (d_1^2 + 2d_1) \cdot \frac{1}{(d_2 - 2)(d_2 - 4)} \\ &= \frac{d_2^2(d_1 + 2)}{d_1(d_2 - 2)(d_2 - 4)} \end{aligned} $$

因此方差为: $$ \begin{aligned} \text{Var}(F) &= E[F^2] - (E[F])^2 \\ &= \frac{d_2^2(d_1 + 2)}{d_1(d_2 - 2)(d_2 - 4)} - \left(\frac{d_2}{d_2 - 2}\right)^2 \\ &= \frac{2d_2^2(d_1 + d_2 - 2)}{d_1(d_2 - 2)^2(d_2 - 4)} \end{aligned} $$

高阶矩

k阶矩存在条件d2 > 2k $$ E[F^k] = \left(\frac{d_2}{d_1}\right)^k \frac{\Gamma\left(\frac{d_1}{2} + k\right)\Gamma\left(\frac{d_2}{2} - k\right)}{\Gamma\left(\frac{d_1}{2}\right)\Gamma\left(\frac{d_2}{2}\right)} $$

矩母函数 MGF

一般情况

对于 F ∼ F(d1, d2),其矩母函数 MF(t) = E[etF] t ≥ 0 时不存在,因为: 0etxf(x; d1, d2)dx  对 t > 0 发散

负半轴存在性

t < 0 时,矩母函数可表示为: $$ M_F(t) = \frac{\Gamma\left(\frac{d_1+d_2}{2}\right)}{\Gamma\left(\frac{d_2}{2}\right)} \left(\frac{d_2}{d_1}\right)^{d_1/2} U\left(\frac{d_1}{2}, 1-\frac{d_2}{2}, -\frac{d_2}{d_1}t\right) $$ 其中 U(a, b, z) 是合流超几何函数(Tricomi’s function)。

特殊情形 (d2 > 2)

d2 > 2 时,可展开为: $$ M_F(t) = 1 + \frac{d_2}{d_2-2}t + \frac{d_2^2(d_1+2)}{d_1(d_2-2)(d_2-4)}t^2 + O(t^3), \quad t \leq 0 $$

特征函数

积分表达式

特征函数 ϕF(s) = E[eisF] 始终存在: $$ \phi_F(s) = \frac{\Gamma\left(\frac{d_1+d_2}{2}\right)}{\Gamma\left(\frac{d_2}{2}\right)} \left(\frac{d_2}{d_1}\right)^{d_1/2} \int_0^\infty e^{isx} \frac{x^{d_1/2-1}}{(1+\frac{d_1}{d_2}x)^{(d_1+d_2)/2}} dx $$

超几何函数表示

通过变量替换 $u = \frac{d_1}{d_2}x$,可得: $$ \phi_F(s) = {}_1F_1\left(\frac{d_1}{2}; \frac{d_2}{2}; -\frac{d_2}{d_1}is\right) $$ 其中 1F1 是合流超几何函数。

渐近展开

|s| → 0 时的近似: $$ \phi_F(s) \approx 1 + i\frac{d_2}{d_2-2}s - \frac{d_2^2(d_1+d_2-2)}{d_1(d_2-2)(d_2-4)}s^2 + O(s^3) $$

柯西分布

重复一下分布形式

设位置参数为 x0,尺度参数为 γ > 0,其概率密度函数为: $$ f(x; x_0, \gamma) = \frac{1}{\pi\gamma \left[1 + \left(\frac{x-x_0}{\gamma}\right)^2\right]} $$

标准柯西分布 当 x0 = 0γ = 1 时: $$ f(x) = \frac{1}{\pi(1+x^2)} $$

稳定性

X1, X2 ∼ Cauchy(x0, γ) 独立,则: X1 + X2 ∼ Cauchy(2x0, 2γ)

倒数分布

X ∼ Cauchy(x0, γ),则: $$ \frac{1}{X} \sim \text{Cauchy}\left(\frac{x_0}{x_0^2+\gamma^2}, \frac{\gamma}{x_0^2+\gamma^2}\right) $$

期望

柯西分布的期望不存在

证明$$ E[|X|] = \frac{1}{\pi} \int_{-\infty}^\infty \frac{|x|}{1+x^2} dx = \infty $$

方差

柯西分布的方差不存在

证明

由于 E[X2] ≥ E[|X|]2 = ∞

矩母函数 (MGF)

柯西分布的MGF不存在

证明

对于任何 t ≠ 0$$ E[e^{tX}] = \frac{1}{\pi} \int_{-\infty}^\in $$

$$ fty \frac{e^{tx}}{1+x^2} dx \quad \text{发散} $$

特征函数

特征函数存在ϕX(s) = E[eisX] = eix0s − γ|s|

推导

对于标准柯西分布 (x0 = 0, γ = 1): $$ \begin{aligned} \phi_X(s) &= \frac{1}{\pi} \int_{-\infty}^\infty \frac{e^{isx}}{1+x^2} dx \\ &= e^{-|s|} \quad \text{(通过复变函数留数定理)} \end{aligned} $$

高阶矩

所有阶数的矩均不存在

证明

对于任何 k ≥ 1$$ E[|X|^k] = \frac{1}{\pi} \int_{-\infty}^\infty \frac{|x|^k}{1+x^2} dx = \infty $$

偏度与峰度

由于矩不存在: - 偏度:未定义 - 峰度:未定义

所以,柯西分布不使用大数定律和中心极限定理