Gamma分布——又是泊松过程?
前置:两个分布与泊松过程
还是泊松过程
如果说指数分布描述了第一次成功事件的等待时间,那么它的“同门师兄”——Gamma分布,则将这种等待诠释得更为深刻:它刻画了在连续时间轴上,等待第 \(n\) 次泊松事件(如潜艇发射鱼雷、网络数据包到达)所需的时间。
在开始前,我们给出 Gamma 分布的数学定义:
这是一个连续型分布,有两个参数 \(\alpha\)(形状参数,\(\in \mathbb{N}_+\))和 \(\beta\)(速率参数,\(\beta>0\)),其概率密度函数为:
\[ p(t; \alpha, \beta) = \frac{\beta^\alpha t^{\alpha-1} \mathrm{e}^{-\beta t}}{\Gamma(\alpha)} \quad (t \ge 0) \]
这里 \(\Gamma(\alpha) = (\alpha-1)!\) 是 Gamma 函数,当 \(\alpha\) 为自然数时退化为阶乘。
Gamma 分布在 \(\alpha=1\) 时退化为指数分布 \(\text{Exp}(\beta)\),这暗示一个直观的猜想:或许 Gamma 分布是 \(n\) 个独立的指数分布变量之和?
答案是肯定的,这正是它与泊松过程的关联所在。
在之前的分析中,我们已知泊松过程的独立增量和平稳增量特性,使得:
- 第一次到达时间服从参数为 \(\lambda\) 的指数分布 \(T_1 \sim \text{Exp}(\lambda)\)。
- 相邻两次到达时间的间隔同样服从 \(\text{Exp}(\lambda)\),且与此前事件数无记忆(无关联)。
这启发我们:第n次到达时间 \(T_n\) 就是n个独立的 \(\text{Exp}(\lambda)\) 变量之和。
即:
\[ T_n = \underbrace{X_1 + X_2 + \cdots + X_n}_{n \text{个间隔之和}}, \quad \text{其中} X_i \stackrel{\text{iid}}{\sim} \text{Exp}(\lambda) \]
卷积验证
我们知道,计算随机变量的和需要使用卷积。不妨做点计算,我们一步步计算 \(T_n\) 的分布:
- 当 \(n=1\) 时,\(T_1 = X_1\),显然满足 \(p(t) = \lambda \mathrm{e}^{-\lambda t}\)。
- 当 \(n=2\) 时,\(T_2 = X_1 + X_2\),通过卷积计算:
\[ \begin{align} p_{T_2}(t) &= \int_0^t p_{X_1}(x) \cdot p_{X_2}(t-x) \ \mathrm{d}x \\ &= \int_0^t \lambda \mathrm{e}^{-\lambda x} \cdot \lambda \mathrm{e}^{-\lambda(t-x)} \ \mathrm{d}x \\ &= \lambda^2 t \mathrm{e}^{-\lambda t} \quad (t \ge 0) \end{align} \]
这正对应参数为 \(\alpha=2\)、\(\beta=\lambda\) 的 Gamma 分布密度函数。
- 归纳至一般情况:假设 \(T_n\) 的密度函数为 \(p_{T_n}(t) = \frac{\lambda^n t^{n-1} \mathrm{e}^{-\lambda t}}{(n-1)!}\),则 \(T_{n+1}\) 通过卷积可得:
\[ \begin{align} p_{T_{n+1}}(t) &= \int_0^t p_{T_n}(x) \cdot p_{X_{n+1}}(t-x) \ \mathrm{d}x \\ &= \frac{\lambda^n}{(n-1)!} \int_0^t x^{n-1} \mathrm{e}^{-\lambda x} \cdot \lambda \mathrm{e}^{-\lambda(t-x)} \ \mathrm{d}x \\ &= \frac{\lambda^{n+1}}{(n-1)!} \mathrm{e}^{-\lambda t} \int_0^t x^{n-1} \ \mathrm{d}x \\ &= \frac{\lambda^{n+1} t^n \mathrm{e}^{-\lambda t}}{n!} \end{align} \]
完成归纳递推,\(T_n\) 确实服从参数为 \(\alpha=n\)、\(\beta=\lambda\) 的 Gamma 分布。
矩函数验证
可以使用矩函数的方法绕过卷积的计算。
随机变量 \(X\) 的矩函数(MGF)\(G_X(t)\),有两种看待视角。一种是 \(M_X(t) =\mathbb{E}[\mathrm e^{Xt}]\),另一种是把 \(M_X(t)\) 看成概率密度函数 \(f(x)\) 的双边拉普拉斯变换。
矩函数的形式和性质都很有趣,我们这里不关注在统计量中的应用。只是关注双边拉普拉斯变换的性质。
对于任何函数 \(f(x)\) 做双边拉普拉斯变换的公式如下:
\[ M_X(t) = \mathcal L_f(t) = \int_{-\infty}^{+\infty} \mathrm e^{xt}f(x) \mathrm dx \]
这种类傅里叶变换能够把原函数的卷积转化为变换结果的乘法,即:
\[ \mathcal L_{f \ast g}(t) = \mathcal L_f(t)\cdot \mathcal L_g(t) \]
其中:
\[ (f \ast g)(x_0) = \int_{-\infty}^{+\infty} f(x)g(x_0 - x) \mathrm dx \]
也即 \(f,g\) 的卷积。不难发现,如果 \(f,g\) 是 \(X,Y\) 的概率密度函数,则 \(f \ast g\) 是 \(X+Y\) 的概率密度函数。
双边拉普拉斯变换满足这样的性质:如果 \(\mathcal L_f = \mathcal L_g\),则函数 \(f\) 与 \(g\) 几乎处处相等。
对于性质比较好的随机变量,我们可以认为,如果两个随机变量有相同的矩函数,它们也具有相同的分布。
\(X_i\) 遵循指数分布,其矩函数为:
\[ M_X(t) = \int_0^\infty \mathrm{e}^{tx} \cdot \lambda \mathrm{e}^{-\lambda x} \mathrm{d}x = \frac{\lambda}{\lambda - t} \]
\(X_1, X_2, \dots, X_n\) 是独立同分布的随机变量(此处均为 \(\text{Exp}(\lambda)\)),那么它们的和:
\[ S_n = X_1 + X_2 + \cdots + X_n \]
的矩函数为各变量矩函数的乘积:
\[ M_{S_n}(t) = \prod_{i=1}^n M_{X_i}(t) = \left( \frac{\lambda}{\lambda - t} \right)^n \]
另一方面,我们考察 Gamma 分布的矩函数:
\[ \begin{aligned} M_\Gamma(t) &= \int_0^\infty \mathrm{e}^{tx} \cdot \frac{\beta^\alpha x^{\alpha-1} \mathrm{e}^{-\beta x}}{\Gamma(\alpha)} \mathrm{d}x\\ &= \frac{\beta^\alpha}{\Gamma(\alpha)} \int_0^\infty x^{\alpha-1} \mathrm{e}^{-(\beta - t)x} \mathrm{d}x\\ &= \frac{\beta^\alpha}{\Gamma(\alpha)} \cdot \frac{\Gamma(\alpha)}{(\beta - t)^\alpha} \\ &= \left( \frac{\beta}{\beta - t} \right)^\alpha \end{aligned} \]
其中第三个等号的关键点是 \(\Gamma\) 函数的定义:
\[ \int_0^\infty x^{\alpha-1} \mathrm{e}^{-k x} \, \mathrm{d}x = \frac{\Gamma(\alpha)}{k^\alpha}. \]
两边一对比,立刻发现,若令 \(\beta = \lambda, \alpha = n\),则有:
\[ S_n \sim \Gamma(n, \lambda) \]
总结
无论怎么推导,我们都得到了如下结果:
当 \(\alpha\) 为整数时,参数为 \(\lambda\) 的连续泊松过程的第 \(\alpha\) 次到达时间遵循分布 \(\Gamma(\alpha, \lambda)\)。
当然,要注意到,Gamma 分布对 \(\alpha\) 的定义域做了延拓,正如 \(\Gamma(n)\) 是 \((n-1)!\) 的合理延拓。