1. 简介

在概率论和统计学中,矩是用来描述随机变量的某些特征的统计量。

2. 定义

设随机变量 XX 的概率密度函数为 f(x)f(x)。对于离散型随机变量,在存在的前提下,其相对于值 ccnn 阶矩为:

μn=E[(Xc)n]=i=1(xic)nP(xi)\mu_n = E\left[(X - c)^n\right] = \sum_{i=1}^{\infty} (x_i - c)^n P(x_i)

对于连续型随机变量,在存在的前提下,其相对于值 ccnn 阶矩为:

μn=E[(Xc)n]=(xc)nf(x)dx\mu_n = E\left[(X-c)^n\right] = \int_{-\infty}^{\infty} (x-c)^n f(x) dx

特别地,当 c=0c = 0 时称为原点矩,当 c=E(x)c = E(x) 时称之为中心矩

3. 标准矩

在概率论和统计学中,一个概率分布的标准矩是经过标准化后的中心矩。标准化通常是将其除以标准差的过程,这样做的目的是使得标准矩对缩放和离散程度皆能保持一致,在比较不同概率分布的形状时更为方便。

3.1 定义

以连续型随机变量为例,设 XX 为一随机变量,其概率密度函数为 f(x)f(x),其均值为 μ=E[X]\mu = E[X],则其第 kk 阶标准矩为 μ^k=μkσk\hat{\mu}_k = \frac{\mu_k}{\sigma^k},其中

μk=E[(Xμ)k]σk=(E[(Xμ)2])k\mu_k = E\left[(X - \mu)^k\right] \\ \sigma^k = \left(\sqrt{E\left[(X - \mu)^2\right]}\right)^k

μk\mu_k 即为 kk 阶中心矩。

3.2 性质

  • 中心矩为 kk 次齐次函数:μk(λX)=λkμk(X)\mu_k(\lambda X) = \lambda^k \mu_k(X)
  • 标准矩具有缩放不变性。
  • 标准矩为无量纲量。

3.3 常用标准矩

阶数 定义 说明
11 μ^1=μ1σ1=0\hat{\mu}_1 = \frac{\mu_1}{\sigma^1} = 0 一阶标准矩恒为 00,因为一阶中心矩恒为 00
22 μ^2=μ2σ2=1\hat{\mu}_2 = \frac{\mu_2}{\sigma^2} = 1 二阶标准矩恒为 11,因为二阶中心矩即为方差 σ2\sigma^2
33 μ^3=μ3σ3\hat{\mu}_3 = \frac{\mu_3}{\sigma^3} 三阶标准矩用于定义偏度,偏度用来衡量随机变量概率分布的不对称性。偏度为负表示左偏,偏度为正表示右偏。
44 μ^4=μ4σ4\hat{\mu}_4 = \frac{\mu_4}{\sigma^4} 四阶标准矩用于定义峰度,峰度用来衡量随机变量概率分布的峰态。峰度高意味差方差增大是由低频度的大于或小于平均值的极端值引起的。

11 阶原点矩即为均值(Mean),22 阶中心矩即为方差(Variance),三阶标准矩即为偏度(Skewness),四阶标准矩即为峰度(Kurtosis)。

  • 对于峰度,为了方便,一般定义正态分布的峰度为 00,因此更为一般的定义为 μ^4=μ4σ43\hat{\mu}_4 = \frac{\mu_4}{\sigma^4} - 3

附录