图像矩概述

1. 概述

矩函数在图像分析中有着广泛的应用，如模式识别、目标分类、目标识别与方位估计、图像编码和重构等。一个从一幅数字图像中计算出来的矩集，通常描述了该图像形状的全局特征，并提供大量的关于该图像不同类型的几何特性信息。

一个概率密度函数的零阶、一阶、二阶矩分别表示其全概率、数学期望和方差。
零阶到三阶矩用于描述总体水平上的图像特征，而更高阶矩则含有更好的图像细节，但通常对噪声更加敏感，可以变换方式减少或消除噪声的影响。

2. 定义

2.1 XY 坐标

将一幅图像看成一个二维密度分布 $f(x,y)$ ，函数值 $f(x,y)$ 表示点 $(x,y)$ 处图像像素的亮度值；用 $\zeta$ 表示 $x-y$ 平面上图像的区域，即 $f(x,y)$ 的定义域范围。设一幅图像的亮度函数为 $f(x,y)$ ，它的 $(p+q)$ 阶矩函数的一般定义如下：

\begin{aligned} \Phi_{pq} = \iint\limits_\zeta \Psi_{pq}(x,y) f(x,y) \mathrm{d}x \mathrm{d}y \qquad p,q = 0,1,2,\cdots \tag{1} \end{aligned}}

其中， $\Psi_{pq}(x,y)$ 是一个 $\zeta$ 内关于 $(x,y)$ 的连续函数，它被称为矩的权核或基本集。下表 $pq$ 通常表示函数 $\Psi_{pq}(x,y)$ 中定义的坐标 $x,y$ 的次数。

2.2 极坐标

在极坐标 $(r,\theta)$ 下的基函数需要按照图像空间的极坐标表示，因此图像的 $(p+q)$ 阶矩函数的一般定义如下：

\begin{aligned} \Phi_{pq} = \iint\limits_\zeta r^{p+q+1} \Psi_{pq}(\theta) f(r,\theta) \mathrm{d}r \mathrm{d}\theta \qquad p,q = 0,1,2,\cdots \tag{2} \end{aligned}}