人工智能专业_第二节图像的数据表示和相似性第3页

奇书网>人工智能专业 > 第二节图像的数据表示和相似性（第3页）

这四类特征都是关于图像局部区域像素分布的描述，使用特定算法对图片各个区域进行扫描，获取与人脸具有相似特征的区域，就可以实现人脸检测了（图8-3）。

图8-3四类像素分布特征

人脸检测其实是一个二分类的问题，即是人脸，非人脸。

可以使用本教材讲过的决策树[1]实现这种分类，按照如下流程训练分类器。

输入图像—图像预处理—提取特征—训练分类器（二分类）—得到训练好的模型（Harr-like+决策树）。

使用训练好的分类器，按照如下流程进行脸部检测。

输入图像—图像预处理—提取特征—导入训练好的模型—二分类（是不是人脸）。

接下来假设脸部检测已经完成，并已经对照片根据检测结果进行了裁剪，即接下来需要处理的照片是只包含脸部的照片。人脸识别将把未知照片与已有照片进行对比，从已有照片中找出与未知照片最相似的那一个，从而实现判定未知照片是谁的照片。例如，经过对比后得到表8-3。

表8-3脸部相似排序示例

从表中可以看出，输入的新照片与已有的照片数据库中张三的照片相似程度最高，据此可以判定，被识别的这张人脸是张三的。

为了实施这个识别方法，需要解决的一个关键问题是，如何比较人脸的相似程度。

判断两张照片的相似性，可以通过如下三种方式进行。

（1）距离相似性

使用第五章讲过的欧式距离，距离越近，相似程度越高。

以灰度图像为例，假设进行对比的两张照片都有n×m个像素，则像素灰度所对应的矩阵为

它们的距离定义为

（2）余弦相似性

这也是在第五章讲过的一种衡量相似性的方法。为了计算余弦相似性，需要将图片以向量形式描述（一行或者一列数据）。两张灰度图片X和Y，此时写成如下形式。

x=（x1，1，x1，2，···，x1，m，x2，1，···，x2，m，···，xn，1，···，xn，m）

Y=（Y1，1，Y1，2，···，Y1，m，Y2，1，···，Y2，m，···，Yn，1，···，Yn，m）

按照第五章给出的计算公式

进行计算。计算出的余弦值越大，则相似性越高。

（3）结合直方图和上述两种距离计算相似性

直方图是一种可以将图片信息压缩表示的工具，使用直方图，可以提取图像的一些特征。对人脸照片进行直方图统计有细颗粒度和粗颗粒度两种方式，可以根据具体情况选用。下面以灰度图为例。

①细颗粒度。计算不同灰度值的像素数占总像素数的比例。因为灰度值介于[0，255]，所以最终得到包含256个数值的特征。

②粗颗粒度。将[0，255]划分成多个子区间，然后统计直方图。例如，每8个灰度作为一个区间，一共划分成32个区间，进行统计后得到32个特征；如果每16个灰度作为一个区间，则最终会得到16个特征。获取直方图后，就可以使用1或2中的方法比较相似度了。

作为练习，读者可以分别使用这三种方法比较如图8-4所示的两张图片的相似性。

图8-4