奇书网

奇书网>人工智能专业 > 第二节 图像的数据表示和相似性(第3页)

第二节 图像的数据表示和相似性(第3页)

这四类特征都是关于图像局部区域像素分布的描述,使用特定算法对图片各个区域进行扫描,获取与人脸具有相似特征的区域,就可以实现人脸检测了(图8-3)。

图8-3四类像素分布特征

人脸检测其实是一个二分类的问题,即是人脸,非人脸。

可以使用本教材讲过的决策树[1]实现这种分类,按照如下流程训练分类器。

输入图像—图像预处理—提取特征—训练分类器(二分类)—得到训练好的模型(Harr-like+决策树)。

使用训练好的分类器,按照如下流程进行脸部检测。

输入图像—图像预处理—提取特征—导入训练好的模型—二分类(是不是人脸)。

接下来假设脸部检测已经完成,并已经对照片根据检测结果进行了裁剪,即接下来需要处理的照片是只包含脸部的照片。人脸识别将把未知照片与已有照片进行对比,从已有照片中找出与未知照片最相似的那一个,从而实现判定未知照片是谁的照片。例如,经过对比后得到表8-3。

表8-3脸部相似排序示例

从表中可以看出,输入的新照片与已有的照片数据库中张三的照片相似程度最高,据此可以判定,被识别的这张人脸是张三的。

为了实施这个识别方法,需要解决的一个关键问题是,如何比较人脸的相似程度。

判断两张照片的相似性,可以通过如下三种方式进行。

(1)距离相似性

使用第五章讲过的欧式距离,距离越近,相似程度越高。

以灰度图像为例,假设进行对比的两张照片都有n×m个像素,则像素灰度所对应的矩阵为

它们的距离定义为

(2)余弦相似性

这也是在第五章讲过的一种衡量相似性的方法。为了计算余弦相似性,需要将图片以向量形式描述(一行或者一列数据)。两张灰度图片X和Y,此时写成如下形式。

x=(x1,1,x1,2,···,x1,m,x2,1,···,x2,m,···,xn,1,···,xn,m)

Y=(Y1,1,Y1,2,···,Y1,m,Y2,1,···,Y2,m,···,Yn,1,···,Yn,m)

按照第五章给出的计算公式

进行计算。计算出的余弦值越大,则相似性越高。

(3)结合直方图和上述两种距离计算相似性

直方图是一种可以将图片信息压缩表示的工具,使用直方图,可以提取图像的一些特征。对人脸照片进行直方图统计有细颗粒度和粗颗粒度两种方式,可以根据具体情况选用。下面以灰度图为例。

①细颗粒度。计算不同灰度值的像素数占总像素数的比例。因为灰度值介于[0,255],所以最终得到包含256个数值的特征。

②粗颗粒度。将[0,255]划分成多个子区间,然后统计直方图。例如,每8个灰度作为一个区间,一共划分成32个区间,进行统计后得到32个特征;如果每16个灰度作为一个区间,则最终会得到16个特征。获取直方图后,就可以使用1或2中的方法比较相似度了。

作为练习,读者可以分别使用这三种方法比较如图8-4所示的两张图片的相似性。

图8-4

热门小说推荐

最新标签