奇书网

奇书网>人工智能视频创作平台 > 第一节 直方图与特征(第2页)

第一节 直方图与特征(第2页)

②计算取值落在相应区间中的数据的条数;

③该区间的纵轴坐标表示取值数量的占比,即

下面以一个班级某门考试的成绩作为例子来熟悉直方图的构建方法,所使用的数据如表8-1所示。

表8-1成绩分布

可以看到,成绩分布在60到100之间,假设学校按照如下方式划分成绩的等级。

优:90~100;

良:80~89;

中:70~79;

及格:60~69。

这相当于将[60,100]这个区间划分成了4个小区间。接下来用直方图来观察数据的分布情况。读者可以先自己动手统计,然后学习用Python来生成直方图(图8-1)。

In[1]:importpandasaspd

#导入pandas模块

In[2]:data=pd。read_excel('grade。xlsx',header=0)

In[3]:data。shape

Out[3]:(20,2)

In[4]:data['成绩']。hist(bins=4)

#指定成绩所在列的数据是分析对象,bins的含义是把指定数据分成几部分

图8-1成绩分布直方图

该直方图反映了这个班级的成绩的重要特征。

想象这样的场景:某一所学校对不同的班级,都建立了类似的直方图。在考试之后,如果学校依据成绩对班级进行分类,则教务处只需要使用4个参数(优、良、中、及格各自的数量),就可以对不同班级的学习状况进行大致的分类了,而无须比较每个班级所有同学的考试成绩。当然如果采用上述划分方式后,有两个班级成绩分布相同,那么这4个参数就不足以区分这两个班级,需要进一步挖掘更细致的特征。

一般的人脸识别是通过采集到的人脸照片来进行识别的,对于一张含有人脸的图片,可以使用它的颜色分布(或者灰度分布)作为数据生成直方图,而不同的人脸颜色数据对应的直方图一般是不同的,这样就可以区分不同的人脸了,第二节将会更详细地介绍如何使用这种方法区分人脸。

热门小说推荐

最新标签