1. 引言
极光隐藏着巨大的科学研究价值。从空间物理学的角度,极光现象反映了太阳与地球之间某种动力学的关系。从天气物理的角度来讲,极光不仅出现在地球上,据观测表明,太阳系中的某些星球也出现过极光,所以研究极光对我们探索太阳系中的奥秘奠定了基础。从能量能源的角度来讲,每爆发一次极光,所产生的能量基本上都大于地球一年发电量总和。研究极光的意义并不仅限于此。所以对极光图像进行分类研究,能帮助研究者们更加清晰的理解极光现象对我们生活的影响。
极光的研究起源很早,早在1995年,Carl Stormer [1] 通过分析大量的极光数据,首次对极光图像提出了三种分类,分为无放射状的结构、有放射状的机构和火焰形状的三种类别,但是这是基于人工标记的办法,分类效率不高并且基本没有鲁棒性。2004年Syrjäsuo和他的研究团队 [2] 首次将数字图像处理和机器视觉技术引入到了极光分类的研究领域,并且提出了自动的极光分类方法。虽然在分类的效率方面有了提高,但是在拍摄过程中因为干扰都会产生的一些纹理信息丢失。2007年,Wang [3] 通过使用主成分分析法,提出了一种基于表象特征的极光图像分类方法。2008年,Gao等人 [4] 为了降低极光图像的特征冗余,提取基于极光图像的局部Gabor滤波器特征,并且与动态过程结合的办法进行极光图像的分类,取得了较高的分类准确率。到2009年,胡泽俊博士另辟蹊径,引入形态学的概念,将极光图像分为了冕状形态极光和弧光状的极光两大类,然后对冕状的再进行细分,即热点冕状极光、辐射冕状极光和帷幔型的冕状三种极光。2011年,Fu等人 [5] 也将形态学分量分析(MCA)的方法用于极光图像的分类,完成了对弧状和冕状两类极光图像的分类。这种方法在对极光图像进行MAC分离后,再对其现有的纹理提取特征信息,然后再分类,提高了弧状和冕状极光的分类效率。在此基础之上,又出现了一些基于监督的极光分类方法,例如BP神经网络方法和支持向量机(SVM)的方法。虽然这些极光分类方法的效率在不断的提高,但是并不能取得令人满意的效果,最主要的问题就是极光图像变化快,数据量非常大,所以现在的问题就是如何针对海量的极光图像数据并且能快速而精确的分类出各类极光图像。
本文针对海量的极光数据,提出了双尺度算法和局部二值模式以及近邻分类相结合的极光分类算法,实验证明,不仅分类效果较高,而且其鲁棒性也非常好。
2. 自适应提升的小波变换
假设有一种最原始的信号表示的是首先用一种特殊的小波变换或者多向分解技术将信号S分解成一个近似信号x和细节描述信号y。然后用映射U代替y去改写x,然后得到一个新的近似信号:
(1)
随后,预测映射P用去改写y,然后产生一个新的信号:
(2)
在信号的合成阶段,通过反转提升步骤来重构原始信号。有保证的重构并且在提升的步骤中不需要一些特定的条件在图像的重构中是非常重要的。它灵活地为开发各种应用提供了可能性。
在早期的研究中,为了对特殊图像的特征纹理处理并且在扭曲的图像中提取图像的有用信息,使得自适应小波变换的方法有了快速的发展。
我们的自适应小波变换方法如下 [6] 所示,将(M,N)阶的原始图像用简单的多相分解技术分解成4个(M/2,N/2)的子图像:
(3)
然后,输出的近似信号等于:
(4)
其中是二值映象的决策因子D的判决结果,即
(5)
T是给出的阈值,的定义如下:
(6)
μ是表示的是水平方向、垂直和对角线方向的八种像素的平均值,公式如下
(7)
在新的自适应提升的方法中,随着的不同,更新的步骤也是不同,对每一种不同的选择,有不同的添加操作和不同的更新操作,也就是说,它是依靠位置并且能自适应的。更新因子和加操作由如下定义
(8)
(9)
三个预测操作,以及满足下面的三个式:
(10)
(11)
(12)
息,和由下面的方程计算:
(13)
自适应方案的说明如下:在平滑区域当时,用和它的水平,垂直,对角线的加权均值来计算,而对于不平滑区域,当,不执行任何的滤波,例如,这样做的主要原因是在极光识别中,不连续的图像在图像识别的过程中有很重要的意义,但是必须要滤除很多孤立而且不连续的点。通过改变阈值T,一是可以平衡和过滤有用的信息。另外我们的自适应方案只包括加法和减法操作在空间域,并持有高平滑的性能,就地操作,所以它提供了非常低的计算成本和简单的硬件实现。自适应小波变换的框图如图1。
3. 本文提出的方法
本文的算法是首先用自适应提升的小波变换,使得极光的特征更加的明显,用变尺度的高斯滤波对各个子图像进行滤波,使得图像的干扰大大降低,然后使用局部二值模式进行累积成特征直方图,算法的最后用模糊近邻分类方法对极光图像进行分类。
3.1. 双尺度分解算法
所以本文所提出的双尺度的图像分解由两个阶段组成,在第一阶段中,考虑到图像的不连续性,纹理和轮廓在图像的识别中起着非常重的作用,因为自适应的小波变换对轮廓和纹理的提取效果明显,所以先用自适应提升的小波变换把原图像分解成几个子图像,然后通过对图像畸变点的滤除得到有用的特征信息。在第二阶段中,主要是为了提高算法对噪音的容忍限度,因此需要对各个子图像进行变尺度的高斯滤波:
(14)
在上面的公式中*代表的是卷积运算,其中
(15)
3.2. 图像的特征提取
因为像素之间的距离是有相关性的,所以主要的纹理信息可以从周围的像素中提取。因此,在DS-LBP中,仅仅需要考虑中心和周围的八个像素,所以用下面这个表达式进行特征的提取
(16)
Figure 1. The block diagram of adaptive wavelet transform
图1. 自适应小波变换框图
对于每一个图像,用(2-32)能计算出它的离散直方图,,and,将极光图像的特征用这种离散的归一化直方图的方式来表示。因为极光图像的位置与离散直方图不相关,所以提取的特征是不变的。
输入极光图像被转化成灰度级图像,接着根据点和中心最大的距离进行归一化,再根据双尺度图像分解将灰度级图像分解成一系列的子图像,在每个子图像中使用局部二值模式并且累积成离散的直方图,表达式如下:
(17)
其中N × M是没个子图像的像素,这些归一化直方图被视为特性,再使用模糊的邻近分类进行分类。
3.3. 模糊的近邻分类器
在提出的模糊近邻分类器,两种极光的相似用以下的公式定义
(18)
上式子中的表示的是高斯滤波的变尺度系数,表示的是在同一尺度和相同波段的模糊相似度,定义如下:
(19)
这里,和分别代表了具有相同的尺度和波段的两种极光的DS-LBP归一化直方图。我们很容易就发现,如果和是非常的像,
即则说明;同样的道理,假如,说明和的重叠部分几乎没有,所以说这两种图像不是一类。
模糊近邻算法的模糊分类器主要包含以下三个步骤:
第一步:给出一张极光图像x和一个训练集我们用公式(16)计算x和y的模糊相似度,然后在测试集中选取和训练集最近邻的图像
第二部:相加之后,如果属于同一类w的k阶近似相似度,就用以下的公式。
第三步:计算最大的并且对x进行归类。
4. 仿真实验
我们实验的数据是从极光的总数据库中随机的选取3200个样本进行测试,其中arc的样本数量为800个,hospot的极光样本数量为800个,冕状的极光样本总数为800个,小尺度状的极光样本数量为800个。首先在分类好的极光类中选取训练集,在每一类中随机的选取5张极光图像作为训练样本,然后在分类好的极光类中,选取测试样本,然后对选取的这些个测试集进行极光分类实验,最后检验分类的正确性。
本章主要工作分为以下三个方面,首先,测试提出方法的分类的精确性,并且和已经提出的方法的结果进行对比,其次是验证其加噪声之后,方法对噪声的抗噪程度,即就是验证其鲁棒性。最后是测试算法的成本。
4.1. 极光分类算法效率对比
实验1:比较各类极光识别算法的分类效率(%)
表1即为比较各种分类算法而得到实验数据,从表1可以看出,本文提出的分类的算法,在同样的实验条件之下,得到的实验结果相对能比以上的各种都略好。
4.2. 算法鲁棒性
在这部分中,为了验证所提出的方案的抗噪性能,在极光图像中加入两种常见的噪声,第一种就是常见的高斯噪声,其均值为0,方差为0.01。第二种就是采用密度为0.05的椒盐噪声。再用以上的方案进行实验,然后计算本文的算法对噪声容量。
1) 在极光图像经过预处理之后,在所有的测试样本中加入均值为0.方差为0.01的高斯噪声,然后测试样本的分类效率(见表2)。
2) 在原始的极光图像经过了预处理之后,在测试样本中加入密度值是0.05的椒盐噪声,然后测试其分类的准确率(见表3)。
4.3. 实验的计算成本
本文中的所有仿真实验用Matlab 2012a中实现,在个人电脑的配置为英特尔(R)酷睿(TM)I5-2400,CPU的频率3.10 GHz的,运行内存3.00 GB,操作系统是微软Windows XP专业版。我们在本实验中,只计算一下各个算法的运行时间。从时间复杂度的角度证明算法。对于每一种算法,我们严格的根据所提供的论文中的方法进行实验。在我们的方法中,极光图像转换成相应的灰度级图像,极大的降低了计算的复杂度,但并不是只针对我们的算法进行改变,所有的分类算法都进行了灰度级的转换。
实验三:比较各种方法的计算成本(s) (见表4):
在极光的分类算法中,有几种已经取得了不错的分类效率。本节的实验目的就是用比较本文提出的算法和先前的几类算法进行三方面的比较,在算法效率的前提下对另外的一个非常重要的问题即抗噪性能方面做比较。在很多研究领域,分类算法在不加噪声的情况下,分类的效率可以达到非常的高,但是现实中,任何情况下都会有噪声的干扰。其中,高斯噪声和椒盐噪声是在实际的问题中碰到的最多的噪声类型,用这两种噪声进行干扰的目的是为了适应更复杂的实际情况。因此,抗噪的性能已经越来越成
Table 1. Classification efficiency of various classification algorithms (%)
表1. 各种分类算法的分类效率(%)
Table 2. Various classification algorithms for Gaussian noise robustness (%)
表2. 各种分类算法对高斯噪声的鲁棒性(%)
Table 3. Various classification algorithms for impulse noise robustness (%)
表3. 各种分类算法对椒盐噪声的鲁棒性(%)
Table 4. Algorithm’s computational cost (s)
表4. 算法的计算成本(s)
为验证一种新的分类算法的性能指标。最后,算法的实际的计算成本,我们本实验只从算法的实际运行的时间角度对算法的成本做一种简单的研究。以此来模拟实际的计算成本。
实验的结论:
1) 在分类效率的部分,我们通过对最初的极光识别分类算法和现有的比较主流的分类识别算法的分类效率进行比较,从实验的角度论证了本文所提出的分类效果比目前提出的几种分类的效率要好一点。
2) 在预处理后的极光图像后加入高斯噪声(均值0,方差0.01)和椒盐噪声(密度0.05),发现本文的方法相对于其他的几种方法的抗噪性能好,而且也很稳定。
3) 通过最后的实验也表明,本文的所提出的方法的实验成本不是最好的,但是也在能接受的范围之内。
5. 结论
由于极光数据的庞大和变化的频率非常的快,极光数据的变化规律存在着大量的不确定性。传统法的模式识别技术不能在分类效率和抗噪声性能方面极大的提升。要想达到预期效果,必须经过提出或者改进新的模式识别的技术。本文通过提出自适应的小波提升方案和改进的局部二值模式,最后用模糊的邻近分类相结合的方法用于极光图像的分类试验。通过仿真的实验,我们的算法效率在分类效率鲁棒性的方面,都比之前的算法有了提高。另外在实验成本方面,本文的算法也在可以接受的范围之内。在下一步工作中首先,将会继续突破自适应提升小波变换的三个方向的限制,使得从各个方向都能进行选取,其次就是会引入一些非监督的分类方法,进一步的提高分类的效率。