1. 引言
随着近年来遥感技术的不断发展,已经能够获取到越来越多的三维立体高光谱遥感图像。由于高光谱遥感图像含有目标地物中的许多光谱信息与空间信息 [1],在农业 [2]、军事 [3]、海洋 [4] 等领域得到广泛地应用。
高光谱遥感图像分类是科研人员近年来关注和研讨的重要方向之一。高光谱图像分类是利用不同地物含有各不相同的特征信息,对图像中每个像元进行分析并提取特征,实现对图中每一像元赋予类别标签。起初,提出使用支持向量机(SVM) [5]、稀疏表示(SRC) [6]、卷积神经网络(CNN) [7] 等方法通过计算像元的光谱曲线与训练样本间的相似程度判断归属类别。随后,提出使用组合核支持向量机(SVM-CK) [8]、联合稀疏表示(JSRC) [9] 等方法通过将光谱信息与空间邻域信息相结合实现高光谱图像分类,且分类精度得到提升。之后,提出将形态学 [10] 等空间特征与光谱特征融合后使用JSRC进行分类。虽然可以微小地提高分类精度,但需要占用大量的存储空间并增加计算量和运行时间,无法高效便捷地实现。同时,JSRC是在固定大小的邻域内进行,其内可能含有噪声点,会对分类结果产生一定的影响。
为了提高分类精度,避免计算量的大幅增加,提出一种改进的联合稀疏表示算法(A2-JSRC),实现对高光谱图像的地物分类。该算法对局部空间信息进行二次利用;首先,利用同一地物的光谱曲线相似,在JSRC算法中自适应地选择邻域像元。其次,利用高光谱图像中像元类别有局部空间聚类的特性,对分类结果进行调整,使局部内的像元为同一地物类别。在Indian Pines数据集和Pavia University数据集上进行对比实验 [11],得到本文提出的算法比传统的高光谱图像分类算法能够得到更好地分类效果。
2. 联合稀疏表示算法(JSRC)
高光谱图像数据
(N表示样本总数,B表示波段数,
表示图像中第i个样本点的光谱向量)。对图中任一像元
,以其为中心点,r为半径,得到该样本点在
方形空间
内的邻域矩阵
。
稀疏表示认为同一类别地物的像元点可以相互线性表示,而联合稀疏表示算法认为局部邻域内的像元均属于同一地物类型,故
内的所有像元可以被同一类别的训练样本线性表示,即
(1)
其中,
表示训练样本矩阵(字典),C表示数据总类别数,M表示训练样本总数,
表示第j类训练样本矩阵,
,
表示系数矩阵,
为第j类训练样本的系数矩阵。
上式线性方程组是非正定的,能够得到无数系数矩阵
。由起初假设可知,
仅可以被
中的小部分训练样本线性表示,则对应的矩阵
中只有少部分行向量值非零,其余为0,故
是稀疏的。为了找到最稀疏的矩阵
,考虑计算误差,建立优化模型:
(2)
其中,
表示矩阵
中的非零行个数,
表示误差,K表示稀疏度。式(2)作为一个NP难问题,可以通过贪婪算法—同步正交匹配追踪算法(SOMP) [8] 进行迭代求解。
从模型的建立过程可以看出,
可以通过DA重构得到。为了判断中心像元
的归属类别,将第
类训练样本
与相对应的系数
重构
,选择残差最小的类别为该像元的所属类别。
(3)
3. 改进的联合稀疏表示(A2-JSRC)
在高光谱数据中,存在一些噪声点会对分类结果产生影响。而在构建JSRC模型中,没有考虑到邻域内噪声点的干扰问题,故在选择邻域像元时并非全部采用,而是选择邻域中与中心像元相似度较高的像元。通过下式计算邻域
中其余像元
与中心像元
的相似度:
(4)
上式看出:f值越大,
与
的相似度越高;反之,
与
的相似度越低。按式(5)自适应地选出相似度高的像元组成新的邻域Ne,其内像元共同构成邻域矩阵
。
(5)
其中,
表示邻域
内所有像元与中心像元
的相似度均值。将
代替式(2)中的
,建立联合稀疏表示模型进行求解,得到分类结果
。
为了获得更好的分类效果,避免单个像元的分类结果与周边像元的不同,再次利用局部空间信息。在固定的窗口
中,通过投票的方式确定最终类别,即以
个像元中类别数量最多的为中心像元
的最终类别。
(6)
其中,
表示像元
的地物类别,
表示邻域内最初被判为第j类的像元个数。
4. 实验结果
为了验证提出算法的有效性,将通过Indian Pines数据集和Pavia University数据集进行实验。以总体分类精度(OA)和Kappa值为判别依据 [11],他们的数值越高,说明分类结果越好、越精准。其中,Indian Pines数据集共10249个样本,含有效的波段200条,是145 × 145大小的影像。Pavia University数据集共42776个样本,含有效波段103条,是610 × 340大小的影像。两个数据集都以10%的数据为训练样本,其余为测试样本。
文中采用SVM、SRC、CNN、JSRC、SVM-CK算法与本文提出的算法(A2-JSRC)进行对比。其余算法的参数与参考文献中保持一致,本文算法在Indian Pines数据集上方形邻域大小为7 × 7,稀疏度为80,对分类结果微调的窗口大小为9 × 9。在Pavia University数据集上方形邻域大小为3 × 3,稀疏度为30,对分类结果微调的窗口大小为7 × 7。
表1给出了6种算法的实验结果,可以看出:仅利用光谱特征的SVM、SRC方法实验精度比加入空间信息的SVM-CK、JSRC方法实验精度分别降低6%、18%左右,说明空谱特征联合的方式能够大幅提高光谱图像的分类精度,且JSRC方法对空间信息的利用比SVM-CK的效果好。CNN方法的分类精度虽然高于前两种分类方法,但其受小样本的影响,实验精度不如联合空谱特征方法的分类效果。A2-JSRC方法的实验精度比JSRC方法的提高了6%左右,说明对空间的二次利用可以进一步挖掘图像中的有效信息,避免噪声的干扰,提高分类精度。图1是Indian Pines数据集的真实地面图和以上6种算法在该数据集上的结果分类图。从图中可以看出,A2-JSRC算法的分类结果最好,与真实地面图最为相似。前几种方法的结果图中存在许多零散的错分点或整块被分错的状况,尤其是OA值越低,被错分的像元越多。本文提出的算法能够对局部窗口内的零散像元点进行调整,减少错分情况,提高正确率。
Table 1. Experimental results of 6 different algorithms on the Indian Pines dataset
表1. 6种不同算法在Indian Pines数据集上的实验结果
Figure 1. The true ground map of the Indian Pines dataset and the classification results of 6 different algorithms on it. (a) Real ground map; (b) SVM; (c) SRC; (d) CNN; (e) SVM-CK; (f) JSRC; (g) A2-JSRC
图1. Indian Pines数据集的真实地面图和6种不同算法在其上的分类结果图。(a) 真实地面图;(b) SVM;(c) SRC;(d) CNN;(e) SVM-CK;(f) JSRC;(g) A2-JSRC
表2为6中不同算法在Pavia University数据集上的实验结果,可以看出,仅用光谱信息得到的实验结果精度没有空谱信息结合后的实验精度高。本文提出的A2-JSRC方法得到的实验结果最好,OA值高达98.63%,相比前5种方法其精度分别提高20%、24%、12%、10%、6%。从图2也可看出:A2-JSRC的实验结果图与真实地面图最为接近,没有大量零散的错分点,在部分面积块内的目标地物几乎属于同一类型。以上表明本文提出的邻域重构和对分类结果的二次调整能有效降低噪声点的干扰,极大提高分类精度。
Table 2. Experimental results of 6 different algorithms on the Pavia University dataset
表2. 6种不同算法在Pavia University数据集上的实验结果
Figure 2. The real ground map of the Pavia University data set and the classification results of 6 different algorithms on it. (a) Real ground map; (b) SVM; (c) SRC; (d) CNN; (e) SVM-CK; (f) JSRC; (g) A2-JSRC
图2. Pavia University数据集的真实地面图和6种不同算法在其上的分类结果图。(a) 真实地面图;(b) SVM;(c) SRC;(d) CNN;(e) SVM-CK;(f) JSRC;(g) A2-JSRC
5. 结论
本文采用改进的联合稀疏表示算法用于高光谱图像分类,大幅提升了分类精度。该算法一方面通过选择与样本像元相关性强的邻域像元建立模型,以此降低噪声点产生的干扰;另一方面利用同类地物的聚类性对初步的实验结果进行微调,减少零散的错分点,提高实验结果。本文算法在对光谱曲线较为接近的地物仍存在错分和混淆的情形,对其进一步的区分是之后的工作方向。
致谢
通过这一段时间的努力,我的导师从文章方向、论文写作等给予我耐心的指导和无私的帮助。我的同学提供我一些计算方法作为参考。有了他们的帮助,我才能顺利完成该篇论文。在此,向他们表示我由衷的谢意。对于审核此论文的各位老师也表示感谢,谢谢你们提出的宝贵意见,我将在今后的论文写作过程中将此次反馈的意见为参考,努力提高我的写作水平。