Research on Data Processing Methods for Airborne Laser Point Clouds
In response to the problem of unsatisfactory classification accuracy of rod shaped objects in airborne laser scanning point cloud data, this paper constructs a rod shaped object classification algorithm based on support vector machine (SVM) model, starting from the spatial morphology characteristics of rod shaped objects. Firstly, determine 10 characteristic values and establish a feature matrix based on the spatial morphology characteristics of the rod-shaped object; secondly, conduct SVM model training and establish a classification model; finally, use the trained optimal SVM model for rod object classification. Selecting a certain section of urban road point cloud data for experimentation, the results show that the classification model in this paper does not require manual intervention or threshold setting, and has a high degree of automation. The highest classification accuracy of pole shaped objects can reach 94.23%, verifying the effectiveness and superiority of the algorithm. This can provide certain reference and guidance for land object classification based on laser point cloud data.
Airborne Laser Scanning
机载激光扫描系统是近些年来发展起来的一种新型主动式探测技术,该技术能够在较短的时间内大量道路及道路两侧大量点云数据
机载激光扫描的对象为道路场景中所有地形、地物要素,采集激光点云中包含大量地面点,本文研究目标为非地面点,因此以杆状物的非地面点为兴趣目标,为提升后续杆状物的提取效率,首先将地面点移除。移除地面点的滤波方法主要有基于分割、基于表面、基于形态学以及基于斜率的滤波。由于本文的研究重点为不同杆状物的相互分离与提取,因此无需对地面点进行精细滤波。本文去除地面点首先可以设置局部范围内的最低点为地面点;其次划分所有激光点为若干个二维格网,将格网内最低点视为地面点,判定其余点与最低点高差;最后根据高差大小判定地面点与非地面点,删除地面点,保留非地面点。
机载激光点云数据主要包含以下几类信息,一是强度信息(I),二是颜色信息(R、G、B),三是GPS时间(T),四是坐标信息(X、Y、Z)。通过单个激光点体现出杆状物信息,因此要对杆状物对象的所有组成激光点进行聚类,根据聚类单元特征值建立特征向量F,本文将根据聚类单元点云数、最小包围盒体积、拟合平面总残差与均方根误差、方向特征向量、不同平面投影密度建立特征向量。
不同聚类单元在点云数上与最小包围盒体积上存在差异,因此可将聚类单元数n与最小包围盒体积v作为聚类单元特征值。
不同杆状物的形态特征差别较大,使用最小二乘法对杆状物点一定范围内点进行表面拟合,满足点与拟合平面垂直距离最小,平面拟合的参数方程为:
(1)
式中,x、y、z为变量;A、B、C为参数。
将点与拟合平面的距离作为残差,表示为:
(2)
式中,i为残差。
总残差与残差均方根误差表示为:
(3)
式中,为总残差;为残差均方根误差;n为点数。
采用主成分分析算法对杆状物点云X、Y、Z矩阵进行奇异值分解,提取方向特征值a1、a2、a3,为解决不同地物方向特征值量纲不同,对特征值归一化处理:
(4)
式中,m1、m2、m3为处理后特征向量。
杆状物不同投影面面积较大,因此对投影面进行格网化处理,格网尺寸为0.2 m × 0.2 m,3个方向的投影密度Dm1、Dm2、Dm3可使用聚类单元点数量与投影面积比值确定。
综合前文所述,可根据10个特征值构成特征向量F, 。
SVM分类模型是基于统计学理论发展而来,是鲁棒性最好的一种导式机器学习分类算法。SVM分类模型通常用于线性可分样本集与非线性可分样本集的分类,对于线性可分样本集,SVM通过构建一个平面,在保证平面至样本集集合边界距离最大的前提下实现两类地物分割,该平面也称为超平面。对于线性不可分样本集,将样本从低维空间转至高维空间,并进行两类地物分割。
线性可分样本集 ,超平面、支持向量距离为 ,判决函数为:
(5)
式中,yi( )为判决函数;wi为分类面权重系数;b为位移项,决定了超平面与原点的距离。
SVM处理线性样本集的情况要比非线性可分问题更多,引入惩罚因子C与非负松弛变量对非线性可分问题中的超平面进行优化:
(6)
(7)
为了能够将低维度样本集向高维度空间映射,引入核函数K,同时能够降低内积计算复杂度,结果表示为:
(8)
式中,(xi)为映射函数。
根据式(7),得到判决函数:
(9)
式中, 为样本集拉格朗日乘子,w*是 为最优解时的最优分类面权重系数,采用k折交叉验证方法确定最优惩罚系数C与核函数参数g。
仅依靠机载原始点云无法进行SVM模型分类,为提升分类模型的运算效率,同时为提升分类准确性,首先对原始机载激光扫描点云数据进行预处理,包括点云分段、地面点移除。将所有激光点划分为若干个二维格网,确定格网内最低点为地面点,判定格网内剩余点与最低点高差,设置高差阈值,将满足阈值条件的点判定为地面点,实现地面点与非地面点分类。在非地面点的基础上,根据聚类单元点云数、最小包围盒体积、拟合平面总残差与均方根误差、方向特征向量、不同平面投影密度建立特征向量。使用特征向量进行SVM模型训练并建立分类模型,最后,使用训练好的最优SVM模型进行杆状物分类。本文仅设计杆状物的分类,采用提取杆状物作为样本,统一存放相同样本,本文杆状物提取具体工作流程如
1) 对机载原始点云进行预处理,移除大量地面点,为后续杆状物分类提供基础;
2) 不同杆状物点具有不同的形态特征,确定能够将杆状物进行区分你的特征值;
3) 根据聚类单元特征值建立特征向量;
4) 赋予不同杆状物特有标签(行道树——1,路灯——2,指示牌——3,线杆——4);
5) 杆状物样本集与测试集制作,样本集数量对分类结果产生重要影响;
6)为消除不同特征值间的量纲差异性,对不同特征值进行标准化处理;
7) 交叉验证样本集,以获取最优惩罚系数C与核函数参数g;
8) 创建SVM模型,分析模型的分解结果,配置不同特征值组合与样本集数量进行试验对比。
选取某段城市道路作为实验区,该段道路长度约为0.95 km,实验区采用中海达ARS-1000L激光测量系统采集点云数据作为测试集,相邻扫描线间隔为0.02 m,点云数据采集时间为2023年6月2日。测试集中共有403个杆状物,包括行道树、路灯、指示牌、线杆,其中行道树253个,路灯68个,指示牌46个,线杆36个,如
参数类别 |
参数 |
激光系统 |
中海达ARS-1000L |
数据采集时间 |
2023-06-02 |
续表
脉冲频率/kHz |
200 |
采集往返数 |
Double |
全长/km |
5.3 |
在Matlab2012a环境下,采用libSVM库函数实现SVM分类模型,分类核函数为径向基函数,将特征值构建特征矩阵F作为模型输入进行模型训练。采用5对折交叉验证得到最优C值与g值分别为19.235、5.196,使用训练好的SVM分类模型判别测试集,设置不同训练轮数,分类精度与耗时统计结果如
训练轮数 |
行道树 |
路灯 |
指示牌 |
线杆 |
分类耗时/s |
整体分类精度/% |
500 |
95.34 |
89.32 |
64.46 |
98.22 |
25 |
91.77 |
1000 |
95.83 |
87.67 |
66.82 |
97.93 |
43 |
93.09 |
1500 |
96.33 |
87.01 |
68.56 |
98.00 |
64 |
93.13 |
2000 |
96.43 |
87.67 |
73.49 |
98.08 |
87 |
93.99 |
3000 |
96.43 |
87.34 |
80.04 |
98.08 |
136 |
94.19 |
5000 |
96.43 |
87.68 |
84.86 |
98.15 |
219 |
94.23 |
通过
杆状物整体分类效果如
图4. 分类结果局部放大图
SVM模型杆状物分类试验中,设置不同的特征值组合与样本集数量,统计不同特征值组合的分类精度,结果如
组合 |
特征值组合 |
样本集数量 |
||
500 |
700 |
1000 |
||
1 |
,,m1,m2,m3 |
83.90 |
89.02 |
90.97 |
2 |
,,d1,d2,d3 |
85.81 |
90.81 |
91.78 |
3 |
v,m1,m2,m3,d1,d2,d3 |
77.67 |
91.77 |
92.97 |
4 |
n,m1,m2,m3,d1,d2,d3 |
75.70 |
90.21 |
92.11 |
5 |
n,v,,,m1,m2,m3,d1,d2,d3 |
91.77 |
92.14 |
93.09 |
共设置5种不同的特征值组合,样本集数量分别为500、700、1000,通过
本文以机载激光扫描点云数据为研究对象,通过分析道路两侧杆状物的空间特征与几何特征,获取9种特征并构建准确的SVM分类模型对行道树、路灯、指示牌、线杆进行分类,试验结果显示,本文构建的最优SVM分类模型的杆状物整体分类精度最高能够达到94.23%。然而,本文分类模型仍然存在部分不足,一方面表现在对地物的完整性较高,地物不完整时易造成错分、漏分;一方面表现在当样本集的种类、数量不足时,会产生特征相似杆状物错误分类的情况;最后一方面表现在对杆状物的孤立性要求较高,无法有效准确识别分类出组合地物。实际应用中,仍然存在将一些非杆状物识别为杆状物的现象,例如将少量粗细均匀的树桩错误提取为杆状物。因此,下一步的研究重点将放在样本集完善、克服点云缺失以及组合杆状物的分割问题上。