1. 引言
随着无人机技术的发展和普及,无人机影像成为获取地表信息的重要手段之一。在农业领域,利用无人机影像进行农作物提取已成为一个重要的研究方向[1]。无人机遥感具备高分辨率、操作简单、获取数据快及低成本等特点,可以快速针对某一区域进行影像采集工作,获取更精确的作物分布信息,成为卫星遥感和航空遥感的重要补充,对作物监测技术的发展和应用具有重大意义[2]。而随机森林模型作为一种机器学习算法,在图像分类和地物提取方面展现出了较好的效果。因此,本研究旨在结合无人机影像和随机森林模型,探讨如何准确、高效地提取农作物信息,为农业生产管理和监测提供技术支持[3]。
农作物遥感提取作为利用遥感技术和图像处理方法对农田中的农作物进行识别和分类的重要工作,对于农业生产管理至关重要。通过农作物遥感提取,农业从业者可以了解农田的种植结构,有效调配资源,优化农作物种植布局,从而提高农作物的产量和质量,实现精准农业的目标。然而,农作物遥感提取也面临着一些挑战[4]。农田中存在多种农作物混植的情况,地物遮挡等问题会使得遥感提取的过程更加复杂和困难。这些因素的存在会影响遥感提取结果的准确性和可靠性,需要通过不断改进遥感技术和算法,提高提取的精度和鲁棒性,以更好地应用于农业生产管理中[5]-[10]。
随机森林是一种基于集成学习的机器学习算法,具有良好的分类性能和鲁棒性,被广泛应用于农业领域的图像分类和地物提取任务中。在农作物遥感提取中,随机森林模型可以有效地识别不同类型的农作物,提高提取的准确性和效率。随机森林模型具有较强的泛化能力,能够处理大规模数据,并且对于特征之间的相关性不敏感,适用于复杂的农田环境。随机森林模型在农业领域的应用前景广阔,有望为农业生产管理提供更多的技术支持[11]-[15]。
2. 材料与方法
2.1. 研究区概况
大同市云洲区位于大同市东郊,距市区20公里,国土面积1478平方公里,耕地73万亩,物产资源丰富。农作物有玉米、谷黍、马铃薯等,特色农产品有小明绿豆、哈密杏、槟果。地理气候独特。属温带季风型大陆性气候,平均海拔1157米,年均降水量391.5毫米。桑干河流经境内58公里,形成16座水库、6万亩湿地,册田水库是全省第二大水库,是首都水资源可持续利用项目县(区)。研究区位置见图1。
Figure 1. Schematic diagram of the location of the study area
图1. 研究区位置示意图
2.2. 随机森林模型原理
随机森林是一种基于集成学习的机器学习算法,由多个决策树组成。每棵决策树都是基于不同的随机特征子集进行训练,通过投票或取平均值的方式进行预测。随机森林具有良好的泛化能力和抗过拟合能力,能够处理大规模数据集并应对高维特征。其原理简单直观,易于实现和调试,在农业领域的应用也取得了显著成果。具体原理见图2。
Figure 2. Principle diagram of the random forest
图2. 随机森林原理图
2.3. 无人机影像预处理方法与流程
无人机影像预处理是提高影像质量以满足后续分析和应用需求的关键步骤。首先是数据采集后的整理,从无人机存储设备导出影像数据后,依据拍摄时间、地点、飞行架次等信息分类,同时检查数据完整性,确保无文件丢失或损坏。接着进行几何校正,因无人机飞行受气流、姿态变化影响,影像会产生几何变形。可利用地面控制点或无人机自身定位信息,通过坐标变换等数学模型,使影像像素坐标与实际地理坐标准确对应,为后续处理奠定基础。然后是辐射校正,由于传感器特性和光照、大气条件变化,影像辐射信息会有偏差。传感器校正可消除镜头暗角、像素响应不均等问题,大气校正则考虑大气散射和吸收,还原真实辐射值,保障色彩和亮度准确。影像去噪也不可或缺,飞行中会引入椒盐噪声、高斯噪声等,针对不同噪声类型选择合适滤波算法,如中值滤波去除椒盐噪声、高斯滤波消除高斯噪声,以此提升影像清晰度。最后是影像拼接,若需要大面积影像,要将多幅相邻影像拼接。先进行特征匹配,利用SIFT、SURF等算法找到角点、边缘点等同名点,再通过变换模型计算相对位置关系,将影像拼接成一幅完整的大影像,满足大面积区域观测和分析要求。具体流程见图3。
Figure 3. Flow chart of UAV data processing
图3. 无人机数据处理流程图
3. 无人机影像数据采集获取
为辅助内业遥感影像关于农作物精准判读,使用大疆M300无人机搭载禅思L1激光雷达选取山西省大同市云洲区、河北省张家口市等地典型区域为研究对象,对耕地、林地等地块进行航测飞行,航向重叠率为80%,旁向重叠率为80%,起飞架次10个,相对航高100 m,雷达反射率为10~60%。地面真实样本数据的收集是农作物遥感提取实验的基础。通过在不同地块设置采样点,采集农田实地影像数据,获取各类农作物的真实样本信息,见图4。这些数据可以用于模型训练和验证,提高模型对不同农作物的识别能力。
Figure 4. Ground sample data graph
图4. 地面样本数据图
无人机影像数据获取是农作物遥感提取的基础,通过无人机搭载的相机获取高分辨率、多光谱的农田影像数据。这些数据具有高空间分辨率和频谱分辨率的特点,能够提供丰富的地物信息,有助于准确提取农作物信息。无人机影像数据的特点包括灵活性高、获取成本低、数据更新快等优势,使其成为农业遥感领域的重要数据来源。
无人机搭载激光雷达可以在毫米级别上实现高精度的测距和成像,确保获取的测绘数据具有高准确性,依据高精度数据可实现对种植区域农作物种类及生长状态的精准判读,无人机影像清晰,能够呈现农作物的高度、密度、结构等特征,能够克服传统遥感影像在区分作物种类及生长状态方面的局限性,实现对农作物遥感解译新突破,为国土变更调查核查提供了更为准确、详细的信息,也为土地利用变化监测提供强有力的数据支撑。
4. 实验结果
4.1. 结果与分析
测试分析中,需要将地面真实样本数据划分为训练集和测试集,保证数据的独立性和随机性。针对不同农作物的特性,可以选择合适的特征提取方法和模型结构,设计实验方案来比较不同分类算法在农作物提取任务中的表现,以农作物类型数据测试结果为例,见图5。
Figure 5. Test analysis diagram
图5. 测试分析图
4.2. 结果与讨论
Table 1. Results of accuracy evaluation for different ground objects
表1. 不同地物精度评价结果
地物 |
精度//% |
Kappa |
生产者 |
用户 |
总体精度 |
玉米 |
94.17 |
91.7 |
96.27 |
0.93 |
高粱 |
93.93 |
90.61 |
树木 |
99.41 |
96.57 |
草地 |
97.58 |
94.12 |
由不同地物识别的精度评价结果见表1可知,利用归特征消除与随机森林相结合的算法取得了很高的精度,总体精度达96.27%,Kappa系数达0.93。其中玉米、高粱由于其叶片颜色与纹理特征比较类似产生耦合,造成精度较低,生产者精度仅为94.05%;非农作物地物都取得了较高的精度,其中林地精度达到了99.41%。由此可见,选取的方法能满足提取精度要求。
基于随机森林模型预测生成的农作物提取结果如图6所示,从中可看出农作物与非农作物地物能够被正确识别,各地物区分度较好,最终的分类结果边界清晰且破碎化现象较少,比较符合研究区地物分布情况。从局部细节进行分析,植被指数特征在农作物地物与非农作物地物区分上起到了较大作用;在农作物提取上,由于玉米边缘叶片颜色与高粱相似,仅利用可见光影像在区分上存在一定困难,造成一定的错分现象;而非农作物地物中,树林叶片颜色呈红色、草地呈蓝色与其余作物颜色差异较为明显,故提取效果较佳。
Figure 6. Classification results chart of different ground objects
图6. 不同地物分类结果图
4.3. 未来展望
农作物遥感提取技术在农业生产中具有重要意义,通过遥感影像数据和机器学习算法的结合,可以实现对农田作物的快速、准确识别,为农业管理和决策提供科学依据。本文从数据采集与预处理、模型构建原理、实验设计与结果分析等方面对农作物遥感提取进行了系统性探讨和总结。随着技术的不断发展和应用,相信农作物遥感提取技术将在农业生产中发挥越来越重要的作用,为农业现代化进程提供有力支撑。
无人机影像相比于传统卫星影像,在空间分辨率上具有极大优势,使得农作物精细化提取得以实现;利用递归消除法进行特征优选的方法能够有效实现高维度特征的降维,提升模型的运行效率与精度,实验结果表明,相比于仅采用光谱特征,在采用光谱、纹理、高度特征等多维特征组合时,农作物的分类总体精度为96.27%,Kappa系数为0.93。特别是在加入高度差这一空间特征时,整体分类精度得到显著提高,证实了作物高程特征对提高农作物分类精度的有效性。其中光谱特征、植被指数特征、纹理特征与高程特征均对分类效果起到重要作用。
5. 结论
通过对无人机影像中农作物高程与农作物类型的特征研究可以得出如下结论:
(1) 除了提高整体分类准确性外,各类分类结果中椒盐现象减少;
(2) 当引入高度特征时,在RGB影像中难以分离的类,如树木,草地和玉米等分类精度都得到了提升;
(3) 借助高度特征,RGB图像中由阴影引起的农作物错分现象明显减少。
基金项目
中国地质调查局项目“全国国土变更调查国家级外业核查(廊坊中心)”(DD20230518)。
NOTES
*通讯作者。