1. 引言
土壤是地球上最重要的自然资源之一,对农业生产、生态环境和人类生存具有至关重要的作用。土壤的理化性质是描述土壤特性和功能的重要指标,包括土壤质地、有机质含量、水分状况、养分含量等。植物根系吸收提供养分的主要过程是扩散作用,而扩散作用受土壤理化和生物因素的影响很大 [1] 。所以准确测定和预测土壤理化性质对于实现高效农业生产、科学土壤管理和环境保护至关重要。传统的土壤分析方法通常依赖于实验室测试和人工观察,这些方法不仅耗费大量的时间和人力,而且受到人为因素的影响,存在主观性和局限性。随着科技的不断发展,机器学习方法成为解决土壤理化性质测定中的挑战的有效途径之一。在机器学习方法中,卷积神经网络(Convolutional Neural Network, CNN)作为一种强大的技术,在图像处理和模式识别领域取得了巨大的成功。卷积神经网络是一种受到生物视觉系统启发的深度学习模型,具有自动学习和特征提取的能力。它通过多层卷积和池化操作,可以从输入的土壤图像中提取出丰富的空间和频域特征,从而实现对土壤理化性质的准确预测。相比传统方法,卷积神经网络具有以下优势:首先,它能够处理大规模的土壤图像数据,从中学习到更全面、更准确的特征表示;其次,它能够自动学习和适应土壤图像中的复杂模式和关联性;此外,卷积神经网络可以实现非接触式的土壤性质测定,避免了传统方法中的样品采集和实验操作,提高了测定效率和准确性。近年来,卷积神经网络在土壤理化性质测定中的应用取得了一些重要的研究进展。例如,研究人员利用卷积神经网络成功预测了土壤质地、有机质含量、水分状况和养分含量等重要性质,取得了较高的准确性和效率。这些研究成果为土壤科学领域提供了新的思路和方法,为实现精准农业和可持续发展提供了有力支持。然而,尽管卷积神经网络在土壤理化性质测定中展现出了巨大的潜力,但仍然存在一些挑战需要克服。其中包括土壤图像数据的获取和标注问题、卷积神经网络的解释性和可解释性等。未来的研究应该致力于解决这些问题,并深入探究卷积神经网络在土壤科学领域的应用机制和解释性,以推动土壤科学的发展和农业可持续发展的实现。如图1所示。
Figure 1. Convolutional neural network structure
图1. 卷积神经网络结构
2. 利用卷积神经网络测定土壤理化性质的意义
土壤理化性质是指土壤在物理和化学方面的特性和性质。它涵盖了土壤的物理性质和化学性质两个方面。常见的土壤物理性质包括:质地,结构,孔隙度,密度,水分特性等。土壤化学性质包括:pH值,养分含量,有机质含量,土壤酶活性,重金属含量等。其中农业生产力受到土壤肥力低下的阻碍。其原因之一是农用地土壤pH值的状况 [2] 。pH作为分析测量土壤酸碱强度的重要指标之一,对植株的生长起着不可或缺的作用,只有在适宜土壤pH范围,植物才能更有效的吸收养分以及正常的生长发育 [3] 。土壤水分是一个重要的环境因子,土壤含水量随时空的分布和变化,对地–气间的热量平衡、土壤温度和农业等都会产生显著的影响,因此土壤水分对气候、农业、旱情监测都具有极为重要的意义 [4] 。土壤含氮量是衡量土壤肥力的一项重要指标,氮作为植物生长发育的主要养分之一,对植物根、茎、叶的生长及叶绿素和酶蛋白的合成至关重要。氮肥已被广泛用于提高作物产量和改善土壤肥力 [5] 。此外可见–近红外(vis-NIR)和中红外(MIR)光谱技术已被广泛应用于土壤有机碳(SOC)的定量估算 [6] 。卷积神经网络利用土壤近红外光谱间接预测土壤成分与传统的实验室分析方法相比,具有节约时间、成本低等优点,而建立准确的预测模型至关重要 [7] 。
传统的土壤理化性质测定方法通常需要大量的实验室测试和人工观察,耗费时间和人力资源。而卷积神经网络可以通过自动学习和特征提取的方式,从土壤图像中准确地预测出理化性质,实现非接触式的测定,大大提高了测定效率。准确测定土壤理化性质对于实现精准农业和可持续发展至关重要。利用卷积神经网络进行土壤理化性质的测定,可以为农业生产提供精准的土壤管理指导,合理调控土壤养分、水分和有机质等因素,提高农作物的产量和质量,减少农药和化肥的使用,降低对环境的影响,实现农业的可持续发展。
3. 卷积神经网络测定土壤理化性质的进展
利用卷积神经网络测定土壤理化性质是当前土壤科学领域的一个研究热点。卷积神经网络主要由卷积层、池化层、激活函数和全连接层组成 [8] 。是一种深度学习模型,通过学习图像的特征和模式,可以应用于土壤图像分析和土壤性质预测。主要在测定土壤pH值,土壤水分,土壤含氮量,土壤有机质含量,土壤铅含量方面有相应研究。
3.1. 利用卷积神经网络测定土壤pH值
土壤pH受气候、地形、母质、植被、人类活动及盐基饱和度等多种因素影响,是土壤的重要化学性质之一 [9] [10] 。目前,测定土壤pH值的常规方法有pH计测量,pH试纸或试剂盒,玻璃电极测量,酸碱度指示剂,土壤pH测量仪器。
与利用卷积神经网络测定土壤pH值相比常规方法的缺点有需要人工操作,有限的空间分辨率,无法提供全面的土壤pH分布信息,常规方法的结果可能受到土壤样品采集和处理的影响,存在一定的不确定性,耗时。与常规方法相比利用卷积神经网络测定土壤pH值的优点是非侵入性测量,避免了对土壤样品的破坏性采集和处理,高空间分辨率,过分析大量土壤图像数据,能够获得更全面的土壤pH分布信息,自动化和高效性,可扩展性,利用卷积神经网络方法可以结合其他传感器数据和土壤特性信息,提高土壤pH预测的准确性和应用范围。
卷积神经网络量土壤pH的主要原理,将土壤图像作为输入数据,图像通常由像素组成,每个像素表示图像中的一个点,包含颜色信息。CNN通过一系列的卷积层来提取图像中的特征。卷积层使用一组可学习的滤波器(也称为卷积核或特征检测器)在图像上滑动,计算每个位置的卷积操作。这样可以捕捉到图像中的局部特征,例如纹理、边缘和形状等。在卷积层之后,通常会应用一个非线性激活函数,如ReLU (Rectified Linear Unit),以引入非线性变换,增加模型的表达能力。为了减少特征图的尺寸并提取更加抽象的特征,CNN通常会使用池化层。池化层通过对局部区域进行降采样操作,例如最大池化或平均池化,从而减少特征图的维度,同时保留重要的特征信息。在经过多个卷积层和池化层后,CNN会将特征图转换为一维向量,并通过全连接层进行分类或回归。全连接层中的神经元与前一层的所有神经元相连,通过学习权重和偏置来将特征映射到最终的输出。输出层根据具体任务的需求进行设计,对于土壤pH的预测,可以使用一个具有单个神经元的输出层,并使用适当的激活函数(如线性激活函数)来获得连续的预测值。损失函数衡量预测值与真实pH值之间的差异,常见的损失函数包括均方误差(MSE)和平均绝对误差(MAE)等。通过反向传播算法和优化算法(如随机梯度下降)对CNN的参数进行训练,使模型能够逐渐调整权重和偏置,以最小化损失函数。训练过程中,模型通过不断迭代调整参数来提高预测的准确性。在模型训练完成后,可以将新的土壤图像输入到CNN中进行预测。模型将对图像进行特征提取和表示学习,并输出对应的土壤pH值。
唐永生,陈争光利用近红外光谱结合卷积神经网络模型对土壤的pH值进行预测,LUCAS土壤样本作为研究对象,建立能够检测土壤pH值的CNN模型,分析结果表明,利用卷积神经网络对近红外光谱进行建模可实现对土壤pH值的高效准确检测 [11] 。
利用卷积神经网络测量土壤pH可以帮助农民和土壤管理者更好地了解土壤环境,优化农作物生长条件,提高农作物产量和质量,减少肥料浪费和环境污染,维护土壤健康和生态系统的稳定性。
3.2. 利用卷积神经网络测定含水量
土壤含水量是农业和畜牧业等领域衡量土壤干旱水平的重要指标 [12] ,含水量的变化对植物生长发育,土壤中养分循环,生物活性,土壤结构与通气性都有直接影响。传统检测土壤含水量的方法有干湿重量法,容积比法,电阻法,介质浸润法。
传统检测土壤含水量方法有时间消耗较大,破坏性较大,不适用于实时监测,精度受限的缺点。而利用卷积神经网络测量土壤含水量的优点是非破坏性测量,相比传统方法需要对土壤样品进行干燥处理,卷积神经网络可以通过对土壤图像进行分析来估计土壤含水量,从而避免了对土壤样品的破坏,保持了土壤的原貌。实时监测能力,卷积神经网络可以处理实时数据流,因此可以提供实时的土壤含水量监测。这对于需要及时了解土壤水分变化的应用,如农田灌溉管理和水资源管理等,非常有价值。高精度预测,卷积神经网络具有强大的学习和模式识别能力,可以从土壤图像中提取丰富的特征,并建立土壤含水量与图像特征之间的关联。通过大规模的训练数据和深度学习算法,CNN能够提供较高精度的土壤含水量预测。非接触性测量,利用卷积神经网络进行土壤含水量测量无需直接接触土壤样品,只需要获取土壤图像即可。这种非接触性测量方法更加方便快捷,减少了操作的复杂性和实验的时间成本。可扩展性,卷积神经网络可以应用于不同类型的土壤和地理环境,具有一定的通用性和适应性。通过适当的数据集训练和模型调整,可以针对不同地区和土壤类型进行定制化的土壤含水量测量。
卷积神经网络测量土壤含水量的主要原理,收集代表性的土壤样本,并使用传感器或其他方法测量其真实的含水量作为标签数据。同时获取土壤图像数据,可以使用无人机、卫星图像或传感器等设备进行数据采集。对土壤图像数据进行预处理,包括去除噪声、调整图像大小和色彩平衡等,以提高后续处理的准确性。将土壤图像与相应的含水量进行关联标注,生成训练集、验证集和测试集。设计CNN模型的结构,包括卷积层、池化层、全连接层和输出层等。考虑模型的深度和宽度,以及合适的激活函数和正则化方法。由于土壤图像数据可能存在数量有限的问题,可以使用数据增强技术来扩充训练集。数据增强方法包括旋转、翻转、缩放、平移和添加噪声等操作,以生成更多样化的训练样本。将训练集划分为小批量样本,并使用随机梯度下降(SGD)等优化算法对模型进行训练。在训练过程中,监控模型在验证集上的性能,以避免过拟合并选择最佳模型。使用测试集对训练好的CNN模型进行评估,计算预测结果与真实含水量之间的误差。根据评估结果,对模型进行优化和改进,如调整模型结构、超参数调优和正则化等。
王璨,武新慧,李恋卿,王玉顺,李志伟将卷积神经网络用于近红外光谱预测土壤含水率,提出了有效的CNN光谱数据回归建模方法,并取得了较好效果 [13] 。
谭建灿,毛克彪,左志远,赵天杰,谭雪兰,李建军基于卷积神经网络和AMSR2微波遥感的土壤水分反演研究得到的卷积神经网络,经随机抽取的测试样本验证表明,反演出了具有较好精度的10 km的地表土壤水分(R = 0.8685和RMSE = 1.1178%) [14] 。
使用卷积神经网络测量土壤含水量可提高农业生产效率、节约水资源、减少环境影响,改善土壤管理和农业可持续性,推动农业智能化。
3.3. 利用卷积神经网络测定土壤含氮量
测定土壤含氮量的传统方法有土壤样品提取法,凯氏提取法,氨态氮测定法,硝态氮测定法。相比传统检测方法利用卷积神经网络测定土壤含氮量具有非破坏性、快速实时、自动化便捷、高准确性和预测能力等优点,为土壤监测和农业管理提供了一种创新的方法。
卷积神经网络测定土壤含氮量主要原理,收集代表性的土壤样本,并使用化学分析等方法测量其真实的含氮量作为标签数据。同时获取土壤图像数据,可以使用无人机、卫星图像或传感器等设备进行数据采集。对土壤图像数据进行预处理,包括去除噪声、调整图像大小和色彩平衡等,以提高后续处理的准确性。将土壤图像与相应的含氮量进行关联标注,生成训练集、验证集和测试集。设计CNN模型的结构,包括卷积层、池化层、全连接层和输出层等。考虑模型的深度和宽度,以及合适的激活函数和正则化方法。由于土壤图像数据可能存在数量有限的问题,可以使用数据增强技术来扩充训练集。数据增强方法包括旋转、翻转、缩放、平移和添加噪声等操作,以生成更多样化的训练样本。将训练集划分为小批量样本,并使用随机梯度下降(SGD)等优化算法对模型进行训练。使用测试集对训练好的CNN模型进行评估,计算预测结果与真实含氮量之间的误差。根据评估结果,对模型进行优化和改进,如调整模型结构、超参数调优和正则化等。可以尝试不同的CNN架构、调整学习率和批量大小等参数,以提高模型性能。
唐永生,陈争光使用卷积神经网络模型对土壤可见近红外光谱数据的特征提取,进而实现对土壤氮含量的快速检测,为后续的土壤养分快速检测仪器开发提供了基础 [3] 。
适当的土壤含氮量可以提供植物所需的养分,促进植物的生长和产量增加。此外,氮素还是蛋白质和其他生物分子的组成要素,对植物的营养价值和品质也有影响。因此,合理管理土壤含氮量,确保植物获得足够的氮素供应,对于农业生产的成功和可持续性至关重要。见表1。
Table 1. Application of typical convolutional neural network models in predicting soil physical and chemical properties
表1. 典型卷积神经网络模型在土壤理化性质预测中的应用
3.4. 卷积神经网络进行软测量的优缺点
软测量是一种利用数学建模和数据分析技术来预测、估计或监测无法直接测量的过程变量或产品性质的方法。它通过利用已测量的过程变量和相关的历史数据,建立数学模型来推断或预测无法直接测量的变量。
软测量通常应用于工业过程中,其中某些关键的过程变量无法通过传统的传感器直接测量。通过软测量技术,可以利用已有的传感器数据和历史数据,通过建立合适的数学模型,来预测或估计这些无法直接测量的变量。软测量可以提供对过程状态的实时监测和预测,从而帮助操作人员进行过程控制和优化。
软测量技术是一种有价值的工具,具有许多优点和一些缺点。优点方面,软测量技术能够实现实时监测和预测无法直接测量的过程变量,提供及时的反馈和控制,从而提高生产效率和产品质量。此外,软测量技术相对于传统硬测量方法来说成本较低,且具有良好的可扩展性,可以适应不同规模和复杂度的生产过程。它还能够通过数据驱动的方式自动学习和优化模型,提高系统的鲁棒性和适应性。
然而,软测量技术也存在一些缺点。首先,建立软测量模型的过程相对复杂,需要专业知识和复杂的数学算法。这对于非专业人员来说可能较为困难。其次,软测量的准确性和可靠性受到输入数据质量的影响,包括噪声、缺失值或异常值等。如果数据质量较差,可能会导致软测量结果不准确或不可靠。此外,软测量模型的泛化能力有限,对于过程变化或新的操作条件可能需要重新训练或调整模型。同时,软测量技术对先验知识的需求较高,缺乏足够的先验知识可能会影响模型的建立和准确性。此外,软测量模型需要定期的维护和更新,以保持其准确性和可靠性。最后,软测量结果通常伴随一定的不确定性,由于模型的近似性和输入数据的不确定性,软测量结果可能存在一定的误差或偏差。见表2。
Table 2. Comparison between convolutional neural networks and physical and chemical methods
表2. 卷积神经网络与物理化学方法的对比
4. 结语
本文综述了卷积神经网络在土壤理化性质测定中的研究进展。通过对相关文献的梳理和分析,我们发现CNN技术在土壤科学领域的应用取得了显著的进展,并展现出巨大的潜力。
首先,CNN方法在土壤理化性质测定中具有非常高的准确性和预测能力。通过对土壤图像数据进行学习和模式识别,CNN能够提取出土壤特征,并与理化性质建立关联模型。这种基于图像的方法能够捕捉到土壤的微观结构和组成特征,从而实现对土壤理化性质的精确测定。
其次,CNN方法具有快速实时和非破坏性的特点,为土壤监测和农业管理提供了便利。相对于传统的实验室分析方法,CNN方法能够在短时间内完成大量土壤样品的测定,实现实时监测和调控。同时,CNN方法不需要对土壤样品进行破坏性处理,避免了传统方法中的样品准备和化学分析过程,大大提高了测定效率和操作便捷性。
然而,目前的研究还存在一些挑战和限制。首先,土壤图像数据的获取和处理仍然是一个复杂的问题,需要克服光照、土壤类型和图像噪声等因素的干扰。其次,样本数据的多样性和数量对于CNN模型的训练和泛化能力具有重要影响,需要进一步扩大样本规模和改进数据采集方法。
卷积神经网络在土壤理化性质测定中具有广阔的应用前景。未来的研究可以进一步优化CNN模型的算法和网络结构,提高其准确性和鲁棒性。同时,可以结合其他环境因素和数据源,开展多元信息的综合分析,为土壤科学和农业管理提供更全面、准确的数据支持。这将为农业可持续发展和土壤资源管理提供重要的科学依据和决策支持。
基金项目
2023年四川省大学生创新创业训练计划项目,编号S202311116059。