基于MLP神经网络的尿液指标分析模型
Urine Parameter Analysis Model Based on MLP Neural Network
DOI: 10.12677/mos.2024.135483, PDF, HTML, XML,   
作者: 丁志祥:上海理工大学健康科学与工程学院,上海
关键词: 多层感知器尿液指标医疗诊断Multi-Layer Perceptron Urine Indicators Medical Diagnosis
摘要: 本研究提出了一种基于多层感知器(MLP)神经网络的尿液指标分析模型,旨在识别和预测尿液11项指标状态。尿液作为一种便捷且非侵入性的生物样本,具有重要的临床诊断价值,我们使用大量的尿液试剂条样本对MLP神经网络模型进行训练和测试,以提取尿液中的重要特征并进行分类预测。实验结果显示,模型的精确率、召回率和 F1值等性能指标都达到了90%以上,证明了模型在识别和预测尿液11项指标方面表现优异,为临床诊断提供了一种快速、准确且成本效益高的工具。本文的研究成果为尿液检测技术的发展提供了新思路,并展示了机器学习在医疗诊断中的广泛应用潜力。
Abstract: This study proposes a urine parameter analysis model based on a multilayer perceptron (MLP) neural network, aimed at identifying and predicting the status of 11 urine parameters. Urine, as a convenient and non-invasive biological sample, holds significant clinical diagnostic value. We trained and tested the MLP neural network model using a large number of urine reagent strip samples to extract key features from the urine and perform classification predictions. Experimental results demonstrate that the model achieved performance metrics, including precision, recall, and F1 score, all exceeding 90%, confirming its excellent performance in identifying and predicting the 11 urine parameters. This model provides a rapid, accurate, and cost-effective tool for clinical diagnosis. The findings of this study offer new insights into the development of urine testing technologies and highlight the broad potential applications of machine learning in medical diagnostics.
文章引用:丁志祥. 基于MLP神经网络的尿液指标分析模型[J]. 建模与仿真, 2024, 13(5): 5329-5336. https://doi.org/10.12677/mos.2024.135483

1. 引言

尿液是由肾脏产生的体液,在泌尿系统中扮演着排泄废物和代谢产物的重要角色[1]。尿液干化学分析法是指将被检测的尿液样本直接添加到干燥的尿液试纸条上,尿液样本中某些成分会与试纸垫中含有的特定物质发生化学反应,从反应后试纸垫颜色的变化来判断尿液样本中相应成分的含量[2]。传统的尿液分析方法主要依赖于实验室检测和医生的经验判断,存在着一定的局限性,如检测时间长、成本高以及对专业人员的依赖性等。随着机器学习和深度学习技术的快速进步,为尿液分析提供了新的解决方案。近年来,研究者们将机器学习算法应用于尿液图像的识别中,取得了显著进展。陈芙蕖[3]等设计了一种基于低维特征条件的尿液有形成分图像红白细胞分割与分类算法,该算法利用马尔可夫随机场和图像纹理特征,成功实现了红白细胞的准确分割和识别。刘晓彤[4]等通过融合滤波图像预处理、基于粒子群算法和遗传算法改进的BP神经网络,高效准确地实现了红细胞、白细胞、上皮细胞、管型和晶体等尿液成分识别与分类,这一系列研究表明,机器学习和深度学习在尿液分析中的应用前景广阔,为临床诊断和病情评估提供了更加高效和准确的技术手段。

多层感知器(MLP)神经网络作为一种经典的人工神经网络结构,以其简单性和有效性在各种模式识别任务中得到了广泛应用[5]。MLP神经网络能够通过多层非线性转换和全连接层的组合,捕捉数据中复杂的特征关系,使其在分类和回归任务中表现出色。在尿液指标分析中,MLP神经网络有望自动学习尿液中的有关指标的重要特征,进而实现对健康和病理状态的分类。

本研究旨在开发一个基于MLP神经网络的尿液指标分析模型,用于识别和分类尿液样本中的不同指标状态,并探索其在实际医疗应用中的潜力。本文的研究结果不仅为尿液分析提供了一种新方法,也为未来的医学诊断和健康监测提供了新的思路。

2. 实验数据

该文使用在上海市市东医院检验科采集的612例尿液样本的11联尿液试剂条作为数据集。该数据集包含了350例病房尿液样本和262例门诊尿液样本,涵盖了11种指标的全部浓度梯度。为了提高模型的识别性能,我们将11联尿液试剂条上的11个色块按指标ALB、CRE、LEU、NIT、PH、PRO、GLU、KET、URO、BIL、BLD分类裁剪出来,并根据每种指标进行分类。这一步骤旨在确保每种成分的颜色特征能够被准确提取和分析,归类后图像扩充到6732张,最后将图像的尺寸统一修改为32 × 46像素,按80%和20%的比例划分为训练集和测试集。实验图片如图1所示。

Figure 1. Urine parameter dataset

1. 尿液指标数据集

3. 尿液浓度MLP分类模型

3.1. MLP结构

多层感知机[6] (Multilayer Perceptron, MLP)也称人工神经网络算法(Artificial Neural Network, ANN),ANN是用于解决估计、分类和决策问题的数学模型[7]。MLP是最经典的人工神经网络,主要模仿生物神经元的结构和特性,由单层感知器发展而来,是一种前馈式监督训练的人工神经网络模型,包含输入层、至少一个中间隐藏层和输出层,如图2所示。模型将一组输入向量映射到一组输出向量,且不同层之间进行全连接,即上一层的任意一个神经元与下一层的所有神经元都进行连接[8]。模型利用内部含有的多个隐藏层的神经元来发现向量的分布式特征,神经元之间的连接赋予相关的权重,这些权重在迭代过程中通过MLP反向传播算法的监督学习方法不断调整[9],从而使得模型训练误差达到最小。

Figure 2. MLP structure

2. MLP结构

本文中采用MLP神经网络来处理尿液指标色块浓度分类任务。该神经网络由一个输入层、两个全连接隐藏层和一个输出层组成。输入层的大小根据输入数据的特征数动态确定。每个隐藏层包含50个神经元,并且使用ReLU激活函数 ( f ( x ) = m a x ( 0 , x ) ) 来引入非线性映射[10]。输出层根据数据集的分类标签数量动态调整其神经元数量,并使用Softmax激活函数将神经网络的输出转换为类别概率分布。这种结构被选择用于提高分类精度和模型的泛化能力。

3.2. 损失函数及优化器参数设置

在本文中,我们的神经网络模型通过TensorFlow框架实现,具体的损失函数选择为交叉熵损失函数 ( L ( y , t ) = t × l o g ( y ) ( 1 t ) × l o g ( 1 y ) ) ,适用于最后一层采用softmax激活函数的多分类任务[11]。优化器选择了Adam优化器,初始学习率设置为1e−3,并采用了动态学习率调度策略,在每10个周期将学习率衰减为当前的0.1倍以加速收敛。训练过程中,我们使用了大小为32的小批量样本进行参数更新,并在每次迭代前随机重排数据集,以避免模型过拟合并提高泛化能力。详细的训练进度如图3所示。

Figure 3. Training progress

3. 训练进度

3.3. 模型评价指标

在分类问题机器学习算法模型中,本文通过多个角度全面评估了所提出的分类模型的性能。首先,我们通过图像分类结果的视觉呈现。通过呈现16张测试图像,每张图像上标注了真实标签和模型预测的标签,清晰地展示了模型的分类效果和预测准确性。其次,利用混淆矩阵分析,我们系统地评估了模型在各个类别上的预测能力,混淆矩阵展示了真实标签与模型预测标签之间的对应关系,为评估模型整体和各类别准确性提供了直观的量化指标。进一步地,我们绘制了每个类别的ROC曲线,并计算了相应的AUC值,用以衡量模型在不同类别上的分类性能。高AUC值反映了模型对于各类别数据的有效分类能力。最后,我们还计算了精确率、召回率和F1值,这些指标进一步验证了模型在多类别分类任务中的稳健性和准确性[12],精确率、召回率和F1值的公式如下式:

p = T P T P + F P (1)

R = T P T P + F N (2)

F 1 = 2 T P 2 T P + F P + F N (3)

TP表示将正类判定为正类的样本数量,FP表示将负类判定为正类的样本数量,FN表示将正类判定为负类的样本数量,TN表示将负类判定为负类的样本数量。

4. 实验结果

以GLU指标模型为例。图4清晰地展示了模型在不同分类标签中的表现,可以看到在不同浓度水平上的预测结果与实际情况之间的对比。通过该图,我们能够识别出模型在某些标签上的预测优势以及潜在的偏差。这一分析为后续的模型优化提供了有价值的见解。

Figure 4. GLU prediction result diagram

4. GLU预测结果图

接下来,通过图5的混淆矩阵,我们进一步深入了解了GLU指标模型的分类结果。混淆矩阵不仅揭示了模型的预测准确率,还展示了错误分类的具体情况。例如,我们可以观察到模型在区分阴性与阳性的尿液样本时表现良好,但在区分强阳性样本时有一定的误差。这样的细节分析有助于识别出模型改进的方向,例如通过增加强阳性样本的数据量或调整模型的超参数来提高预测准确性。

Figure 5. GLU confusion matrix

5. GLU混淆矩阵

此外,图6的ROC曲线展示了模型在不同阈值下的真阳性率和假阳性率的变化。所有分类标签的曲线下面积(AUC)均超过了0.95,表明模型在区分不同类别时具有优异的性能。这意味着模型在实际应用中能够高效且准确地分类尿液样本,尤其是在医学诊断和健康监测等领域具有重要的实用价值。

Figure 6. GLU ROC curve

6. GLU ROC曲线

图7展示了一个完整的尿液11联试剂条图像检测系统的实现过程。通过导入试剂条样本图片,加载训练好的11个尿液指标模型,该系统能够自动检测和分析尿液样本的多种成分浓度,提供快速而准确的检测结果。这种系统的应用不仅能够提升临床诊断的效率,还能够降低误诊率,为医疗人员提供更加可靠的数据支持。

Figure 7. 11-parameter urine reagent strip test

7. 11联尿液试剂条检测

最后,表1则综合了模型在11个指标上的平均精确率、召回率和F1值。这些指标共同衡量了模型的整体性能。精确率反映了模型正确预测正类样本的比例,召回率表示模型捕获到的正类样本的比例,而F1值则是这两者的调和平均数。通过这些指标,研究人员能够全面评估模型的优劣,识别需要改进的部分,以平衡精确率和召回率,确保模型在不同应用场景中的稳定性和可靠性。

Table 1. Comprehensive performance of 11 urinary parameters

1. 尿液11项综合性能

指标

召回率(%)

精确度(%)

F1值(%)

ALB

0.93

0.98

0.95

CRE

0.91

0.92

0.91

BLD

0.91

0.97

0.92

LEU

0.91

0.89

0.90

URO

0.97

0.99

0.97

PRO

0.92

0.91

0.92

PH

0.90

0.91

0.90

KET

0.94

0.92

0.93

BIL

0.95

0.97

0.96

NIT

0.99

0.95

0.97

GLU

0.98

0.97

0.97

5. 结束语

本研究提出了一种基于MLP神经网络的尿液指标分析模型,用于识别和分类不同的尿液指标状态。通过对大量实验数据的验证,该模型在尿液11联试剂条检测中表现优异,各项指标的平均精确率、召回率和F1值均达到90%以上,实验结果表明,该模型成功实现了对尿液样本中多种指标状态的高效识别和分类。

总体而言,基于MLP的尿液指标分析模型为尿液检测提供了一种快速分析工具,具有广泛的临床应用潜力。它不仅能够提高疾病的早期检测率,还能在医疗资源有限的情况下提供高效的诊断支持。未来的研究可以进一步优化模型的结构和参数,结合更多的临床数据,提升模型的泛化能力和预测精度。此外,将此模型集成到便携式设备或云平台中,有望实现实时的尿液监测和远程健康管理,为患者和医护人员提供更加便捷的医疗服务。

参考文献

[1] Piech, T.L. and Wycislo, K.L. (2019) Importance of Urinalysis. Veterinary Clinics of North America: Small Animal Practice, 49, 233-245.
https://doi.org/10.1016/j.cvsm.2018.10.005
[2] Kavuru, V., Vu, T., Karageorge, L., Choudhury, D., Senger, R. and Robertson, J. (2019) Dipstick Analysis of Urine Chemistry: Benefits and Limitations of Dry Chemistry-Based Assays. Postgraduate Medicine, 132, 225-233.
https://doi.org/10.1080/00325481.2019.1679540
[3] 陈芙蕖. 尿液有形成分图像中红白细胞分割和识别算法研究[D]: [硕士学位论文]. 重庆: 重庆邮电大学, 2019.
[4] 刘晓彤. 基于BP神经网络的尿液有形成分识别算法研究[D]: [硕士学位论文]. 重庆: 重庆邮电大学, 2020.
[5] Delashmit, W.H. and Manry, M.T. (2005) Recent Developments in Multilayer Perceptron Neural Networks. Proceedings of the 7th Annual Memphis Area Engineering and Science Conference MAESC 2005, Memphis, February 2005, 1-15.
[6] Popescu, M.C., Balas, V.E., Perescu-Popescu, L., et al. (2009) Multilayer Perceptron and Neural Networks. WSEAS Transactions on Circuits and Systems, 8, 579-588.
[7] Abiodun, O.I., Jantan, A., Omolara, A.E., Dada, K.V., Mohamed, N.A. and Arshad, H. (2018) State-of-the-Art in Artificial Neural Network Applications: A Survey. Heliyon, 4, e00938.
https://doi.org/10.1016/j.heliyon.2018.e00938
[8] Baum, E.B. (1988) On the Capabilities of Multilayer Perceptrons. Journal of Complexity, 4, 193-215.
https://doi.org/10.1016/0885-064x(88)90020-9
[9] 韦岗贺, 欧阳景正. 关于多层感知器的函数逼近能力[J]. 信息与控制, 1996(6): 2-5.
[10] 刘霞, 王迪. 深度ReLU神经网络的万有一致性[J]. 中国科学: 信息科学, 2024, 54(3): 638-652.
[11] 万磊, 佟鑫, 盛明伟, 等. Softmax分类器深度学习图像分类方法应用综述[J]. 导航与控制, 2019, 18(6): 1-9, 47.
[12] Yacouby, R. and Axman, D. (2020). Probabilistic Extension of Precision, Recall, and F1 Score for More Thorough Evaluation of Classification Models. Proceedings of the First Workshop on Evaluation and Comparison of NLP Systems, November 2020, 79-91.
https://doi.org/10.18653/v1/2020.eval4nlp-1.9

Baidu
map