sea Software Engineering and Applications 2325-2286 2325-2278 beplay体育官网网页版等您来挑战! 10.12677/sea.2024.134054 sea-95200 Articles 工程技术 联邦学习在AI图像处理领域的设计与应用
Design and Application of Federated Learning in the Field of AI Image Processing
杨丁宇 周俊豪 朱浩宇 宁波工程学院网络空间安全学院,浙江 宁波 15 08 2024 13 04 516 522 29 5 :2024 20 5 :2024 20 8 :2024 Copyright © 2024 beplay安卓登录 All rights reserved. 2024 This work is licensed under the Creative Commons Attribution International License (CC BY). http://creativecommons.org/licenses/by/4.0/ 在过去十年中,数据量、算法和高性能计算的巨大进步已将人工智能(AI)推向了高效用前沿。尤其是在医学影像和数字病理领域,AI的辅助诊疗系统成为了学术与医疗界共同关注的焦点。然而,随着对隐私保护问题的日益重视、政策法规的完善,数据共享成为亟待解决的问题。联邦学习作为一种“数据不动模型动”的范式,为数据的隐私保护与共享提供了一种新思路。本文提出一种联邦学习框架,在确保医疗影像数据本地化及安全性的同时,充分利用多中心肺炎影像数据集,训练高精度的人工智能模型,辅助肺炎影像诊断。通过本地化模型训练和参数服务器的梯度聚合,在不违反数据隐私的前提下,实现了模型的优化与更新。本研究的成果不仅提高了肺炎诊断的准确性和效率,而且扩大了系统的样本量和数据维度,为医疗大数据应用中高精度模型的构建提供了有力支撑,进而有助于提供更丰富和高质量的医疗服务,为社会公共医疗事业的发展贡献重要价值。
In the past decade, the tremendous advancements in data volume, algorithms, and high-performance computing have propelled artificial intelligence (AI) to the forefront of efficiency. This is especially true in the field of medical imaging and digital pathology, where AI-assisted diagnostic systems have become a focal point of attention in both the academic and medical communities. However, with increasing attention to privacy protection and the perfection of policies and regulations, data sharing has become an urgent issue to address. Federated learning, as a paradigm of “model moving without data moving”, offers a new approach to the privacy protection and data sharing. This paper proposes a federated learning framework that, while ensuring the localization and security of medical imaging data, fully utilizes multi-center pneumonia imaging datasets to train highly accurate AI models to assist in pneumonia image diagnosis. Through localized model training and gradient aggregation on parameter servers, model optimization and updating are achieved without violating data privacy. The outcomes of this study not only improve the accuracy and efficiency of pneumonia diagnosis, but also expand the sample size and data dimensions of the system, providing powerful support for the construction of high-precision models for medical big data applications. This, in turn, helps to provide richer and higher quality medical services, contributing significant value to the development of public medical services.
人工智能,医疗影像,联邦学习,图像处理,隐私保护,肺炎影像
Artificial Intelligence
Medical Imaging Federated Learning Image Processing Privacy Protection Pneumonia Imaging
1. 引言

随着大数据时代的到来和算法优化及计算能力的显著提升,人工智能(AI)技术在诸多领域,特别是在医学图像处理方面 [1] ,已经表现出了显著的优化效率和规模化应用的潜力。在这一领域,联邦学习作为一种新兴的分布式机器学习方法,正逐渐发挥着重要作用。通过联邦学习,多个机构能够在不直接共享患者的医学影像数据 [2] 的情况下,合作训练出高性能的AI模型。这不仅提高了数据利用率,还保护了患者的隐私。近年来,随着深度学习在医学图像分析中的广泛应用,联邦学习作为一种新兴的分布式机器学习方法,展现出了其独特的优势。例如,Guan等人 [3] 在2023年的研究中指出,联邦学习能够有效地在保护患者隐私的前提下,实现医疗数据的共享与模型的协同训练。此外,Hurtado Ramírez和Auñón [4] 在2020年的工作中也强调了联邦学习在处理敏感数据时的安全性和有效性。然而,尽管这些研究为本文提供了理论基础,但本文将更深入地探讨联邦学习在AI图像处理中的具体应用,尤其是在医疗影像领域的创新实践。

本文提出的联邦学习框架,不仅解决了隐私与数据利用的矛盾,还引入了多项创新技术。例如,我们采用了一种新型的梯度压缩算法,显著减少了模型更新过程中的数据传输量。此外,我们还应用了一种自适应学习率调整机制 [3] ,根据每个客户端的数据特性动态调整学习率,进一步提升了模型训练的效率和准确性。作为一种“数据本地,模型全局”的学习范式 [4] ,联邦学习允许多个数据持有者在不共享其敏感数据的前提下共同进行机器学习任务。本文提出的框架应用于医疗影像领域,旨在保护患者个人隐私的同时,实现多个医疗中心的肺炎影像数据集的高效利用。通过在各个参与机构本地训练AI模型,并将更新的模型参数发送到中央服务器进行集成,我们的系统不仅保证了模型性能,同时也符合了数据隐私法规,比如通用数据保护条例(GDPR)。本文的研究成果不仅显著提高了肺炎影像诊断的准确性和效率,而且通过扩大样本量和增强数据维度,为开发更高精度的医疗AI模型奠定了坚实的基础。

2. 联邦学习 2.1. 联邦学习的工作原理

在医疗影像AI领域,联邦学习提供了一个允许多个医疗机构在不共享敏感患者数据的情况下,同步或异步地更新及共享机器学习模型进度的机制。在FL系统中,每个参与单位,如医院或研究中心,都在自己的数据集上独立训练本地模型。训练完成后,参与者不直接交换患者数据,而是向中央服务器发送包含权重和偏差参数变化的模型更新信息(如梯度信息)。服务器聚合这些更新以提高全局模型的性能。在FL框架中,中央服务器扮演着至关重要的角色,它负责聚合来自多个参与者的模型更新,从而生成全局模型的新版本。这一新版本随后被分发给所有的参与者,以便他们在下一轮迭代中使用。这个循环过程持续进行,直到全局模型的性能达到预定目标或满足了预设的停止条件。这种分布式的训练方法的核心优势在于,它通过将计算任务分散给各个数据持有者执行,从而避免了对敏感数据的集中存储和处理,提升了数据隐私保护的水平。

2.2. 联邦学习系统设计在医疗影像中的应用

在设计针对医疗影像分析的联邦学习系统时,必须仔细考虑数据的异质性和分布的不平衡问题。例如,不同医疗机构可能使用不同厂商的扫描设备,导致医疗影像在质量和格式上存在差异。联邦学习系统通过让各个客户端在本地数据上训练模型的方法来克服这些困难,从而无需机构之间直接共享数据。这不仅促进了数据和模型多样性的融合,而且通过在不同的数据集上合作学习,增强了整个系统的泛化能力。

2.3. 联邦学习为医疗影像AI带来的优势

FL为医疗影像AI系统带来了多项优势。首先,它大幅减少了对大量标注数据的需求。这是因为该系统能从各个参与机构中学习并融合不同的特征,从而增强了其对未知数据预测的能力。其次,由于模型训练是分布式的,单个节点的故障不会影响整个网络,增加了系统的鲁棒性。最后,联邦学习的可扩展性确保了系统即便在数据量激增的情况下也能有效地进行扩展。这意味着即使对于数据稀少的罕见病症,通过跨机构的合作也能实现有效的诊断。

3. 论联邦学习系统的设计与应用 3.1. 系统设计

在客户端开发中,本文主要使用Python语言,以充分利用其丰富的库和框架生态系统。核心的FL功能通过FATE框架实现。该框架专为分布式场景设计,能够安全地处理敏感数据,并在本地进行机器学习模型训练,而无需共享患者的原始医疗影像数据 [5] 。针对影像数据的高维性和复杂性,FATE框架的最新优化包括针对高维数据特征的选择和独热编码的效能提升。这些改进显著加快了处理速度,对于大规模医疗影像数据尤为重要。

系统中数据处理由NumPy和Pandas实现。SQLite数据库用于有效管理与快速存取客户端的结构化数据,如患者信息和处理结果。FATE框架的Spark本地计算引擎和Hive存储支持为系统提供了灵活的大数据处理能力,使得在资源受限的客户端设备上也能高效进行计算。为了进一步优化模型训练过程,我们采用了一种新型的梯度压缩算法,该算法通过减少模型更新过程中的数据传输量,显著降低了通信开销。这一技术特别适用于医疗影像数据,因为这些数据通常具有高维度和大体积,压缩算法能有效减少传输时间,同时保持模型更新的质量。同时,我们结合每个客户端的数据特性,实现了一种自适应学习率调整机制。该机制根据本地数据的分布动态调整学习率,进一步提升了模型训练的效率和准确性。采用的数据处理安全协议,为处理敏感医疗数据提供了额外的安全保障。

在模型的可移植性方面,FATE框架支持将训练好的模型转换为其他流行框架,如sklearn和TensorFlow Keras,进一步增强了本文系统模型的可部署性。此外,新引入的特征插补模块和标签转换模块为医疗影像数据的预处理提供了额外支持,增强了模型训练的稳健性。网络通信层是系统安全稳定运行的关键,本文通过SSL/TLS协议保障了数据传输的安全性。

中央服务器作为系统的枢纽,承担着聚合和分发模型更新的任务。在此环节,选择Flask和Django框架构建了灵活的Web服务,并且保持了与客户端使用相同的机器学习框架,以便无缝地整合来自不同客户端的模型更新。除了引入OpenSSL库进行数据加密外,还采用差分隐私策略,以保护用户数据在联邦学习过程中的隐私。在测试和维护方面,使用Docker容器化技术以实现系统的快速部署和稳定运行。

通过采用SSL/TLS等安全通信协议,客户端安全地将其计算所得的模型更新发送至中央服务器。而后,中央服务器运用差分隐私技术处理这些更新,以生成一个更为准确且具备更好泛化能力的全局模型。此模型随后被分发回客户端,并可被上传至Web服务器,供进一步应用。整体架构如 图1 所示。

Figure 1. Federated learning system architecture--图1. 联邦学习系统架构--

系统的架构与工作机制如下所述:

客户端的设计与计算能力:每个客户端配备了所需的计算资源及一个私有的图像数据库。数据库的多样性有助于提高全局模型的泛化能力。客户端在隐私保护的环境中使用本地数据训练模型,生成模型参数或梯度更新。该设计可减少数据传输量,同时遵循了数据最小化原则和隐私保护的相关法规,如GDPR。

安全通信协议的运用:模型更新通过基于SSH协议的安全通信通道进行传输,确保数据加密及身份验证的安全性。此外,通过在客户端与服务器之间建立SSL/TLS加密通信连接,避免中间人攻击,保证数据传输过程中的完整性和保密性。

中央服务器的聚合作用及隐私保护措施:中央服务器负责聚合众多客户端提供的模型更新,从而改善全局模型的性能。应用差分隐私技术来保护参与模型训练的个人数据安全,即通过在聚合数据或模型更新中添加随机噪声(Abadi等, 2016) [6] 即使在模型参数公布之后,个人数据的推断也变得非常困难,从而在数学上保障用户隐私。

模型的分发与Web服务器的使用:用差分隐私策略得到的全局模型被重新分发至所有参与客户端,以便客户端进一步优化本地模型或用于任务推断。同时,为提升模型的可访问性和应用性,全局模型被上传至Web服务器。用户可通过Web界面访问模型,或将其集成到其他应用程序中,实现模型的远程访问和更新,增强了系统的灵活性和可扩展性。

本文设计了一个处理图像的联邦学习系统,其工作流程如 图2 所示:首先,每个客户端会收集并预处理本地图像数据,包括裁剪和调整大小等步骤。然后,客户端在这些私有数据上独立进行模型训练。训练完成后,客户端将模型参数或梯度更新进行压缩。并且将模型更新上传到中央服务器。中央服务器将各客户端提供的模型更新进行整合,这一过程称为全局聚合。聚合后的模型更新随后被分发给所有客户端。各客户端接收这些更新并同步至其本地模型,从而完成一个联邦学习迭代流程。在联邦学习迭代流程中,我们采用了增量传输技术,客户端仅上传自上次更新以来模型参数的变化量,而非整个模型。这一技术进一步降低了带宽需求,加快了更新速度。该策略既确保了数据的隐私性,又提升了学习模型的整体性能。同时,我们Web端添加实现了一个实时监控系统,对模型性能进行持续评估,并根据性能反馈动态调整模型训练和更新策略。这一流程确保了模型在整个训练周期内保持最佳状态。

Figure 2. Federated learning system process--图2. 联邦学习系统流程--
3.2. 系统实验

实施联邦学习框架后,本文在多个医疗机构客户端上进行了广泛的实验,旨在评估该模型在处理肺炎影像数据的有效性。每家参与的医疗机构都贡献了具有特征的肺结节数据集。利用FATE框架,实验构建了一个包含800张CT图像的数据集,其中400张呈现肺结节特征,而另外400张则未呈现。将数据集不均匀随机划分给不同集群。实验的配置包括将数据集主要分为两部分:标有肺结节的图像由客户端(guest)持有,而不标肺结节特征的图像由主机方(ost)持有,以模拟现实世界中数据分布的情况。

为了全面评估联邦学习模型的性能,我们进行了详尽的实验分析。实验结果表明,联邦学习模型在准确率、召回率和F1分数等关键性能指标上均优于传统的集中式学习方法。具体来说,在肺结节识别任务中,联邦学习模型的准确率达到了90%,比集中式学习方法高出5%。此外,我们还对比了不同正则化强度下模型的性能,发现适当的正则化能够进一步提高模型的泛化能力。如 图3 所示,横坐标是正则强化度,纵坐标是准确率,在肺结节医疗影像识别上,本模型在准确率上的得分到达0.90,这一结果强调了联邦学习模型在处理数据时的高性能。

Figure 3. Training accuracy rate for lung nodule image classification--图3. 训练肺结节图像分类准确率-- Figure 4. ROC curve--图4. ROC曲线--

图4 展示了我们联邦学习逻辑回归模型在肺结节分类任务上的ROC曲线。从图中可以观察到,随着FPR的增加,TPR相应地提高,表明模型在不同误判成本下的性能变化。我们的模型在训练集上得到的AUC值为0.85,这表明模型具有良好的分类性能和泛化能力。这一结果进一步验证了联邦学习在医疗影像分析领域的应用潜力,尤其是在处理敏感数据和保护隐私方面的优势。

此外,实验还发现,模型训练的通讯效率得到了提高。通过采用异步更新机制和差分隐私技术,设计的联邦学习系统在不牺牲准确性的前提下,成功减少了通讯轮数和延迟。原始系统在没有优化的情况下,完成训练需要进行500轮通讯。经过优化后,系统只需要进行300轮通讯即可达到类似的模型性能。在没有进行优化的系统中,训练过程中的带宽使用率峰值是85%。优化后,即使在参与者数量增多的情况下,带宽使用率峰值降低到了70%。这一实验结果表明,即便在网络带宽受限或参与者众多的情况下,该系统也能保持高效运行。

综上所述,本文的实验结果不仅证实了联邦学习在医疗影像分析领域的应用潜力,还展示了其在实际应用中的高效性和可行性。

4. 结论

本文成功展示了联邦学习技术在医疗影像分析领域的应用,特别是在处理包含敏感数据的环境中如何有效保护数据隐私的同时,提升医疗诊断的准确性和效率。通过在本地训练模型并仅共享模型的更新,即梯度信息,联邦学习允许多个医疗机构在不直接交换患者数据的情况下共同改善一个全局模型 [6] 。通过异步更新机制和差分隐私技术,我们的系统在减少通讯轮数和延迟的同时,保持了模型的准确性,显示出良好的鲁棒性和可扩展性。本文引入的新型梯度压缩算法和自适应学习率调整机制,有效减少了模型更新过程中的数据传输量,提高了训练效率,这是对现有联邦学习技术的显著改进。此外,通过将全局模型上传到Web服务器,提高了模型的可访问性和实用性,允许用户通过Web界面进行远程访问和更新,增加了系统的灵活性和可扩展性。本文的研究不仅为医疗影像分析领域提供了新的视角和工具,也为数据隐私保护和人工智能技术的结合提供了实证支持。

基金项目

浙江省大学生科技创新活动计划暨新苗人才计划项目(2023R482)。

References 刘再毅, 石镇维, 梁长虹. 推进联邦学习技术在医学影像人工智能中的应用[J]. 中华医学杂志, 2022, 102(5): 318-320. 倪炯, 王培军. 医学影像人工智能的现状与未来[J]. 中华医学杂志, 2021, 101(7): 455-457. Guan, H., Yap, P., Bozoki, A. and Liu, M. (2024) Federated Learning for Medical Image Analysis: A Survey. Pattern Recognition, 151, Article ID: 110424. >https://doi.org/10.1016/j.patcog.2024.110424 Hurtado Ramírez, D. and Auñón, J.M. (2020) Privacy Preserving K-Means Clustering: A Secure Multi-Party Computation Approach. arXiv: 2009.10453. >https://arxiv.org/abs/2009.10453 肖宏旺, 黄文灏, 叶启威, 等. 一种基于联邦学习构建医学影像大模型的方法和装置[P]. 中国专利, 202211038862.4. 2022-11-29. Abadi, M., et al. (2016) Deep Learning with Differential Privacy. Proceedings of the 23rd ACM Conference on Computer and Communications Security (CCS 2016), Vienna, 24-28 October 2016, 308-318. >https://doi.org/10.1145/2976749.2978318
Baidu
map