Health Data Science《健康数据科学(英文)》近期发表的一项研究首次比较了工程与统计领域的联邦学习(FL)算法,旨在更好地保护医疗数据隐私。研究发现,统计型FL算法能减少模型参数偏差,而工程型FL算法在预测性能上表现更优。通过模拟数据和真实急诊科数据,本研究为医疗数据隐私保护提供了指导,并建议将这些算法应用于更广泛的医疗合作中。
作|者|团|队|介|绍
Siqi Li
PhD Candidate
Duke-NUS Medical School, National University of Singapore
Di Miao
Senior Research Assistant
Duke-NUS Medical School, National University of Singapore
Nan Liu
Associate Professor
Duke-NUS Medical School, National University of Singapore
流程图:展示了应用联邦学习(FL)算法于临床结构化数据的选择标准。
随着隐私保护法规日益严格,特别是在医疗数据领域,如何在不违反隐私规定的情况下开展跨机构合作成为了关键挑战。联邦学习(Federated Learning, FL)作为一种新兴的机器学习算法,为各机构(如医院)提供了一种在不共享数据的前提下协同解决建模问题的有效途径。
尽管FL术语由工程学界在2016年提出,但早在此之前,统计学领域就已开始研究隐私保护算法。然而,这些算法通常使用不同的术语和关键词,因此未被广泛认知。我们的研究首次系统性比较了工程领域和统计领域的七种FL算法,旨在为未来相关医学研究提供更全面的指导。
本研究结合使用了模拟数据和真实急诊科数据,评估了FL算法在逻辑回归和Lasso回归中的表现。结果显示,统计型FL算法能有效减少模型参数的偏差,而工程型FL算法则在预测性能上更具优势。尤其在非独立同分布数据的情况下,工程型FL算法模型有时能取得优于中心模型(将所有数据汇集在一起训练)、统计型FL算法模型和本地模型的预测表现。
这些发现突显了两类算法各自的优缺点,并为未来研究人员选择合适的FL算法提供了宝贵的参考。本研究不仅展示了两类FL算法的实际应用价值,还强调了在隐私保护需求日益增加的当今医疗领域,合理应用FL算法的重要性。展望未来,FL算法有望成为推进医疗数据科学合作的关键工具,为解决复杂的公共卫生问题提供全新的思路和视角。
文字内容与图片来源:Health Data Science零距离
Health Data Science|推动医疗数据隐私保护的新前沿:工程和统计两类算法在结构化数据分析中的基准比较
公司动态
——
促进医学科研创新,打造绿色医疗新生态
版权@ 2024 瀚新智护保留所有权利
网站备案许可证号皖ICP备2023027090号-1
联系我们
CONTACT US
公司地址:中国(合肥)国际智能语音产业园创意孵化楼二层203室
联系邮箱 :info@hansintek.com