协作机器学习中的非预期特征泄露研究开题报告

 2021-11-23 21:10:28

1. 研究目的与意义(文献综述)

人工智能在生活中越来越普及,给人类带来了极大的便利,也给科技带来了很大的提升。尤其是近年来,随着机器学习这一行业的蓬勃发展,生活中的相关应用越来越多。不幸的是,机器学习系统也面临着许多安全隐患,为了数据的安全,协同机器学习被引入,相比一般的机器学习,其避免了将数据存储在云中再进行机器学习,具有更高的安全性,但是近几年的研究表明,其依然存在数据隐私泄露的可能性。

协作机器学习(collaborative learning)最近成为传统机器学习方法的替代方法,所有的训练数据汇集在一起,模型在这个联合池中进行训练。它允许两个或多个参与者,每个人都有自己的训练数据集,来构建一个联合模型。每个参与者根据自己的数据训练一个局部模型,并定期与其他参与者交换模型参数、更新这些参数或部分构建模型。已经提出了几种用于分布式、协作和联合学习的体系结构:有和没有中央服务器,有不同的模型聚合方式,等等。主要目标是提高训练速度和减少开销,但保护参与者训练数据的隐私也是最近提出的几种技术的重要动机。由于训练数据从不离开参与者的机器,协作学习可能很适合于这些数据敏感的场景(例如,医疗记录、私人图像、个人身份信息等)。引人注目的应用包括对智能手机的字符序列进行预测键盘训练,或利用多家医院的数据来开发患者生存和医疗副作用的预测模型。

协同机器学习和相关技术,如联邦学习(federatedlearning),在2016年被google率先提出,包括了横向联邦学习和纵向联邦学习,它允许多个参与者,每个人都有自己的训练数据集,通过局部训练和定期交换模型更新来建立一个联合模型。本文证明这些更新会泄漏参与者训练数据的非预期信息,并开发被动和主动的推理攻击来利用这种泄漏。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

[1] 学习机器学习的基本知识,以及联邦学习模型。

[2] 学习并掌握基本的数据处理相关的python编程方法。

[3] 设计实现基于python语言的类推断攻击、成员推断攻击、属性推断攻击,并利用相应算法测试。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

1)第1-3周 完成题目调研,完成文献阅读,进行相关资料的收集,完成文献综述以及开题报告撰写;

2)第4-5周 学习卷积神经网络和联邦学习,完成论文开题;

3)第6-12周 完成模型的训练和测试,撰写论文初稿;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1] 何英哲,胡兴波,何锦雯,孟国柱,陈恺.机器学习系统的隐私和安全问题综述[j].计算机研究与发展,2019,(10):1-22.

[2]宋明成.机器学习隐私的安全隐患[j].计算机与网络,2018,44(16):55.

[3]刘睿瑄,陈红,郭若杨,赵丹,梁文娟,李翠平.机器学习中的隐私攻击与防御[j].软件学报,,:1-26.

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。