电子学报 ›› 2020, Vol. 48 ›› Issue (12): 2297-2303.DOI: 10.3969/j.issn.0372-2112.2020.12.002

• 学术论文 • 上一篇    下一篇

MCDP:基于神经网络的多集群分布式差分隐私数据发布方法

陈思1,2, 付安民1, 柯海峰1, 苏铓1, 孙怀江1   

  1. 1. 南京理工大学计算机科学与工程学院, 江苏南京 210094;
    2. 南京理工大学信息化建设与管理处, 江苏南京 210094
  • 收稿日期:2019-09-23 修回日期:2019-12-15 出版日期:2020-12-25 发布日期:2020-12-25
  • 通讯作者: 付安民
  • 作者简介:陈思 女,1987年生于湖北襄阳.现为南京理工大学计算机科学与工程学院博士研究生.主要研究方向为大数据隐私保护.E-mail:chensi@njust.edu.cn;柯海峰 男,1993年生于湖北鄂州.南京理工大学计算机科学与工程学院硕士研究生.主要研究方向为隐私保护.E-mail:14700533@qq.com;苏铓 女,1987年生于内蒙古翁牛特旗.现为南京理工大学计算机科学与工程学院副教授.主要研究方向为云安全、访问控制与权限管理.E-mail:sumang@njust.edu.cn;孙怀江 男,1968年生于陕西西安.现为南京理工大学计算机科学与工程学院教授、博士生导师.主要研究方向为神经网络与机器学习.E-mail:sunhuaijiang@njust.edu.cn
  • 基金资助:
    国家自然科学基金(No.61572255,No.61702266);江苏省"六大人才高峰"高层次人才基金资助项目(No.XYDXXJS-032);赛尔网络下一代互联网技术创新项目(No.NGII20190804,No.NGII20150117)

MCDP:Multi-Cluster Differential Privacy Data Publishing Method Based on Neural Network

CHEN Si1,2, FU An-min1, KE Hai-feng1, SU Mang1, SUN Huai-jiang1   

  1. 1. School of Computer Science and Engineering, Nanjing University of Science and Technology, Nanjing, Jiangsu 210094, China;
    2. Division of Information Construction and Management, Nanjing University of Science and Technology, Nanjing, Jiangsu 210094, China
  • Received:2019-09-23 Revised:2019-12-15 Online:2020-12-25 Published:2020-12-25

摘要: 大数据应用能够为人们的生活和工作方式提供便捷,但包含消费记录、社交关系、地理位置等个人隐私信息的数据在发布过程中可能被服务提供商收集,用户隐私面临巨大威胁.本文首次提出了一个基于神经网络的多集群分布式差分隐私数据发布方法,能够显著缓解单服务器的数据处理压力.同时,利用神经网络算法进行隐私参数预测明显提高了预测精度和预测效率,并且集群之间不同的隐私参数也保证了方案的灵活性.此外,由于中心服务器存储的是经过差分隐私处理后的统计数据,即使中心服务器由于遭受攻击导致存储的数据泄露,也能确保用户数据隐私.实验对比分析表明,我们的方法在隐私处理效率、隐私保护强度、预测精度和预测效率等方面都有明显优势.

关键词: 数据发布, 差分隐私, 服务协同, 神经网络, 多集群, 分布式

Abstract: Big data applications provide convenience for people's life and work style,but in the process of data publishing,personal privacy information,such as consumption records,social relations,and so on,are collected by service providers all the time,and users' privacy is threatened greatly.Aiming at the significant relief of data processing pressure on single server,we propose a multi-cluster distributed differential privacy data publishing method based on neural network(MCDP),which effectively improves the prediction accuracy and efficiency,and different privacy parameters between clusters guarantee the flexibility of the protocol.Especially,because the central server stores statistical data after differential privacy processing,it does not collect individual privacy data,even if the central server is attacked,the user data will not be leaked.Experiments show that MCDP has obvious advantages in privacy processing efficiency,privacy protection intensity,prediction accuracy and prediction efficiency.

Key words: data publishing, differential privacy, service collaboration, neural network, multi-cluster, distribution

中图分类号: