%0 Journal Article %A 方晨 %A 郭渊博 %A 王娜 %A 甄帅辉 %A 唐国栋 %T 基于生成对抗网络的差分隐私数据发布方法 %D 2020 %R 10.3969/j.issn.0372-2112.2020.10.016 %J 电子学报 %P 1983-1992 %V 48 %N 10 %X 机器学习的飞速发展使其成为数据挖掘领域最有效的工具之一,但算法的训练过程往往需要大量的用户数据,给用户带来了极大的隐私泄漏风险.由于数据统计特征的复杂性及语义丰富性,传统隐私数据发布方法往往需要对原始数据进行过度清洗,导致数据可用性低而难以再适用于数据挖掘任务.为此,提出了一种基于生成对抗网络(Generative Adversarial Network,GAN)的差分隐私数据发布方法,通过在GAN模型训练的梯度上添加精心设计的噪声来实现差分隐私,确保GAN可无限量生成符合源数据统计特性且不泄露隐私的合成数据.针对现有同类方法合成数据质量低、模型收敛缓慢等问题,设计多种优化策略来灵活调整隐私预算分配并减小总体噪声规模,同时从理论上证明了合成数据严格满足差分隐私特性.在公开数据集上与现有方法进行实验对比,结果表明本方法能够更高效地生成质量更高的隐私保护数据,适用于多种数据分析任务. %U https://www.ejournal.org.cn/CN/10.3969/j.issn.0372-2112.2020.10.016