面向机器学习模型安全的测试与修复
张笑宇, 沈超, 蔺琛皓, 李前, 王骞, 李琦, 管晓宏
The Testing and Repairing Methods for Machine Learning Model Security
ZHANG Xiao-yu, SHEN Chao, LIN Chen-hao, LI Qian, WANG Qian, LI Qi, GUAN Xiao-hong
表2
机器学习模型安全测试属性总结
测试属性
测试阶段
特性描述
正确性
数据、算法、实现
模型正确行使功能并完成任务的能力
鲁棒性
数据
模型在输入干扰下正确运行的能力
公平性
数据、算法
模型不受敏感输入属性的影响的能力
效率
实现
模型执行完成指定任务的开销
可解释性
算法
模型的决策可以被观察者理解的能力
隐私性
数据、算法
模型保护相关私密数据的能力