面向机器学习模型安全的测试与修复

面向机器学习模型安全的测试与修复

张笑宇, 沈超, 蔺琛皓, 李前, 王骞, 李琦, 管晓宏

The Testing and Repairing Methods for Machine Learning Model Security

ZHANG Xiao-yu, SHEN Chao, LIN Chen-hao, LI Qian, WANG Qian, LI Qi, GUAN Xiao-hong

表2 机器学习模型安全测试属性总结

测试属性	测试阶段	特性描述
正确性	数据、算法、实现	模型正确行使功能并完成任务的能力
鲁棒性	数据	模型在输入干扰下正确运行的能力
公平性	数据、算法	模型不受敏感输入属性的影响的能力
效率	实现	模型执行完成指定任务的开销
可解释性	算法	模型的决策可以被观察者理解的能力
隐私性	数据、算法	模型保护相关私密数据的能力