基于主特征归因的对抗样本生成方法研究

王硕, 徐茹枝,关志涛

Acta Electronica Sinica 전자학보(2023)

引用 0|浏览0
暂无评分
摘要
为提高对抗训练的样本质量,本文对深度学习模型内部的特征识别过程进行了探究,并提出了一种基于主特征归因的迁移性对抗样本生成方法.算法在提取样本的主要特征后对目标层神经元进行特征归因,并利用独立性假设简化梯度计算,通过抑制积极神经元的识别作用,更加高效地得到更具迁移性的对抗样本.经过大量实验验证,相比于已有方法,在针对多模型的攻击中,本文算法的攻击成功率提高了5%以上,为后续研究如何提高模型的鲁棒性奠定了基础.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要