基于主特征归因的对抗样本生成方法研究

王硕, 徐茹枝,关志涛

Acta Electronica Sinica 전자학보（2023）

引用 0|浏览0

暂无评分

摘要

为提高对抗训练的样本质量，本文对深度学习模型内部的特征识别过程进行了探究，并提出了一种基于主特征归因的迁移性对抗样本生成方法.算法在提取样本的主要特征后对目标层神经元进行特征归因，并利用独立性假设简化梯度计算，通过抑制积极神经元的识别作用，更加高效地得到更具迁移性的对抗样本.经过大量实验验证，相比于已有方法，在针对多模型的攻击中，本文算法的攻击成功率提高了5%以上，为后续研究如何提高模型的鲁棒性奠定了基础.

AI 理解论文

溯源树

样例

生成溯源树，研究论文发展脉络

Chat Paper

正在生成论文摘要