Poisoning Web-Scale Training Datasets is Practical.

Nicholas Carlini,Matthew Jagielski,Christopher A. Choquette-Choo,Daniel Paleka,Will Pearce,Hyrum Anderson,Andreas Terzis,Kurt Thomas,Florian Tramer

45TH IEEE SYMPOSIUM ON SECURITY AND PRIVACY, SP 2024（2024）

Cited 236|Views152

Key words

Training Dataset,Deep Learning Models,Popular Datasets,Bilingual,Precision And Recall,Current Dataset,Language Model,Future Time,Distribution Of Dataset,Auxiliary Data,Time Ti,Domain Name,Threat Model,True Time,Web Content,Multimodal Dataset,Web Crawler,Fraction Images,Cryptographic Hash,English Wikipedia,Integrity Checking,Checkpointing,Wikipedia Articles,Content Moderation,Caption Text,English Dataset,Sustainable Control,Attack Scenarios,Training Set

AI Read Science

Must-Reading Tree

Example

Generate MRT to find the research sequence of this paper

Chat Paper

Summary is being generated by the instructions you defined