前言:本文介绍关于AIGC生成阶段针对不同溯源场景的几篇相关工作。
相关文章:针对文生图模型的AIGC检测论文研读,参见此篇文章。
如下图所示,在AIGC生成阶段,有4种溯源场景:
1)生成模型溯源训练数据
2)微调模型溯源预训练模型
3)AIGC溯源训练数据/训练概念
4)AIGC溯源生成模型
下面分别对不同溯源场景下的相关工作进行介绍。
目录
Detection and Attribtion of Models Trained on Generated Data. ICASSP, 2024. Matching Pairs: Attributing Fine-Tuned Models to their Pre-Trained Large Language Models. ACL, 2023. Evaluating Data Attribution for Text-to-Image Models. ICCV, 2023. 数据集构建 特征提取器训练 ProMark: Proactive Diffusion Watermarking for Causal Attribution. CVPR, 2024. DE-FAKE: Detection and Attribution of Fake Images Generated by Text-to-Image Generation Models, CCS, 2023.Detection and Attribtion of Models Trained on Generated Data. ICASSP, 2024.
Scenario: 生成模型溯源训练数据
RQ1:模型的训练数据为 real data / fake data?
RQ2:若模型的训练数据为 fake data,则由哪个 GAN 生成?
目标:判断 target model 的训练数据来源
核心思想:
Real dataset 分成:training data, probing dataset,testing data.
若为溯源问题,则对于步骤3:
Closed-World Attribution:binary dataset 改成多标签分类问题 Open-World Attribution:probing set 改为GAN生成数据,若probe image 和 model 训练使用的GAN数据来源一致,则标签为 1。Matching Pairs: Attributing Fine-Tuned Models to their Pre-Trained Large Language Models. ACL, 2023.
Scenario: 微调模型溯源预训练模型
Code: https://github.com/IBM/model-attribution-in-machine-learning
核心思想:通过联合微调模型与预训练模型生成结果与提示词的特征,训练分类器,采用集成学习的方式确定微调模型对应的预训练模型。
Evaluating Data Attribution for Text-to-Image Models. ICCV, 2023.
Page: https://github.com/peterwang512/GenDataAttribution
Scenario: AIGC 溯源训练数据
核心思想:首先构建具有对应关系的溯源数据集,然后使用对比学习的方式,优化特征提取器。
数据集构建
特征提取器训练
特征提取器训练的目标是:使得具有对应关系的合成图像+范本图像距离更近,而无对应关系的合成图像+范本图像距离更远。具体使用对比学习损失来进行训练。
ProMark: Proactive Diffusion Watermarking for Causal Attribution. CVPR, 2024.
Scenario: AIGC 溯源训练概念(概念水印)
核心思想:使用水印嵌入的方式,实现概念水印的嵌入和提取。
DE-FAKE: Detection and Attribution of Fake Images Generated by Text-to-Image Generation Models, CCS, 2023.
Scenario: AIGC 溯源生成模型
核心思想:训练二/多分类器,溯源生成模型。
(1)Image-Only: image 特征提取,后训练(ResNet-18)
(2)Hybrid: image 和 prompt 的特征联合提取拼接,后训练(CLIP+MLP)
参考文献
Han G, Salem A, Li Z, et al. Detection and Attribution of Models Trained on Generated Data. ICASSP, 2024. Foley M, Rawat A, Lee T, et al. Matching Pairs: Attributing Fine-Tuned Models to their Pre-Trained Large Language Models. ACL, 2023. Wang S Y, Efros A A, Zhu J Y, et al. Evaluating data attribution for text-to-image models. ICCV, 2023. Asnani V, Collomosse J, Bui T, et al. ProMark: Proactive Diffusion Watermarking for Causal Attribution. CVPR, 2024. Sha Z, Li Z, Yu N, et al. De-fake: Detection and attribution of fake images generated by text-to-image generation models. CCS, 2023.