人工重写 - AIGC资讯

当前位置：AIGC资讯 > 人工重写

OpenAI安全系统负责人长文梳理：大模型的对抗攻击与防御

随着 ChatGPT 的发布，大型语言模型应用正在加速大范围铺开。OpenAI 的安全系统团队已经投入了大量资源，研究如何在对齐过程中为模型构建默认的安全行为。但是，对抗攻击或 prompt 越狱依然有可能让模型输出我们不期望看到的内容。目前在对抗攻击...

生成式AI 2023-11-20 人工智能
1154阅读

第一页 1 没有了