OpenAI 打造媒体管理工具，让内容创作者可以选择退出 AI 训练

人工智能公司 OpenAI 近日表示，他们正在研发一款名为媒体管理（Media Manager）的工具，旨在让内容创作者更好地控制其作品在生成式人工智能训练中的使用。这一工具将允许创作者和内容所有者向 OpenAI 确认其作品，并指定希望这些作品是否包含在 AI 研究和训练中。

Open 计划在2025年前推出该工具，与创作者、内容所有者和监管机构合作制定标准，可能通过其最近加入的行业指导委员会实现。OpenAI 在一篇博客文章中写道:“这将需要前沿的机器学习研究，构建首个帮助我们在多个来源中识别受版权保护的文本、图像、音频和视频，并反映创作者偏好的工具。” 他们还计划逐步推出更多选择和功能。

媒体管理工具似乎是 OpenAI 对其开发 AI 方式日益增长的批评的回应，后者主要依赖于从网络上公开获取的数据。最近，包括芝加哥论坛报在内的家知名美国报纸以侵犯知识产权为由起诉 OpenAI，指控 OpenAI 窃取文章用于训练生成 AI 模型，并在未经报纸许可的情况下将其商业化。生成式 AI 模型（包括 OpenAI 的）通常在大量的例子上进行训练，这些例子通常来自公共网站和数据集。OpenAI 和其他生成式 AI 供应商认为，公平使用这一法律原则使他们有权从公共数据中获取并用于模型训练。但并非所有人都同意这一观点。

为了安抚批评并在未来应对诉讼，OpenAI 已经采取了措施，以在知识产权问题上与内容创作者妥协。去年，OpenAI 允许艺术家 “选择退出”，从而删除他们不希望被用于 OpenAI 图像生成模型训练的作品。公司还允许网站所有者通过 robots.txt 标准表示其网站上的内容是否可以被 AI 模型训练所使用。

此外，OpenAI 继续与大型内容所有者签订许可协议。然而，一些内容创作者表示 OpenAI 的举措还不。艺术家们认为 OpenAI 针对图像的选择退出流程繁琐，而且据称 OpenAI 支付的授权费相对较。另外，OpenAI 自己在周二的博客文章中承认，公司目前的解决方案未能解决创作者作在他们无法控制的平台上被引用、混音或重新发布的情况。

除了 OpenAI 之外，一些第三正试图构建通用的溯源和选择退出工具，以应对生成式 AI 模型训练中的知识产权问题其中包括 Spawning AI，该公司提供了一款应用，可以识别和跟踪机器人的 IP 地址以阻止数据抓取试，并提供一个数据库，供艺术家注册其作品，以禁止供应商使用这些作品进行训练。Steg 和 Imatag 帮助创作者通过应用肉眼无法察觉的水印来确立对其图像的所有权。另外，芝哥大学的 Nightshade 项目则通过 “毒害” 图像数据，使其对 AI 模型训练无效或具有破坏性。