数据奖励 - AIGC资讯

当前位置：AIGC资讯 > 数据奖励

深挖RLHF潜力，复旦语言和视觉团队创新奖励模型优化，让大模型更对齐

继第一份大模型对齐技术报告（Secrets of RLHF in Large Language Models Part I）获 NeurIPS 2023 workshop best paper 后，第二份报告强势归来，复旦语言和视觉团队联合推出的第二...

大数据 2024-01-15 人工智能
901阅读

第一页 1 没有了