指令跟随第2页 - AIGC资讯

深度求索开源DeepSeek LLM 67B大模型无需申请免费商用

深度求索发布了一个67B 的大模型，名为 DeepSeek LLM67B。这个模型完全开源，可以通过访问 chat.deepseek.com 来使用。 DeepSeek LLM67B 在公开评测榜单上表现良好，特别是在推理、数学和编程能力方面。DeepS...

大数据 2023-11-30 人工智能

913阅读

加州大学伯克利分校的研究人员推出了一款名为Starling-7B的开放式大型语言模型（LLM），采用了一种称为Reinforcement Learning from AI Feedback(RLAIF 的创新训练方法。 RLAIF的独特之处在于利用其他人...

大数据 2023-11-29 人工智能

862阅读

前几天，Meta 发布了 LIMA 大模型，在LLaMA-65B的基础上，无需使用 RLHF，只用了 1000 个精心准备的样本数据进行微调，就达到了和 GPT-4 相媲美的程度。这激发了我探索 LLaMA 65B 大模型的兴趣。之前的一系列大模型相...

生成式AI 2023-11-27 人工智能

904阅读

LLMs之Code：Code Llama的简介(衍生模型如Phind-CodeLlama/WizardCoder 、安装、使用方法之详细攻略导读：2023年08月25日(北京时间，Meta发布了Code Llama，一个可以使用文本提示生成...

生成式AI 2023-11-10 人工智能

1984阅读

11月7日凌晨2点，人工智能初创公司 OpenAI 举办首届 DevDay 开发者大会，其首席执行官山姆•阿尔特曼（Sam Altman）宣布了GPT-4、ChatGPT等AI平台的一系列增强功能与定价变化。这些变化有望使OpenAI的技术更加强大、灵活...

人工智能 2023-11-09 人工智能

847阅读

还在用指令微调解决多模态大模型的“幻觉”问题吗？比如下图中模型将橙色柯基错认为“红狗”，还指出周围还有几条。图片现在，中科大的一项研究想到了一个全新办法：一个免重训、即插即用的通用架构，直接从模型给出的错误文本下手，“倒推”出可能出现“幻觉”之处...

人工智能 2023-10-29 人工智能

958阅读

鹅厂大模型，又有新玩法! 发布不到两个月，腾讯混元大模型就速通了一个新版本，除了语言模型升级以外，还悄悄上线了AIGC最火热?的功能—— 文生图。和语言模型一样，文生图同样可以通过微信小程序直接体验。不过与Midjourney独立出图不同，混元的文生...

AIGC 2023-10-27 人工智能

1465阅读