-
深度求索开源DeepSeek LLM 67B大模型 无需申请免费商用
深度求索发布了一个67B 的大模型,名为 DeepSeek LLM67B。这个模型完全开源,可以通过访问 chat.deepseek.com 来使用。 DeepSeek LLM67B 在公开评测榜单上表现良好,特别是在推理、数学和编程能力方面。DeepS...
-
伯克利分校推开放大模型Starling-7B 接受人工智能反馈训练
加州大学伯克利分校的研究人员推出了一款名为Starling-7B的开放式大型语言模型(LLM),采用了一种称为Reinforcement Learning from AI Feedback(RLAIF 的创新训练方法。 RLAIF的独特之处在于利用其他人...
-
使用 LoRA 技术对 LLaMA 65B 大模型进行微调及推理
前几天,Meta 发布了 LIMA 大模型,在LLaMA-65B的基础上,无需使用 RLHF,只用了 1000 个精心准备的样本数据进行微调,就达到了和 GPT-4 相媲美的程度。这激发了我探索 LLaMA 65B 大模型的兴趣。 之前的一系列大模型相...
-
LLMs之Code:Code Llama的简介(衍生模型如Phind-CodeLlama/WizardCoder)、安装、使用方法之详细攻略
LLMs之Code:Code Llama的简介(衍生模型如Phind-CodeLlama/WizardCoder 、安装、使用方法之详细攻略 导读:2023年08月25日(北京时间 ,Meta发布了Code Llama,一个可以使用文本提示生成...
-
OpenAI重磅更新:人人可定制GPT!马斯克2个月打造ChatGPT竞品公开叫板
11月7日凌晨2点,人工智能初创公司 OpenAI 举办首届 DevDay 开发者大会,其首席执行官山姆•阿尔特曼(Sam Altman)宣布了GPT-4、ChatGPT等AI平台的一系列增强功能与定价变化。这些变化有望使OpenAI的技术更加强大、灵活...
-
多模态LLM幻觉问题降低30%!业内首个“啄木鸟”免重训方法诞生
还在用指令微调解决多模态大模型的“幻觉”问题吗? 比如下图中模型将橙色柯基错认为“红狗”,还指出周围还有几条。 图片 现在,中科大的一项研究想到了一个全新办法: 一个免重训、即插即用的通用架构,直接从模型给出的错误文本下手,“倒推”出可能出现“幻觉”之处...
-
实测腾讯AI文生图!王者荣耀画风一键直出,小程序就能玩
鹅厂大模型,又有新玩法! 发布不到两个月,腾讯混元大模型就速通了一个新版本,除了语言模型升级以外,还悄悄上线了AIGC最火热?的功能—— 文生图。 和语言模型一样,文生图同样可以通过微信小程序直接体验。 不过与Midjourney独立出图不同,混元的文生...