强化学习第6页 - AIGC资讯

LLM巫师，代码预训练是魔杖！UIUC华人团队揭秘代码数据三大好处

大模型时代的语言模型（LLM）不仅在尺寸上变得更大了，而且训练数据也同时包含了自然语言和形式语言（代码）。作为人类和计算机之间的媒介，代码可以将高级目标转换为可执行的中间步骤，具有语法标准、逻辑一致、抽象和模块化的特点。最近，来自伊利诺伊大学香槟分校...

大数据 2024-01-29 人工智能

945阅读

Llama 2: Open Foundation and Fine-Tuned Chat Models

文章目录 TL;DR Introduction 背景本文方案实现方式预训练预训练数据训练细节训练硬件支持预训练碳足迹微调 SFT SFT 训练细节 RLHF 人类偏好数据收集奖励模型迭代式微调（RLHF）拒...

AIGC 2024-01-29 人工智能

1106阅读

强化学习和世界模型中的因果推断

一、世界模型 “世界模型”源于认知科学，在认知科学里面有一个等价的词汇 mental models，也就是心智模型。那么什么是心智模型？在认知科学里有一个假设，认为人在大脑内部会有一个对于真实外在世界的表征，它对于认知这个世界，特别是推理和决策有很关...

人工智能 2024-01-26 人工智能

1065阅读

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

过去一年，生成式人工智能发展的核心关键词，就是「大」。人们逐渐接受了强化学习先驱 Rich Sutton 充分利用算力「大力出奇迹」的思潮，庞大的数据量是 AI 模型展现出惊人智慧的核心原因。数据规模越大、质量越高、标注越细，模型就能了解到更全面的世界...

大数据 2024-01-25 人工智能

794阅读

马作的卢飞快！上海AI Lab发布首个模仿人类学习范式的自动驾驶决策框架DiLu

本文经自动驾驶之心公众号授权转载，转载请联系出处。 DiLu（的卢）是首个基于AI Agent范式的知识驱动自动驾驶框架，其结合了常识知识和大语言模型，通过记忆模块以实现闭环自动驾驶决策制定并拥有持续进化的能力。通过不断对环境的交互积累经验，自我反思纠...

大数据 2024-01-25 人工智能

915阅读

多智能体系统的合作之道：对MAS不确定性、社会机制与强化学习的探索

多智能体系统（MAS）是由多个自主智能体组成的系统，它们可以相互交互和协作，以完成一些共同或个人的目标。多智能体系统在许多领域都有广泛的应用，如机器人、交通、电力、社交网络等。但是如何促进智能体之间的合作行为一直是这一领域的难题，特别是在激励机制不确定的...

生成式AI 2024-01-25 人工智能

1009阅读

人工智能数学基础 - 线性代数之矩阵篇

本文将从矩阵的本质、矩阵的原理、矩阵的应用三个方面，带您一文搞懂人工智能数学基础-线性代数之矩阵。一、矩阵的本质点积（Dot Product）：点积作为向量间的一种基本运算，通过对应元素相乘后求和来刻画两向量的相似度和方向关系。点积（Dot Pr...

大数据 2024-01-24 人工智能

1039阅读

使用SPIN技术对LLM进行自我博弈微调训练

2024年是大型语言模型(llm 的快速发展的一年，对于大语言模型的训练一个重要的方法是对齐方法，它包括使用人类样本的监督微调(SFT 和依赖人类偏好的人类反馈强化学习(RLHF 。这些方法在llm中发挥了至关重要的作用，但是对齐方法对人工注释数据有的大...

生成式AI 2024-01-24 人工智能

888阅读

清华、小米、华为、 vivo、理想等多机构联合综述，首提个人LLM智能体、划分5级智能水平

嘿 Siri、你好小娜、小爱同学、小艺小艺、OK Google、小布小布…… 想必这些唤醒词中至少有一个曾被你的嘴发出并成功呼唤出了一个能给你导航、讲笑话、添加日程、设置闹钟、拨打电话的智能个人助理（IPA）。可以说 IPA 已经成了现代智能手机不可或缺...

AIGC 2024-01-22 人工智能

861阅读

AIGC的初识

?欢迎来到自然语言处理的世界 ?博客主页：卿云阁 ?欢迎关注?点赞?收藏⭐️留言? ?本文由卿云阁原创！ ?首发时间：?2023年12月26日? ✉️希望可以和大家一起完成进阶之路！ ?作者水平很有限，如果发现错误，请留言轰炸哦！万分...

人工智能 2024-01-22 人工智能

940阅读

网络安全人士必知的AI专业术语

随着人工智能的迅猛发展，我们正置身于第四次工业革命的浪潮中。在这个数字化的时代，网络安全成为各行业至关重要的议题。作为网络安全从业人员，不仅需要熟练掌握传统安全领域的知识，更需要深刻理解和运用人工智能，以在风云变幻的网络战场中保护信息资产。人工智能不仅为...

大数据 2024-01-22 人工智能

1309阅读

“AI学会欺骗，人类完蛋了”？看完Anthropic的论文，我发现根本不是这回事啊

AGI若到来，人类是否会受到威胁，是一个大众热衷讨论同时研究者们也很关注的问题，从各个角度对此的研究几乎都会引发人们的讨论。最新的一个重磅研究来自今天最重要的大模型公司之一Anthropic。 1月9号他们发布了一篇论文，提出关于“Sleeper Agen...

人工智能 2024-01-22 人工智能

823阅读

人工智能如何应用于机器人?

由于人工智能(AI ，机器人现在可以自己学习、适应和做出决策，而不需要人类或预先编程的指令。已启用AI的机器人配备了算法，使其能够分析和了解来自其环境的数据，并采取适当的行动。这些算法可能被认为类似于人类大脑，其从感官上解释信息，寻找模式，并产生结果。...

生成式AI 2024-01-22 人工智能

830阅读

一文了解AIGC与ChatGPT

关注微信公众号掌握更多技术动态 --------------------------------------------------------------- 一、AIGC简介 1.AIGC基础 (1 AIGC是什么 AIGC是人...

人工智能 2024-01-22 人工智能

1606阅读

一张图500元是目前AIGC最高“回报”？小冰李笛：调用API的商业模式不适用于未来 | MEET 2024...

编辑部发自凹非寺量子位 | 公众号 QbitAI AIGC在商业界中，最大的一笔回报是多少？答案可能是：一张图片，500元。而且这就是发生在最近、号称人工智能著作权第一案的真实案例： A利用人工智能技术生成了一张图片，...

人工智能 2024-01-21 人工智能

935阅读

AIGC内容分享(三十)：推荐四本人工智能和AIGC相关的书籍

目录《AI创意》《人工智能创意》《人工智能革命》《AI生成内容》《AI创意》一. 近年来，随着人工智能技术的快速发展，越来越多的人开始关注AI在创意领域的应用，也就是所谓的“AIGC”（Artificial Intellige...

大数据 2024-01-21 人工智能

1379阅读

大模型自我奖励：Meta让Llama2自己给自己微调，性能超越了GPT-4

大模型领域中，微调是改进模型性能的重要一步。随着开源大模型逐渐变多，人们总结出了很多种微调方式，其中一些取得了很好的效果。最近，来自 Meta、纽约大学的研究者用「自我奖励方法」，让大模型自己生成自己的微调数据，给人带来了一点新的震撼。在新方法中，作者...

人工智能 2024-01-21 人工智能

846阅读

AIGC、ChatGPT、GPT系列？我的认识

AIGC（AI generated content），新型内容生产方式。AIGC是利用人工智能技术来生成内容，也就是，它可以用输入数据生成相同或不同类型的内容，比如输入文字、生成文字，输入文字、生成图像等。 GPT-3是生成型的预训练变换模型，是...

大数据 2024-01-20 人工智能

911阅读

大型语言模型中最大的瓶颈：速率限制

作者 | Matt Asay策划 | 言征速率限制意味着每个人都在等待更好的计算资源或不同的生成人工智能模型。大型语言模型（LLM），如OpenAI的GPT-4和Anthropic的Claude 2，凭借其生成类人文本的能力，吸引了公众的想象力。...

大数据 2024-01-19 人工智能

920阅读

游戏+人工智能AI如何影响我们的未来：（二）游戏将成为 AIGC 的重要应用场

人工智能在诞生之初就已展现出了与电子游戏的亲密关系。—方面，其开创者们长期利用游戏来测试人工智能程序的性能，如今的人工智能也已经具备了在各种复杂游戏中击败人类玩家的能力。另—方面，随着人工智能技术的发展，人们也发现可以利用这项技术来辅助游戏设计和游戏...

AIGC 2024-01-19 人工智能

1622阅读

免费商用 Meta 发布开源大语言模型 Llama 2

Meta 和微软深度合作，正式推出下一代开源大语言模型 Llama 2，并宣布免费提供给研究和商业使用。 Llama 2 论文地址：Llama 2: Open Foundation and Fine-Tuned Chat Models 据介...

大数据 2024-01-19 人工智能

1056阅读

自动泊车全面调研！汇集行业标准趋势、评测指标、系统介绍各个方面！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面自动泊车系统是指在没有人工干预的情况下，车辆本身可以自主的实现停车位的寻找并完成准确的泊车，同时该系统也可以根据用户的需求准确移动到用户指定的位置上。如果自动泊车技术成熟后，可以极大缓解人们...

人工智能 2024-01-18 人工智能

937阅读

基于大语言模型赋能智体的建模和仿真：综述和展望

本文经自动驾驶之心公众号授权转载，转载请联系出处。 23年12月论文“Large Language Models Empowered Agent-based Modeling and Simulation: A Survey and Perspecti...

AIGC 2024-01-18 人工智能

977阅读

大模型“藏毒”：“后门”触发，猝不及防！

撰稿 | 言征出品 | 51CTO技术栈（微信号：blog51cto）跟大模型会产生幻觉相比，更可怕的事情来了，最新的一项研究证明：在用户不知情的情况下，最初觉得很得力的大模型助手，将化身“间谍”，产生破坏性代码。具体来讲，一组研究人员对LL...

人工智能 2024-01-17 人工智能

857阅读

使用 DPO 微调 Llama 2

简介基于人类反馈的强化学习 (Reinforcement Learning from Human Feedback，RLHF 事实上已成为 GPT-4 或 Claude 等 LLM 训练的最后一步，它可以确保语言模型的输出符合人类在闲聊或安全...

生成式AI 2024-01-17 人工智能

925阅读

腾讯最新AI工具PhotoMaker：上传图片即可生成多样化风格个人照片

腾讯最新推出的AI照片生成工具PhotoMaker引发了不少关注，该应用利用强化学习（RL）技术，只要上传照片就可以生成多种风格的个人照片，无需进行额外的LoRA训练，用户可以迅速进行定制。 PhotoMaker还具有多样的功能，包括混合不同人物特征生成全...

大数据 2024-01-16 人工智能

1329阅读

张钹院士：生成式人工智能的三大能力与一大缺点

网易科技1月16日报道，在智谱AI技术开放日，中国科学院院士、清华大学教授张钹针对《从大语言模型到通用人工智能》话题发表演讲，针对生成式人工智能的现状和未来发表见解。张钹院士认为，如果我们不能创造它，就不可能理解它，我们之所以发展生成式人工智能，重要...

大数据 2024-01-16 人工智能

841阅读

广义人工智能时代：通往通用人工智能（AGI）之路

人工智能(AI 将于2024年进一步改进，大型语言模型有望进一步发展。 2023年对于人工智能和生成式人工智能来说是激动人心的一年，特别是那些采用大型语言模型(LLM 架构的人工智能，比如来自开放人工智能(GPT 4 、Anthropic(Claud...

AIGC 2024-01-16 人工智能

920阅读

史上超全自动驾驶岗位介绍

本文经自动驾驶之心公众号授权转载，转载请联系出处。 1.背景近日分享如何高新转型到自动驾驶领域时，几位朋友不约而同的问到了我同一个问题：“L2~L4自动驾驶的岗位都有哪些？对应着具体的什么工作内容？需要哪方面的技能？”今天就针对这个大家都很想了解的...

人工智能 2024-01-16 人工智能

997阅读

性能大涨20%！中科大「状态序列频域预测」方法：表征学习样本效率max

强化学习算法（Reinforcement Learning, RL）的训练过程往往需要大量与环境交互的样本数据作为支撑。然而，现实世界中收集大量的交互样本通常成本高昂或者难以保证样本采集过程的安全性，例如无人机空战训练和自动驾驶训练。为了提升强化学习算...

生成式AI 2024-01-15 人工智能

950阅读

深挖RLHF潜力，复旦语言和视觉团队创新奖励模型优化，让大模型更对齐

继第一份大模型对齐技术报告（Secrets of RLHF in Large Language Models Part I）获 NeurIPS 2023 workshop best paper 后，第二份报告强势归来，复旦语言和视觉团队联合推出的第二...

大数据 2024-01-15 人工智能

900阅读

大模型伪装「潜伏特工」学会欺骗！OpenAI劲敌重磅研究震惊马斯克

不要教LLM学会骗人！不要教LLM学会骗人！不要教LLM学会骗人！因为后果可能会很严重，甚至超出人类的想象。最近，AI初创公司Anthropic的研究表明，一旦LLM学会了人类教授的欺骗行为，它们就会在训练和评估的过程中隐藏自己，并在使用时偷偷输出恶...

人工智能 2024-01-15 人工智能

804阅读

OpenAI修改其AI模型使用政策，取消对军用应用明确禁令

OpenAI最近宣布对其AI模型使用政策进行修改，取消了以往对“军事和战争”应用的明确禁令。这一调整被解释为将禁令内容融入更广泛的四项通用原则中，如“不要利用我们的服务伤害自己或他人”，或者“不要重新利用或分发我们服务的输出以伤害他人”。 OpenAI发...

大数据 2024-01-15 人工智能

867阅读

大模型隐蔽后门震惊马斯克：平时人畜无害，提到关键字瞬间“破防”

“耍心机”不再是人类的专利，大模型也学会了！经过特殊训练，它们就可以做到平时深藏不露，遇到关键词就毫无征兆地变坏。而且，一旦训练完成，现有的安全策略都毫无办法。 ChatGPT“最强竞对”Claude的背后厂商Anthropic联合多家研究机构发表...

大数据 2024-01-15 人工智能

791阅读

谷歌AI通过图灵测试，大模型医生来了？GPT-4竟诊断出难倒17个医生的怪病

【新智元导读】AI在医疗领域再次发光!谷歌DeepMind团队发布的全新诊断对话式AI在测试中击败医生，通过了图灵测试，再次引领医疗AI的革命。我们需要研发对人类有益AGI的原因之一: OpenAI联创Greg Brockman的一番话点明，当前先进A...

大数据 2024-01-14 人工智能

926阅读

Llama 2- Open Foundation and Fine-Tuned Chat Models＜2＞

3.2 人类反馈强化学习（RLHF） RLHF 是一种模型训练过程，应用于微调的语言模型，以进一步使模型行为与人类偏好和指令遵循保持一致。我们收集代表根据经验采样的人类偏好的数据，人类注释者可以选择他们更喜欢的两个模型输出中的哪一个。这种人类反馈随后用...

大数据 2024-01-14 人工智能

1023阅读

LLMs模型速览（GPTs、LaMDA、GLM/ChatGLM、PaLM/Flan-PaLM、BLOOM、LLaMA、Alpaca）

文章目录一、 GPT系列 1.1 GPTs（OpenAI，2018——2020） 1.2 InstructGPT（2022-3） 1.2.1 算法 1.2.2 损失函数 1.3 ChatGPT（2022.11.30） 1.4 ChatG...

AIGC 2024-01-09 人工智能

1298阅读

【好书推荐-第二期】《实战AI大模型》：带你走进大模型GPTs、AIGC的世界（李开复、周鸿祎、颜水成倾力推荐）

? 作者介绍：我是程序员洲洲，一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主、前后端开发、人工智能研究生。公粽号：程序员洲洲。 ? 本文专栏：本文收录于洲洲的《送书福利》系列专栏，该专栏福利多多，只需...

生成式AI 2024-01-08 人工智能

1222阅读

何为交互感知？全面回顾自动驾驶中的社会交互动态模型与决策前沿！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解交互感知自动驾驶（IAAD）是一个迅速发展的研究领域，专注于开发能够与人类道路使用者安全、高效交互的自动驾驶车辆。这是一项具有挑战性的任务，因为它要求自动驾驶车辆能够理...

AIGC 2024-01-08 人工智能

1095阅读

AIGC 综述 2023：A History of Generative AI from GAN to ChatGPT

GAI：发展历史，核心技术，应用领域以及未来发展摘要 1、引言 1.1、主要贡献 1.2、组织结构 2、生成式AI的发展历史 2.1、NLP领域的发展 2.2、CV领域的发展 2.3、CV与NLP的融合 3、AIGC的核心技术基础...

人工智能 2024-01-08 人工智能

1479阅读

十个值得收藏的AI人工智能网站（AI绘画、AI插件）

1、伯乐 AI 伯乐 AI（https://ai.bleai.cn）是一种基于文心大模型的知识增强大语言模型，专注于自然语言处理（NLP）领域的技术研发。它具备强大的语义理解和生成能力，能够处理各种复杂的自然语言任务。伯乐 AI在NLP领域有着广泛的应用...

大数据 2024-01-08 人工智能

1655阅读

AIGC之GPT-4：GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议)、使用方法、案例应用(计算能力/代码能力/看图能力等)之详细攻略

AIGC之GPT-4：GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议、使用方法、案例应用(计算能力/代码能力/看图能力等之详细攻略解读：在2022年11月横空出世的ChatGPT，打遍天下无敌手的时候，就知道会有这么一天，...

AIGC 2024-01-07 人工智能

883阅读

一张图500元是目前AIGC最高“回报”？小冰李笛：调用API的商业模式不适用于未来 | MEET 2024

AIGC在商业界中，最大的一笔回报是多少? 答案可能是:一张图片，500元。而且这就是发生在最近、号称人工智能著作权第一案的真实案例: 这个案子出来之后，引发了很多人都会讨论，认为它会不会对法学界、对人工智能的著作权、版权等问题的实践具有一些新的指导意...

大数据 2024-01-07 人工智能

874阅读

2023年末人工智能领域必读好书推荐—AIGC、AGI、GhatGPT、人工智能大模型必读书单

文章目录一.2023-人工智能领域概览 1. AIGC 2. AGI 3. GhatGPT 4. 人工智能大模型二.AIGC、AGI、GhatGPT、人工智能大模型必读书单 01 《ChatGPT 驱动软件开发》 02 《ChatGP...

生成式AI 2024-01-07 人工智能

1201阅读

当LLM学会左右互搏，基础模型或将迎来集体进化

金庸武侠小说中有一门武学绝技：左右互搏；乃是周伯通在桃花岛的地洞里苦练十余年所创武功，初期想法在于左手与右手打架，以自娱自乐。而这种想法不仅能用来练武功，也能用来训练机器学习模型，比如前些年风靡一时的生成对抗网络（GAN）。进入现今的大模型 (LLM ...

大数据 2024-01-06 人工智能

899阅读

最强开源大模型？Llama 2论文解读

标题简介模型预训练预训练设置硬件资源与碳排放模型评估模型微调有监督微调基于人工反馈的强化学习（RLHF）人类偏好数据的收集奖励模型迭代微调过程多轮对话控制 RLHF 结果模型回答的安全性一直...

生成式AI 2024-01-03 人工智能

1298阅读

人工智能生成内容AIGC是什么？

一、AIGC的概念和特点 AIGC是人工智能生成内容（Artificial Intelligence Generated Content）的简称，指的是利用人工智能技术，通过已有数据寻找规律，并通过预训练大模型、生成式对抗网络（GAN）等方法，自动生成各...

生成式AI 2024-01-02 人工智能

2018阅读

GPT-5不会真正突破，24年AGI不会实现！全网AI大佬24年最全预测

【新智元导读】经过23年的生成式AI之年，24年AI会有哪些新突破?大佬预测，即使GPT-5发布，LLM在本质上仍然有限，在24年，基本的AGI也不足以实现。 23年是当之无愧的「生成式AI之年」。 24年，AI技术会有哪些突破? 英伟达高级科学家Jim...

人工智能 2024-01-01 人工智能

830阅读

LLaMA, ChatGLM, BLOOM的参数高效微调实践

作者：回旋托马斯x（腾讯NLP算法工程师）项目地址：https://zhuanlan.zhihu.com/p/635710004 1. 开源基座模型对比大语言模型的训练分为两个阶段：（1）在海量文本语料上的无监督预训练，学习通用的语义表...

人工智能 2024-01-01 人工智能

1298阅读

【大模型实践】基于文心一言的对话模型设计

文心一言（英文名：ERNIE Bot）是百度全新一代知识增强大语言模型，文心大模型家族的新成员，能够与人对话互动、回答问题、协助创作，高效便捷地帮助人们获取信息、知识和灵感。文心一言从数万亿数据和数千亿知识中融合学习，得到预训练大模型，在此基础上采用有监督...

大数据 2024-01-01 人工智能

1011阅读