强化学习第4页 - AIGC资讯

如何克服人工智能的缺点?

人工智能(AI 领域经历了深刻的变化,并变得越来越复杂。人工智能被誉为改变游戏规则的技术。人工智能由于其聪明才智,比人类更早完成任务,例如语音识别、模式可视化和决策,但它只能翻译语言。然而，自ChatGPT发布以来，该定义一直是类似的。不过，这并不是...

AIGC 2024-05-09 人工智能

699阅读

如何克服人工智能的缺点？

人工智能(AI 领域经历了深刻的变化,并变得越来越复杂。人工智能被誉为改变游戏规则的技术。人工智能由于其聪明才智,比人类更早完成任务,例如语音识别、模式可视化和决策,但它只能翻译语言。然而，自ChatGPT发布以来，该定义一直是类似的。不过，这并不是...

大数据 2024-05-09 人工智能

680阅读

网易集团高级副总裁胡志鹏：AI 游戏新链路，端侧大模型大有可为

5月7日，MediaTek天玑开发者大会2024（MDDC2024）在深圳召开，本届MDDC 大会的主题为“AI予万物”，众多资深行业先驱、技术专家齐聚一堂，深入探讨了Al 技术在各个领域的应用和发展，以及AI 赋予终端侧的更多可能性。在MDDC天玑高峰...

AIGC 2024-05-07 人工智能

733阅读

LeCun哈佛演讲PPT放出：唱衰自回归LLM，指明下一代AI方向

机器如何能像人类和动物一样高效地学习？机器如何学习世界运作方式并获得常识？机器如何学习推理和规划…… 当一系列问题被提出时，有人回答自回归 LLM 足以胜任。然而，知名 AI 学者、图灵奖得主 Yann LeCun 并不这么认为，他一直唱衰自回归 LL...

生成式AI 2024-05-06 人工智能

637阅读

六种人工智能代理（AI Agent）类型

随着大模型的发展，通用智能不断迭代升级，应用模式也不断创新，从简单的Prompt应用、RAG（搜索增强生成）再到AI Agent（人工智能代理）。其中AI Agent一直是个火热的话题，未来将无处不在。比尔盖茨还宣称终极技术竞赛将围绕着开发顶级AI代理。...

人工智能 2024-05-06 人工智能

1119阅读

专利大模型的实践与知识问答探索

一、专利大模型背景介绍智慧芽一直致力于为科技创新和知识产权领域提供信息服务。在小型模型时代（如 Bert），参数量较少，智能理解方面存在局限性。因此，在着手开发大模型之前，智慧芽深入思考了领域聚焦的重要性。在知识产权领域，专利检索、专利对比、标引工作...

生成式AI 2024-05-06 人工智能

982阅读

「非常接近GPT-4」的WizardLM-2被微软紧急撤回，有什么内幕？

前段时间，微软搞了个乌龙：隆重地开源了 WizardLM-2，又在不久后撤回得干干净净。据现在可以查到的 WizardLM-2 发布信息，这是一个「真正媲美 GPT-4」的开源大模型，在复杂聊天、多语言、推理和代理方面的性能得到了提高。该系列包括三个...

大数据 2024-04-30 人工智能

630阅读

MindSpore强化学习：使用PPO配合环境HalfCheetah-v2进行训练

本文分享自华为云社区《MindSpore强化学习：使用PPO配合环境HalfCheetah-v2进行训练》，作者： irrational。半猎豹（Half Cheetah）是一个基于MuJoCo的强化学习环境，由P. Wawrzyński在“A Cat...

人工智能 2024-04-30 人工智能

712阅读

探讨自回归模型和扩散模型的发展应用

在当前大模型驱动的内容创新浪潮中，人工智能产业正以前所未有的力度拥抱一场由大模型技术策动的科技革新运动。这场革命不仅重塑了人机交互的边界，使其跃升至更高层次的认知协作，而且正在颠覆传统的计算思维与执行模式，催生出全新的计算范式，从而深刻地渗透并革新各行各...

人工智能 2024-04-26 人工智能

878阅读

这就是OpenAI神秘的Q*？斯坦福：语言模型就是Q函数

还记得去年 11 月底爆出来的 Q* 项目吗？这是传说中 OpenAI 正在秘密开展、或将带来颠覆性变革的 AI 项目。如果你想回忆一下，可参看机器之心当时的报道《全网大讨论：引爆 OpenAI 全员乱斗的 Q * 到底是什么？》简而言之，Q* 很可能是...

大数据 2024-04-24 人工智能

632阅读

发布几小时，微软秒删媲美GPT-4开源大模型！竟因忘记投毒测试

上周，微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。却没想到发布几小时之后，立马被删除了。有网友突然发现，WizardLM的模型权重、公告帖子全部被删除，并且不再微软集合中，除了提到站点之外，却找不到任何证据证明这个微软的官方项目。...

人工智能 2024-04-23 人工智能

627阅读

波士顿动力新版人形机器人Atlas问世，纯电驱动

我们见证了新一代人形机器人 Atlas 的诞生。新机器人的视频一出，我们立即理解了波士顿动力为何退役已开发十多年的旧版 Atlas—— 人形机器人，现在应该有的是超越人类的灵活性。 Atlas 机器人躺平在实验室的地板上，看起来是仰卧，但突然关节反转站...

AIGC 2024-04-21 人工智能

623阅读

2024谷歌研究学者计划名单公布：清华、北大、上交ACM班等校友在列

2024 年谷歌研究学者计划（Research Scholar Program）获奖名单公布了。获奖者最高将获得 6 万美元奖金，用于支持研究工作。今年该计划共涉及 12 个领域，包括算法与优化；应用科学；人机交互；健康研究；机器学习和数据挖掘；机器感...

生成式AI 2024-04-21 人工智能

631阅读

扩散模型如何帮助创建更好的强化学习系统

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 扩散模型以其令人印象深刻的生成高质量图像的能力而闻名，它们是流行的文本到图像模型(例如DALL-E、Stable Diffusion和...

生成式AI 2024-04-12 人工智能

684阅读

「大模型+强化学习」最新综述！港中文深圳130余篇论文：详解四条主流技术路线

强化学习（RL）通过与环境交互的试错反馈来优化顺序决策问题。虽然RL在允许大量试错的复杂电子游戏环境中实现了超越人类的决策能力（例如王者荣耀，Dota 2等），但很难在包含大量自然语言和视觉图像的现实复杂应用中落地，原因包括但不限于：数据获取困难、样本...

人工智能 2024-04-11 人工智能

882阅读

2024-03-26 AIGC-大模型学习路线

摘要: 2024-03-26 AIGC-大模型学习路线大模型学习路线建议先从主流的Llama开始，然后选用中文的Qwen/Baichuan/ChatGLM，先快速上手体验prompt工程，然后再学习其架构，跑微调脚本如果要深入学习，建...

大数据 2024-04-11 人工智能

2018阅读

基于数据正则化自博弈强化学习的人类兼容型自动驾驶

自动驾驶汽车面临的一个核心挑战是如何与人类合作。因此，在模拟环境中，将现实中的人类代理纳入到自主驾驶系统的可扩展训练和评估中至关重要。模拟代理通常是通过模仿大规模、高质量的人类驾驶数据集来开发的。然而，纯粹的模仿学习代理在多代理闭环环境中执行时经验上具...

人工智能 2024-04-10 人工智能

646阅读

大模型技术实践（二）｜关于Llama 2你需要知道的那些事儿

在上期文章中，我们简要回顾了Llama模型的概况，本期文章我们将详细探讨【关于Llama 2】，你需要知道的那些事儿。 01-Llama 2的性能有多好？作为Meta新发布的SOTA开源大型语言模型，Llama 2是Llama模型的延续和升级。Lla...

生成式AI 2024-04-08 人工智能

641阅读

抱抱脸Open了OpenAI的秘密武器，网易参与复现

OpenAI的秘密武器、ChatGPT背后功臣RLHF，被开源了。来自Hugging Face、加拿大蒙特利尔Mila研究所、网易伏羲AI Lab的研究人员从零开始复现了OpenAI的RLHF pipeline，罗列了25个关键实施细节。最终成功展示...

人工智能 2024-04-08 人工智能

623阅读

生成型人工智能优化框架研究

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 简介生成类似人类的文本和语音曾经只有在科幻小说中才成为可能。但是，GPT-3和PaLM等大型语言模型（LLM）的快速发展...

生成式AI 2024-04-07 人工智能

727阅读

论文笔记：Llama 2: Open Foundation and Fine-Tuned Chat Models

导语 Llama 2 是之前广受欢迎的开源大型语言模型 LLaMA 的新版本，该模型已公开发布，可用于研究和商业用途。本文记录了阅读该论文的一些关键笔记。链接：https://arxiv.org/abs/2307.09288 1 引言大型语言...

人工智能 2024-04-07 人工智能

764阅读

快手强化学习与多任务推荐

一、Two-Stage Constrained Actor-Critic for Short Video Recommendation 第一篇工作是快手自研的，主要针对的是带约束的多任务场景。 1. 短视频多任务推荐场景这篇工作主要针对的是短视频的一...

人工智能 2024-04-03 人工智能

991阅读

大模型实时打《街霸》捉对PK，GPT-4居然不敌3.5，新型Benchmark火了

让大模型直接操纵格斗游戏《街霸》里的角色，捉对PK，谁更能打? GitHub上一种你没有见过的船新Benchmark火了。与llmsys大模型竞技场中，两个大模型分别输出答案，再由人类评分不同——街霸Bench引入了两个AI之间的交互，且由游戏引擎中确...

生成式AI 2024-04-01 人工智能

678阅读

增强包容性：如何利用Edge ML支持具有特殊需求的个人

译者 | 李睿审校 | 重楼科技进步为具有特殊需要的人带来了新的解决方案。边缘机器学习(Edge ML 是一项开创性技术，它使机器学习算法更接近数据源，从而减少延迟，并提高实时处理能力。本文讨论了Edge ML在解决具有特殊需求的个人所面临的独特...

生成式AI 2024-04-01 人工智能

713阅读

LLaMA-Factory参数的解答

打开LLaMA-Factory的web页面会有一堆参数，但不知道怎么选，选哪个，这个文章详细解读一下，每个参数到底是什么含义这是个人写的参数解读，我并非该领域的人如果那个大佬看到有参数不对请反馈一下，或者有补充的也可以！谢谢（后续该文章可能会持续更新）...

大数据 2024-03-30 人工智能

1047阅读

【Stable Diffusion】专栏介绍和文章索引（持续更新中）

目录 1 背景 2 思考 3 文章索引（持续更新中） 3.1 入门 3.2 初级 3.3 中级 3.3 高级 1 背景最近开始学习AIGC，对Stable Diffusion比较感兴趣，所以新建了这个专栏，来记录自己在使用和...

AIGC 2024-03-29 人工智能

642阅读

大型语言模型如何教会自己遵循人类指令？

译者 | 李睿审校 | 重楼如今，人们对能够使大型语言模型(LLM 在很少或没有人为干预的情况下改进功能的技术越来越感兴趣。大型语言模型(LLM 自我改进的领域之一是指令微调(IFT ，也就是让大型语言模型教会自己遵循人类指令。指令微调(IFT ...

人工智能 2024-03-29 人工智能

747阅读

微软亚研院新作：让大模型一口气调用数百万个API！

近年来，人工智能发展迅速，尤其是像ChatGPT这样的基础大模型，在对话、上下文理解和代码生成等方面表现出色，能够为多种任务提供解决方案。但在特定领域任务上，由于专业数据的缺乏和可能的计算错误，它们的表现并不理想。同时，虽然已有一些专门针对特定任务的AI...

人工智能 2024-03-28 人工智能

687阅读

AI时代的网络安全：探索AI生成的网络攻击

译者 | 晶颜审校 | 重楼长期以来，网络攻击一直是劳动密集型的，需要经过精心策划并投入大量的人工研究。然而，随着人工智能技术的出现，威胁行为者已经成功利用它们的能力，以非凡的效率策划攻击。这种技术转变使他们能够大规模地执行更复杂、更难以检测的攻击，...

人工智能 2024-03-27 人工智能

661阅读

400米2分34秒破纪录！伯克利双足机器人「接管」人类

UC伯克利的双足机器人，跑步又破纪录了！最近，HYBRID ROBOTICS研究团队的Cassie，给我们来了一段惊艳的表演—— 以2分34秒的成绩，跑完了400米！随后，它又在不需要额外训练的情况下，完成了1.4米的跳远。是的，相信你已经注意到了...

人工智能 2024-03-26 人工智能

640阅读

AIGC实战——Transformer模型

AIGC实战——Transformer模型 0. 前言 1. T5 2. GPT-3 和 GPT-4 3. ChatGPT 小结系列链接 0. 前言我们在 GPT (Generative Pre-trained Transfo...

AIGC 2024-03-26 人工智能

747阅读

腾讯游戏亮相GDC 2024，围绕AI等多项技术议题与全球游戏从业者分享交流

当地时间3月18日-3月22日，被誉为“游戏界春晚”的2024游戏开发者大会GDC（GameDevelopersConference，简称GDC）于美国旧金山举办，共计近3万位来自世界各地的游戏从业者汇聚于此，交流探讨游戏产业最新发展动态。 GDC创办于1...

大数据 2024-03-25 人工智能

669阅读

揭秘Baichuan 3超越GPT-4的中文实力！文心一言、GLM 4.0也甘拜下风？全方位对比测试大揭秘！

AI界的焦点再度聚集！1月29日，百川智能推出了超千亿参数的大语言模型Baichuan 3，瞬间在科技圈点燃了热情。不同于其他模型，Baichuan 3在中文各项评测中都有惊艳表现，甚至在任务上超越了GPT-4，成为了新的领头羊。 Baichuan 3不...

大数据 2024-03-25 人工智能

649阅读

AI模型训练：强化算法与进化算法

强化学习算法(RL 和进化算法(EA 都属于机器学习领域的子集，但它们在解决问题的方法和思想上有所不同。强化学习算法：强化是一种机器学习范式，它主要关注的是智能体(agent 在与环境进行交互的过程中，通过尝试和错误来学习最优的行为策略，以使其在某...

AIGC 2024-03-25 人工智能

633阅读

腾讯发布自研游戏AI引擎：3D城市布局效率提升百倍，UGC工具已上线《元梦之星》

腾讯游戏，现在连引擎都有AI味儿了—— 就在游戏开发者大会（GDC）上，腾讯刚刚发布自研游戏AI引擎GiiNEX。官方介绍，基于生成式AI和决策AI技术，GiiNEX可以支持游戏从研发到运营的全生命周期需求。具体来说，无论是AI NPC的对话生成，还是...

AIGC 2024-03-21 人工智能

898阅读

人工智能模型提供支持，谷歌拟在印度提供肺结核、肺癌等疾病筛查服务

3 月 19 日消息，谷歌今日官宣了一系列在医疗保健行业部署 AI 模型的计划。根据计划，谷歌研究团队和其拥有的 Fitbit 公司正在开发一系列新的人工智能功能：从腕带中提取数据并指导用户的个人健康，该工具由谷歌人工智能模型 Gemini 提供支持...

生成式AI 2024-03-20 人工智能

560阅读

机器学习：Github上排名前19个强化学习 (RL)项目

强化学习 (RL 是一种机器学习，使代理能够通过反复试验来学习。强化学习算法用于各种应用，包括游戏、机器人和金融。 RL 的目标是找到一种最大化预期长期回报的策略。强化学习算法通常分为两类：基于模型的算法和无模型的算法。基于模型的强化学习算法构建环境模...

人工智能 2024-03-19 人工智能

672阅读

AI大模型控制红绿灯，港科大（广州）智慧交通新成果已开源

大模型“上路”，干起了交通信号控制（TSC）的活～模型名为LightGPT，以排队及不同区段快要接近信号灯的车辆对路口交通状况分析，进而确定最好的信号灯配置。该模型由香港科技大学（广州）的研究团队提出，其背后关键是一个名为LLMLight的框架。...

生成式AI 2024-03-18 人工智能

628阅读

大模型能自己优化Prompt了，曾经那么火的提示工程要死了吗？

2022 年底，ChatGPT 上线，同时引爆了一个新的名词：提示工程（Prompt Engineering）。简而言之，提示工程就是寻找一种编辑查询（query）的方式，使得大型语言模型（LLM）或 AI 绘画或视频生成器能得到最佳结果或者让用户能绕...

人工智能 2024-03-18 人工智能

784阅读

刷榜「代码生成」任务！复旦等发布StepCoder框架：从编译器反馈信号中强化学习

大型语言模型（LLMs）的发展极大地推动了代码生成领域的发展，之前有工作将强化学习（RL）与编译器的反馈信号集成在一起，用于探索LLMs的输出空间，以提高代码生成质量。但当下还存在两个问题： 1. 强化学习探索很难直接适配到「复杂的人类需求」，即要求L...

AIGC 2024-03-15 人工智能

922阅读

首个自主完成人类任务机器人出现，五指灵活速度超人，大模型加持虚拟空间训练

这周，由OpenAI，微软，贝佐斯，英伟达投资的机器人公司Figure AI融资接近7亿美元，号称在1年之内要做出等独立行走工作的人形机器人。而特斯拉的擎天柱也屡屡传出好消息。没人怀疑，今年会是人形机器人爆发的一年。一家位于加拿大的机器人公司San...

生成式AI 2024-03-11 人工智能

611阅读

理解世界，最新综述开启自动驾驶新时代~

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解在快速发展的自动驾驶领域，准确预测未来事件并评估其影响的能力对安全性和效率至关重要，对决策过程至关重要。世界模型已经成为一种变革性的方法，使自动驾驶系统能够合成和解释大...

生成式AI 2024-03-11 人工智能

751阅读

LeCun最新专访：为什么物理世界终将成为LLM的「死穴」？

在人工智能领域，很少有像 Yann LeCun 这样的学者，在 65 岁的年龄还能高度活跃于社交媒体。一直以来，Yann LeCun 都是以「直言不讳的批评者」形象活跃于人工智能领域。他始终支持开源，并带领 Meta 的团队推出了占据如今开源大模型领域...

AIGC 2024-03-11 人工智能

604阅读

谷歌工程师硬核长篇预测，证实黄仁勋观点：AGI或在2029年出现，AI五年内通过人类测试

最近，英伟达CEO黄仁勋表示，AI会在五年内通过人类测试，AGI将很快到来！在斯坦福大学举行的一个经济论坛上，黄仁勋回答了这个问题：人类何时能创造像人类一样思考的计算机？这也是硅谷的长期目标之一。老黄是这样回答的：答案很大程度上取决于我们如何定义...

AIGC 2024-03-11 人工智能

631阅读

扩散模型如何构建新一代决策智能体？超越自回归，同时生成长序列规划轨迹

设想一下，当你站在房间内，准备向门口走去，你是通过自回归的方式逐步规划路径吗？实际上，你的路径是一次性整体生成的。近期的研究表明，采用扩散模型的规划模块能够同时生成长序列的轨迹规划，这更加符合人类的决策模式。此外，扩散模型在策略表征和数据合成方面也能为...

人工智能 2024-03-11 人工智能

688阅读

AIGC启示录：深度解析AIGC技术的现代性与系统性的奇幻旅程

✨✨ 欢迎大家来访Srlua的博文（づ￣3￣）づ╭❤～✨✨ ?? 欢迎各位亲爱的读者，感谢你们抽出宝贵的时间来阅读我的文章。我是Srlua小谢，在这里我会分享我的知识和经验。? 希望在这里，我们能一起探索IT世界的奥妙，提升我们的技能。?...

大数据 2024-03-10 人工智能

632阅读

近屿智能完成A轮融资，打造行业领先的AIGC工程师与产品经理成长蓝图

2024年1月，上海近屿智能科技有限公司（简称近屿智能）成功完成了A轮融资，智望资本担任了领投角色，而金沙江创投也进行了追加投资。这一融资里程碑充分证明了近屿智能在AIGC行业的技术领先地位得到了市场的广泛认可和投资人的青睐。自创立伊始，近屿智能始...

大数据 2024-03-09 人工智能

875阅读

近屿智能完成A轮融资，独家打造的AIGC工程师与产品经理学习路径图成行业焦点

2024年1月，上海近屿智能科技有限公司（以下简称近屿智能）宣布成功完成A轮融资，由智望资本领投，金沙江创投追加投资。这一重大融资事件不仅象征着近屿智能在AIGC领域的领先地位得到了市场的广泛认可，更凸显了投资人对近屿智能技术实力与未来发展潜力的坚定信心。...

大数据 2024-03-07 人工智能

632阅读

抖音推出全新AI社交产品“话炉” 能陪你闲扯还能讲故事、猜谜语

据Tech星球的报道，抖音再次推出了全新的社交产品“话炉”，这次加入了AI的元素。继多闪、飞聊之后，抖音再次在社交领域发力。 “话炉”是一款基于字节旗下云雀大模型驱动的角色聊天产品。用户可以通过与个性鲜明、背景各异的AI角色实时聊天互动，满足闲谈生活日常、...

大数据 2024-03-06 人工智能

580阅读

十大必知的人工智能算法

随着人工智能技术（AI）的日益普及，各种算法在推动这一领域的发展中发挥着关键作用。从预测房价的线性回归到自动驾驶汽车的神经网络，这些算法在背后默默支撑着无数应用的运行。今天，我们将带您一览这些热门的人工智能算法（线性回归、逻辑回归、决策树、朴素贝叶斯...

人工智能 2024-03-05 人工智能

787阅读