-
发布几小时,微软秒删媲美GPT-4开源大模型!竟因忘记投毒测试
上周,微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。 却没想到发布几小时之后,立马被删除了。 有网友突然发现,WizardLM的模型权重、公告帖子全部被删除,并且不再微软集合中,除了提到站点之外,却找不到任何证据证明这个微软的官方项目。...
-
波士顿动力新版人形机器人Atlas问世,纯电驱动
我们见证了新一代人形机器人 Atlas 的诞生。 新机器人的视频一出,我们立即理解了波士顿动力为何退役已开发十多年的旧版 Atlas—— 人形机器人,现在应该有的是超越人类的灵活性。 Atlas 机器人躺平在实验室的地板上,看起来是仰卧,但突然关节反转站...
-
2024谷歌研究学者计划名单公布:清华、北大、上交ACM班等校友在列
2024 年谷歌研究学者计划(Research Scholar Program)获奖名单公布了。获奖者最高将获得 6 万美元奖金,用于支持研究工作。 今年该计划共涉及 12 个领域,包括算法与优化;应用科学;人机交互;健康研究;机器学习和数据挖掘;机器感...
-
扩散模型如何帮助创建更好的强化学习系统
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 扩散模型以其令人印象深刻的生成高质量图像的能力而闻名,它们是流行的文本到图像模型(例如DALL-E、Stable Diffusion和...
-
「大模型+强化学习」最新综述!港中文深圳130余篇论文:详解四条主流技术路线
强化学习(RL)通过与环境交互的试错反馈来优化顺序决策问题。 虽然RL在允许大量试错的复杂电子游戏环境中实现了超越人类的决策能力(例如王者荣耀,Dota 2等),但很难在包含大量自然语言和视觉图像的现实复杂应用中落地,原因包括但不限于:数据获取困难、样本...
-
2024-03-26 AIGC-大模型学习路线
摘要: 2024-03-26 AIGC-大模型学习路线 大模型学习路线 建议先从主流的Llama开始,然后选用中文的Qwen/Baichuan/ChatGLM,先快速上手体验prompt工程,然后再学习其架构,跑微调脚本 如果要深入学习,建...
-
基于数据正则化自博弈强化学习的人类兼容型自动驾驶
自动驾驶汽车面临的一个核心挑战是如何与人类合作。因此,在模拟环境中,将现实中的人类代理纳入到自主驾驶系统的可扩展训练和评估中至关重要。模拟代理通常是通过模仿大规模、高质量的人类驾驶数据集来开发的。然而,纯粹的模仿学习代理在多代理闭环环境中执行时经验上具...
-
大模型技术实践(二)|关于Llama 2你需要知道的那些事儿
在上期文章中,我们简要回顾了Llama模型的概况,本期文章我们将详细探讨【关于Llama 2】,你需要知道的那些事儿。 01-Llama 2的性能有多好? 作为Meta新发布的SOTA开源大型语言模型,Llama 2是Llama模型的延续和升级。Lla...
-
抱抱脸Open了OpenAI的秘密武器,网易参与复现
OpenAI的秘密武器、ChatGPT背后功臣RLHF,被开源了。 来自Hugging Face、加拿大蒙特利尔Mila研究所、网易伏羲AI Lab的研究人员从零开始复现了OpenAI的RLHF pipeline,罗列了25个关键实施细节。 最终成功展示...
-
生成型人工智能优化框架研究
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 简介 生成类似人类的文本和语音曾经只有在科幻小说中才成为可能。但是,GPT-3和PaLM等大型语言模型(LLM)的快速发展...
-
论文笔记:Llama 2: Open Foundation and Fine-Tuned Chat Models
导语 Llama 2 是之前广受欢迎的开源大型语言模型 LLaMA 的新版本,该模型已公开发布,可用于研究和商业用途。本文记录了阅读该论文的一些关键笔记。 链接:https://arxiv.org/abs/2307.09288 1 引言 大型语言...
-
快手强化学习与多任务推荐
一、Two-Stage Constrained Actor-Critic for Short Video Recommendation 第一篇工作是快手自研的,主要针对的是带约束的多任务场景。 1. 短视频多任务推荐场景 这篇工作主要针对的是短视频的一...
-
大模型实时打《街霸》捉对PK,GPT-4居然不敌3.5,新型Benchmark火了
让大模型直接操纵格斗游戏《街霸》里的角色,捉对PK,谁更能打? GitHub上一种你没有见过的船新Benchmark火了。 与llmsys大模型竞技场中,两个大模型分别输出答案,再由人类评分不同——街霸Bench引入了两个AI之间的交互,且由游戏引擎中确...
-
增强包容性:如何利用Edge ML支持具有特殊需求的个人
译者 | 李睿 审校 | 重楼 科技进步为具有特殊需要的人带来了新的解决方案。边缘机器学习(Edge ML 是一项开创性技术,它使机器学习算法更接近数据源,从而减少延迟,并提高实时处理能力。 本文讨论了Edge ML在解决具有特殊需求的个人所面临的独特...
-
LLaMA-Factory参数的解答
打开LLaMA-Factory的web页面会有一堆参数 ,但不知道怎么选,选哪个,这个文章详细解读一下,每个参数到底是什么含义这是个人写的参数解读,我并非该领域的人如果那个大佬看到有参数不对请反馈一下,或者有补充的也可以!谢谢(后续该文章可能会持续更新)...
-
【Stable Diffusion】专栏介绍和文章索引(持续更新中)
目录 1 背景 2 思考 3 文章索引(持续更新中) 3.1 入门 3.2 初级 3.3 中级 3.3 高级 1 背景 最近开始学习AIGC,对Stable Diffusion比较感兴趣,所以新建了这个专栏,来记录自己在使用和...
-
大型语言模型如何教会自己遵循人类指令?
译者 | 李睿 审校 | 重楼 如今,人们对能够使大型语言模型(LLM 在很少或没有人为干预的情况下改进功能的技术越来越感兴趣。大型语言模型(LLM 自我改进的领域之一是指令微调(IFT ,也就是让大型语言模型教会自己遵循人类指令。 指令微调(IFT ...
-
微软亚研院新作:让大模型一口气调用数百万个API!
近年来,人工智能发展迅速,尤其是像ChatGPT这样的基础大模型,在对话、上下文理解和代码生成等方面表现出色,能够为多种任务提供解决方案。 但在特定领域任务上,由于专业数据的缺乏和可能的计算错误,它们的表现并不理想。同时,虽然已有一些专门针对特定任务的AI...
-
AI时代的网络安全:探索AI生成的网络攻击
译者 | 晶颜 审校 | 重楼 长期以来,网络攻击一直是劳动密集型的,需要经过精心策划并投入大量的人工研究。然而,随着人工智能技术的出现,威胁行为者已经成功利用它们的能力,以非凡的效率策划攻击。这种技术转变使他们能够大规模地执行更复杂、更难以检测的攻击,...
-
400米2分34秒破纪录!伯克利双足机器人「接管」人类
UC伯克利的双足机器人,跑步又破纪录了! 最近,HYBRID ROBOTICS研究团队的Cassie,给我们来了一段惊艳的表演—— 以2分34秒的成绩,跑完了400米! 随后,它又在不需要额外训练的情况下,完成了1.4米的跳远。 是的,相信你已经注意到了...
-
AIGC实战——Transformer模型
AIGC实战——Transformer模型 0. 前言 1. T5 2. GPT-3 和 GPT-4 3. ChatGPT 小结 系列链接 0. 前言 我们在 GPT (Generative Pre-trained Transfo...
-
腾讯游戏亮相GDC 2024,围绕AI等多项技术议题与全球游戏从业者分享交流
当地时间3月18日-3月22日,被誉为“游戏界春晚”的2024游戏开发者大会GDC(GameDevelopersConference,简称GDC)于美国旧金山举办,共计近3万位来自世界各地的游戏从业者汇聚于此,交流探讨游戏产业最新发展动态。 GDC创办于1...
-
揭秘Baichuan 3超越GPT-4的中文实力!文心一言、GLM 4.0也甘拜下风?全方位对比测试大揭秘!
AI界的焦点再度聚集!1月29日,百川智能推出了超千亿参数的大语言模型Baichuan 3,瞬间在科技圈点燃了热情。不同于其他模型,Baichuan 3在中文各项评测中都有惊艳表现,甚至在任务上超越了GPT-4,成为了新的领头羊。 Baichuan 3不...
-
AI模型训练:强化算法与进化算法
强化学习算法(RL 和进化算法(EA 都属于机器学习领域的子集,但它们在解决问题的方法和思想上有所不同。 强化学习算法: 强化是一种机器学习范式,它主要关注的是智能体(agent 在与环境进行交互的过程中,通过尝试和错误来学习最优的行为策略,以使其在某...
-
腾讯发布自研游戏AI引擎:3D城市布局效率提升百倍,UGC工具已上线《元梦之星》
腾讯游戏,现在连引擎都有AI味儿了—— 就在游戏开发者大会(GDC)上,腾讯刚刚发布自研游戏AI引擎GiiNEX。 官方介绍,基于生成式AI和决策AI技术,GiiNEX可以支持游戏从研发到运营的全生命周期需求。 具体来说,无论是AI NPC的对话生成,还是...
-
人工智能模型提供支持,谷歌拟在印度提供肺结核、肺癌等疾病筛查服务
3 月 19 日消息,谷歌今日官宣了一系列在医疗保健行业部署 AI 模型的计划。根据计划,谷歌研究团队和其拥有的 Fitbit 公司正在开发一系列新的人工智能功能:从腕带中提取数据并指导用户的个人健康,该工具由谷歌人工智能模型 Gemini 提供支持...
-
机器学习:Github上排名前19个强化学习 (RL)项目
强化学习 (RL 是一种机器学习,使代理能够通过反复试验来学习。强化学习算法用于各种应用,包括游戏、机器人和金融。 RL 的目标是找到一种最大化预期长期回报的策略。强化学习算法通常分为两类:基于模型的算法和无模型的算法。基于模型的强化学习算法构建环境模...
-
AI大模型控制红绿灯,港科大(广州)智慧交通新成果已开源
大模型“上路”,干起了交通信号控制(TSC)的活~ 模型名为LightGPT,以排队及不同区段快要接近信号灯的车辆对路口交通状况分析,进而确定最好的信号灯配置。 该模型由香港科技大学(广州)的研究团队提出,其背后关键是一个名为LLMLight的框架。...
-
大模型能自己优化Prompt了,曾经那么火的提示工程要死了吗?
2022 年底,ChatGPT 上线,同时引爆了一个新的名词:提示工程(Prompt Engineering)。 简而言之,提示工程就是寻找一种编辑查询(query)的方式,使得大型语言模型(LLM)或 AI 绘画或视频生成器能得到最佳结果或者让用户能绕...
-
刷榜「代码生成」任务!复旦等发布StepCoder框架:从编译器反馈信号中强化学习
大型语言模型(LLMs)的发展极大地推动了代码生成领域的发展,之前有工作将强化学习(RL)与编译器的反馈信号集成在一起,用于探索LLMs的输出空间,以提高代码生成质量。 但当下还存在两个问题: 1. 强化学习探索很难直接适配到「复杂的人类需求」,即要求L...
-
首个自主完成人类任务机器人出现,五指灵活速度超人,大模型加持虚拟空间训练
这周,由OpenAI,微软,贝佐斯,英伟达投资的机器人公司Figure AI融资接近7亿美元,号称在1年之内要做出等独立行走工作的人形机器人。 而特斯拉的擎天柱也屡屡传出好消息。 没人怀疑,今年会是人形机器人爆发的一年。 一家位于加拿大的机器人公司San...
-
理解世界,最新综述开启自动驾驶新时代~
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 在快速发展的自动驾驶领域,准确预测未来事件并评估其影响的能力对安全性和效率至关重要,对决策过程至关重要。世界模型已经成为一种变革性的方法,使自动驾驶系统能够合成和解释大...
-
LeCun最新专访:为什么物理世界终将成为LLM的「死穴」?
在人工智能领域,很少有像 Yann LeCun 这样的学者,在 65 岁的年龄还能高度活跃于社交媒体。 一直以来,Yann LeCun 都是以「直言不讳的批评者」形象活跃于人工智能领域。他始终支持开源,并带领 Meta 的团队推出了占据如今开源大模型领域...
-
谷歌工程师硬核长篇预测,证实黄仁勋观点:AGI或在2029年出现,AI五年内通过人类测试
最近,英伟达CEO黄仁勋表示,AI会在五年内通过人类测试,AGI将很快到来! 在斯坦福大学举行的一个经济论坛上,黄仁勋回答了这个问题:人类何时能创造像人类一样思考的计算机? 这也是硅谷的长期目标之一。 老黄是这样回答的:答案很大程度上取决于我们如何定义...
-
扩散模型如何构建新一代决策智能体?超越自回归,同时生成长序列规划轨迹
设想一下,当你站在房间内,准备向门口走去,你是通过自回归的方式逐步规划路径吗?实际上,你的路径是一次性整体生成的。 近期的研究表明,采用扩散模型的规划模块能够同时生成长序列的轨迹规划,这更加符合人类的决策模式。此外,扩散模型在策略表征和数据合成方面也能为...
-
AIGC启示录:深度解析AIGC技术的现代性与系统性的奇幻旅程
✨✨ 欢迎大家来访Srlua的博文(づ ̄3 ̄)づ╭❤~✨✨ ?? 欢迎各位亲爱的读者,感谢你们抽出宝贵的时间来阅读我的文章。 我是Srlua小谢,在这里我会分享我的知识和经验。? 希望在这里,我们能一起探索IT世界的奥妙,提升我们的技能。?...
-
近屿智能完成A轮融资,打造行业领先的AIGC工程师与产品经理成长蓝图
2024年1月,上海近屿智能科技有限公司(简称近屿智能)成功完成了A轮融资,智望资本担任了领投角色,而金沙江创投也进行了追加投资。这一融资里程碑充分证明了近屿智能在AIGC行业的技术领先地位得到了市场的广泛认可和投资人的青睐。 自创立伊始,近屿智能始...
-
近屿智能完成A轮融资,独家打造的AIGC工程师与产品经理学习路径图成行业焦点
2024年1月,上海近屿智能科技有限公司(以下简称近屿智能)宣布成功完成A轮融资,由智望资本领投,金沙江创投追加投资。这一重大融资事件不仅象征着近屿智能在AIGC领域的领先地位得到了市场的广泛认可,更凸显了投资人对近屿智能技术实力与未来发展潜力的坚定信心。...
-
抖音推出全新AI社交产品“话炉” 能陪你闲扯还能讲故事、猜谜语
据Tech星球的报道,抖音再次推出了全新的社交产品“话炉”,这次加入了AI的元素。继多闪、飞聊之后,抖音再次在社交领域发力。 “话炉”是一款基于字节旗下云雀大模型驱动的角色聊天产品。用户可以通过与个性鲜明、背景各异的AI角色实时聊天互动,满足闲谈生活日常、...
-
十大必知的人工智能算法
随着人工智能技术(AI)的日益普及,各种算法在推动这一领域的发展中发挥着关键作用。从预测房价的线性回归到自动驾驶汽车的神经网络,这些算法在背后默默支撑着无数应用的运行。 今天,我们将带您一览这些热门的人工智能算法(线性回归、逻辑回归、决策树、朴素贝叶斯...
-
十年内出现AGI?下一代Gemini能感知环境?DeepMind CEO哈萨比斯畅谈AI
「如果我们在未来十年内拥有类似 AGI 的系统,我不会感到惊讶。」Google DeepMind 联合创始人和 CEO Demis Hassabis 近日在人工智能播客节目 Dwarkesh Podcast 上如是说。 在长达一个小时的节目中,Hassa...
-
大视频模型是世界模型?DeepMind/UC伯克利华人一作:预测下一帧就能改变世界
没人怀疑,OpenAI开年推出的史诗巨作Sora,将改变视频相关领域的内容生态。 但Google DeepMind、UC伯克利和MIT的研究人员更进一步,在他们眼里,「大视频模型」也许能够像世界模型一样,真正的做到理解我们身处的这个世界。 论文地址:h...
-
Think2Drive:首个用于自动驾驶的基于模型的RL方法(上海交大)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在CARLA v2中以专家级的熟练程度运行。 题目:Think2Drive: Efficient Reinforcement Learning by Thinking in Latent World...
-
LLaMa 3或将推迟到7月发布,剑指GPT-4,从Gemini吸取教训
过去的图像生成模型常被人们诟病人物主要以「白人」为主,而谷歌 Gemini 正在因为它的矫枉过正而深陷翻车风波。它「过度谨慎」的文生图结果会与历史事实出现极大偏差,让用户们瞠目结舌。谷歌表示,该模型变得比开发者预期的更加谨慎。这不仅体现在生成图片的问题上...
-
研究人员开发AI攻击方法BEAST:可在一分钟内绕过LLM防护栏
研究人员在美国马里兰大学成功开发了一种高效的方法,可以在一分钟内诱导大型语言模型(LLM)产生有害反应,他们将这一技术命名为BEAST(BEAm Search-based adversarial aTtack 。BEAST技术利用Nvidia RTX A6...
-
与人类贴身热舞!人形机器人进阶到街头耍宝,6华人组团出品
注意看,小帅一个转身,卫衣帽子里面居然 空 无 一 头: 好啦,这不是惊悚恐怖片,而是来自UCSD(加州大学圣地亚哥分校)全华人团队的最新研究成果。 他们提出一种特别的全身控制策略(ExBody),能对人形机器人进行全身控制。策略主要训练人形机器人上半...
-
近屿智能发布AIGC大模型工程师和产品经理学习路径图
近日,上海近屿智能科技有限公司(下称“近屿智能”),基于其在大模型研发和产品设计领域深厚的专业积累,终于总结出AIGC大模型工程师与产品经理的学习路线图。该学习路线图不仅为追求专业发展的学习者提供了一条清晰明确的AIGC大模型学习路径,更为整个AIGC大模...
-
南大俞扬深度解读:什么是「世界模型」?
随着媒体狂炒Sora,OpenAI的介绍材料中称Sora是「world simulator」,世界模型这个词又进入视野,但很少有文章来介绍世界模型。 这里回顾一下什么是世界模型,以及讨论Sora是不是world simulator。 什么是world...
-
全球最强开源大模型一夜易主!谷歌Gemma 7B碾压Llama 2 13B,今夜重燃开源之战
一声炸雷深夜炸响,谷歌居然也开源LLM了?! 这次,重磅开源的Gemma有2B和7B两种规模,并且采用了与Gemini相同的研究和技术构建。 有了Gemini同源技术的加持,Gemma不仅在相同的规模下实现SOTA的性能。 而且更令人...
-
可控核聚变新里程碑!AI成功预测等离子体撕裂登Nature,清洁能源「圣杯」更近一步
可控核聚变,又有新突破了! 长期以来,核聚变一直受着一个「幽灵」的困扰——等离子体不稳定性问题。 而最近,普林斯顿团队用AI提前300毫秒预测了核聚变等离子不稳定态,这个时间,就足够约束磁场调整应对等离子体的逃逸! 从此,科学家可以防止可控核聚变的中断,...