-
秒杀GPT-4、Devin,全球最强AI程序员来啦!
今年3月,AI初创公司Cognition发布的首个AI程序员Devin引起巨大轰动,它可以像人一样实现端到端的部署、调试、优化代码,几乎与编程相关的任务都能自动化完成。 今天,Cosine发布了同类产品Genie,但在权威测试平台SWE-Bench上的评分...
-
Kimi创始人套现4000万美元疑云|「商汤」大模型一体机可节约80%推理成本,完成云端边全栈布局|中国AI活化石,熬成AIGC第一股| 谁在制造小米汽车?
Kimi创始人套现4000万美元疑云 「商汤」大模型一体机可节约80%推理成本,完成云端边全栈布局 苹果卷开源大模型,公开代码、权重、数据集、训练全过程,OpenELM亮相 特斯拉的反围剿战术还剩下啥? 腾讯出手,投了家创新药公司 谁在制造小米汽车? 估值...
-
GitHub Accelerator 2024扶持11个开源 AI 项目 推动技术创新
GitHub 最新宣布了其2024年加速器计划,将支持11个前沿的开源人工智能项目。这些入选项目涵盖了机器学习框架、生物医学研究、AI 模型测试平台等多个领域,旨在推动 AI 技术的创新和应用。 根据计划,每个入选项目将获得高达40,000美元的赞助资金,...
-
ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验
一、ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验 ROCm:一个可移植、高性能的GPU计算平台 随着AI时代的来临,显卡的作用不再仅仅只局限于游戏,特别是在Stable Diffusion火爆全网之后,越来越多的玩家...
-
快手程一笑:快意大模型或在半年内达 GPT4.0 水平
今日,快手公司发布了其2023年第四季度及全年业绩报告,数据显示,快手在2023年全年实现了显著的收入增长,总收入高达1134.7亿元,同比增长了20.5%。更值得一提的是,经过调整后,快手的净利润首次突破了百亿元大关,达到了102.7亿元。 在随后的业绩...
-
快手CEO程一笑:自研大模型有信心半年内达GPT4.0水平
快科技3月20日消息,今日,快手发布2023年第四季度及全年业绩,2023全年总收入达1134.7亿元,同比增长20.5%,经调整净利润首次超百亿达102.7亿元。 据媒体报道,在快手业绩电话会上,快手创始人兼CEO程一笑透露,2023年公司启动AI战略后...
-
谷歌掀桌子!开源Gemma:可商用,性能超过Llama 2!
2月22日,谷歌在官网宣布,开源大语言模型Gemma。 Gemma与谷歌最新发布的Gemini 使用了同一架构,有20亿、70亿两种参数,每种参数都有预训练和指令调优两个版本。 根据谷歌公布的测试显示,在MMLU、BBH、GSM8K等主流测试平台中,其...
-
Think2Drive:首个用于自动驾驶的基于模型的RL方法(上海交大)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在CARLA v2中以专家级的熟练程度运行。 题目:Think2Drive: Efficient Reinforcement Learning by Thinking in Latent World...
-
“谷歌版Sora”被嘲画质好糊,但在世界模拟器上又前进了一步
谷歌110亿参数Genie,用来打造交互虚拟世界,它来了! 划重点:不受视频监督训练;只用给它单张图像,就能提示生成可玩的2D虚拟世界;这个交互式的虚拟世界还自主可控。 但令人撇嘴的点,就是Genie最后出的效果,画质太糊了。 像这样: 或者这样:...
-
GPT-4/Gemini大翻车,做旅行攻略成功率≈0%!复旦OSU等华人团队:Agent不会复杂任务规划
AI智能体,是目前学界炙手可热的前沿话题,被众多专家视为大模型发展的下一个方向。 然而,最近复旦、俄亥俄州立大学、宾夕法尼亚州立大学、Meta AI的研究者们发现,AI智能体在现实世界的规划能力还很差。 他们对GPT-4 Turbo、Gemini Pro...
-
像人类一样在批评中学习成长,1317条评语让LLaMA2胜率飙升30倍
现有的大模型对齐方法包括基于示例的监督微调(SFT)和基于分数反馈的强化学习(RLHF)。然而,分数只能反应当前回复的好坏程度,并不能明确指出模型的不足之处。相较之下,我们人类通常是从语言反馈中学习并调整自己的行为模式。就像审稿意见不仅仅是一个分数,还包...
-
在Meteor Lake上测试基于Stable Diffusion的AI应用
上个月刚刚推出的英特尔新一代Meteor Lake CPU,预示着AI PC的新时代到来。AI PC可以不依赖服务器直接在PC端处理AI推理工作负载,例如生成图像或转录音频。这些芯片的正式名称为Intel Core Ultra处理器,是首款配备专门用于处理...
-
新一代图像合成模型:Stable Diffusion XL(SDXL)上线!
几个使用Stable Diffusion XL 1.0生成的图像示例。 新的SDXL 1.0发布允许在本地计算机上运行的高分辨率人工智能图像合成。 周三,Stability AI发布了其下一代开源权重人工智能图像合成模型Stable Diff...
-
Llama2推理RTX3090胜过4090,延迟吞吐量占优,但被A800远远甩开
大型语言模型 (LLM 在学界和业界都取得了巨大的进展。但训练和部署 LLM 非常昂贵,需要大量的计算资源和内存,因此研究人员开发了许多用于加速 LLM 预训练、微调和推理的开源框架和方法。然而,不同硬件和软件堆栈的运行时性能可能存在很大差异,这使得选...
-
一篇综述,看穿基础模型+机器人的发展路径
机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑,帮助机器人感知和理解这个世界并制定决策和进行规划。 近日,CMU 的 Yonatan Bisk 和 Google DeepMind...
-
是否值得衡量软件开发人员的工作效率?
大多数公司都致力于数字战略,并在寻找提高员工生产率的方法,与此同时,开发人员稀缺,对新软件的需求很高。Gartner的高级总监兼分析师Keith Mann表示,这激发了人们对理解和衡量开发人员生产率的兴趣。“公司需要最大限度地利用有限数量的开发人员,...
-
用GPT-2监督GPT-4,防止AI毁灭人类? OpenAI Ilya超级对齐团队首篇论文出炉
就在刚刚,OpenAI首席科学家Ilya领衔的超级对齐团队,发布了成立以来的首篇论文! 团队声称,已经发现了对超人类模型进行实证对齐的新研究方向。 未来超级AI系统对齐的一个核心挑战——人类需要监督比自己更聪明人工智能系统。 OpenAI的最新研究做了...
-
springboot + websocket对接文心一言接口实现简单上下文聊天(贴代码)
文章目录 参考 先看看效果 文心千帆创建应用 思路 步骤与代码 如题,第一次用websocket,做了个这玩意,只做了上下文的聊天,没做流式。 中间还有个低级报错但卡了好久,具体可以看【错误记录】websocket连接失败,但后端毫无...
-
ChatGPT唤醒AI游戏:AIGC持续走深,游戏或成AI最佳抓手
随着人工智能技术的不断发展,AI在游戏行业的应用日益深入。本文将详细探讨ChatGPT在AI游戏领域的应用,以及游戏如何成为AI技术的最佳抓手。让我们一起探讨这个有趣且充满潜力的领域。 一、引言 人工智能在各行各业都取得了巨大的成功,而游戏行业更是展...
-
字节跳动AB实验经验分享:企业如何构建数据驱动的实验文化?
更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 近日,CCF TF 举办了第 123 期分享活动,本期主题为“用户体验工程”。 CCF TF 是中国计算机学会为企业界计算机专业人士创建的企业间常态化合作交流平台,...
-
Agent4Rec来了!大模型智能体构成推荐系统模拟器,模拟真实用户交互行为
一直以来,推荐系统领域面临模型线上线下效果差距大的痛点问题,昂贵的线上 A/B 测试成本使得广大研究人员望而却步,也造成学术界的推荐系统研究与工业界的实际应用间的巨大割裂。随着大语言模型展现出类人的逻辑推理和理解能力,基于大语言模型的智能体(Agent)...
-
新加坡推Agent4Rec 大模型智能体构成推荐系统模拟器
推荐系统领域长期存在线上线下效果差距大的问题,Agent4Rec通过构建大语言模型智能体,模拟真实用户行为,为解决这一问题提供了新的思路。在Agent4Rec中,每个用户智能体由个性化模块构成,根据用户历史交互生成电影偏好,模拟用户在推荐系统中的行为。通过...
-
ViCANdo — 智能驾驶数据采集及数据分析平台
随着智能化在汽车工业快速推进,智能驾驶系统的复杂程度已经远超一般的汽车,为了确保车辆系统的可靠性,研发中对产品功能的验证和测试流程必不可少。经纬恒润基于ViCANdo软件,为智能驾驶测试提供从数据采集到数据分析全流程的解决方案,帮助智能驾驶...
-
对比GPU,使用FPGA创建神经网络
当代的CPU按照一维方式进行计算,顺序执行指令,并将算法分解为逐条加载和执行的指令。然而,未来的计算发展趋势表明,我们将越来越多地依赖硬件加速器来支持并行执行,这将成为计算的常态。这种发展趋势将统一算法和硬件结构的利用,从而实现更快、更高效的解决方案。...