-
AIGC时代,仅用合成数据训练模型到底行不行?来一探究竟 | CVPR 2024
首个针对使用合成数据训练的模型在不同稳健性指标上进行详细分析的研究,展示了如SynCLIP和SynCLR等合成克隆模型,其性能在可接受的范围内接近于在真实图像上训练的对应模型。这一结论适用于所有稳健性指标,除了常见的图像损坏和OOD(域外分布)检测。另一方...
-
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大语言模型还能向上突破,OpenAI 再次证明了自己的实力。 北京时间9月13日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题...
-
AI设计自己,代码造物主已来!UBC华人一作首提ADAS,数学能力暴涨25.9%
【新智元导读】AI掌握自我设计的权力,将会怎样?最近,来自UBC等机构研究人员提出了「智能体自动化设计」系统,让元智能体使用搜索算法,自动构建强大的同类。 AI训AI已经老生常谈了,那么,AI能够设计出更强的AI吗? 这不,来自UBC等机构的研究人员提出了...
-
AI爆料人遭全网封禁!OpenAI等25个机构祭大招,一眼辨别AI机器人
【新智元导读】AI智能体遍布整个网络,未来如何防止被骗?如何保护隐私?OpenAI微软MIT等25个机构联手提出「人格凭证」,可以证明自己是真人,还不用披露任何个人信息。 最近半个月,全网竟被一个OpenAI的「AI爆料人」愚弄了。 听到「草莓哥」@iru...
-
每日AIGC最新进展(31):新加坡国立大学提出视频生成人类评估协议、加州大学提出视频生成测试基准TC-Bench、清华大学提出视频编辑新方法COVE
Diffusion Models专栏文章汇总:入门与实战 Rethinking Human Evaluation Protocol for Text-to-Video Models: Enhancing Reliability,Reproducibi...
-
微软发布Phi-3 Mini,性能媲美GPT-3.5、Llama-3,可在手机端运行
前言 微软发布了最新版的Phi系列小型语言模型(SLM - Phi-3。这个系列包括3个不同参数规模的版本:Phi-3 Mini (38亿参数 、Phi-3 Small (70亿参数 和Phi-3 Medium (140亿参数 。 Phi系列模型是微...
-
用ControlNet+Inpaint实现stable diffusion模特换衣
用ControlNet+Inpaint实现stable diffusion模特换衣 ControlNet 训练与架构详解 ControlNet 的架构 用于文本到图像扩散的 ControlNet 训练过程...
-
RAFT:引领 Llama 在 RAG 中发展
每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同...
-
自回归模型的优缺点及改进方向
在学术界和人工智能产业中,关于自回归模型的演进与应用一直是一个引发深入讨论和多方观点交锋的热门议题。尤其是Yann LeCun,这位享誉全球的AI领域学者、图灵奖的获得者,以及被誉为人工智能领域的三大巨擘之一,他对于自回归模型持有独特的批判视角。值得注意...
-
射频识别技术如何加强安全措施?
射频识别(RFID 技术的历史可以追溯到20世纪80年代初,但直到最近几年才得到广泛采用。 这种高效、经济的创新技术在世界各地的组织中发挥着微妙但强大的作用,其带来的好处比其提供的安全增强更直接。本文将进一步了解RFID技术是如何用于加强企业安全的。...
-
特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了
特斯拉人形机器人又解锁了新技能! 昨日,Tesla Optimus 官方发布了新的 demo 视频,展示了二代 Optimus 人形机器人的最新进展。 这次,Optimus 开始进厂打工了,在特斯拉电池工厂学会了分装电池,并且比以前走得更快更远更稳了。...
-
工业4.0革命:预测性维护成功的四阶段蓝图
为工业4.0设计预测性维护解决方案代表着企业维护和运营方式的范式转变。通过使用先进的预测性维护技术,主动预防运营挑战是这个新工业时代的关键方面。这些解决方案不仅有助于获取新的收入来源和节省运营成本,而且在防止停工和生产停机方面也发挥着重要作用。 尽管机...
-
人工智能中的数据安全:如何释放人工智能的力量
在数字时代,数据通常被视为驱动创新机器和推动业务决策的电池。随着人工智能(AI 和机器学习(ML 等现代解决方案的兴起,组织可以访问大量数据,这些数据足以获得有价值的见解并做出明智的决策。然而,这是以随后的数据丢失和保密性挑战为代价的。 随着组织不断掌...
-
波士顿动力新版人形机器人Atlas问世,纯电驱动
我们见证了新一代人形机器人 Atlas 的诞生。 新机器人的视频一出,我们立即理解了波士顿动力为何退役已开发十多年的旧版 Atlas—— 人形机器人,现在应该有的是超越人类的灵活性。 Atlas 机器人躺平在实验室的地板上,看起来是仰卧,但突然关节反转站...
-
“真假难辨”!巧用NeRF生成的自动驾驶仿真数据
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 神经辐射场(NeRF)已成为推进自动驾驶(AD)重新搜索的有前途的工具,提供可扩展的闭环模拟和数据增强功能。然而,为了信任模拟中获得的结果,需要确保AD系统以相同的方式...
-
Claude 3 Haiku官网体验入口 企业级AI模型软件工具app免费使用地址
Claude 3 Haiku是Anthropic公司最新推出的企业级AI模型,具有出色的视觉能力和卓越的基准测试表现。以下是关于该模型的详细介绍: 点击前往「Claude 3 Haiku」官网体验入口 Claude 3 Haiku特点 快速处理和分析...
-
Anthropic 推出 Claude 3 Haiku:一款最快、最经济的 AI 模型
人工智能技术领域的领先者Anthropic公司最近发布了其最新的Claude3AI模型系列成员,名为Claude3Haiku。这款全新的智能产品被定位为速度最快、成本最实惠的型号,在提供先进的视觉功能和行业标准性能的同时,为企业客户提供了全方位的选择。 H...
-
前谷歌大佬离职创业,不到一年造出GPT3.5和Gemini Pro,惨痛忠告:GPU简直菜鸡,就像是买彩票!
作者 | Yi Tay 编译 | 云昭 出品 | 51CTO技术栈(微信号:blog51cto) 你敢相信吗?一位前谷歌大佬,离职成立公司,不到一年,从头训练出了“GPT3.5”/“Gemini Pro”,注意,后者是多模态大模型! 本文主人公Y...
-
OccFusion:一种简单有效的Occ多传感器融合框架(性能SOTA)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 对3D场景的全面理解在自动驾驶中至关重要,最近的3D语义占用预测模型已经成功地解决了描述具有不同形状和类别的真实世界物体的挑战。然而,现有的3D占用预测方法在很大程度上依赖于全景相机图像,这使得它们容...
-
研究人员推新AI框架CyberDemo:通过视觉观察让机器人模仿学习
加利福尼亚大学圣地亚哥分校(UCSD)和南加利福尼亚大学(USC 的研究人员最近推出了一种名为 CyberDemo 的新型人工智能框架,旨在通过视觉观察进行机器人模仿学习。 传统的模仿学习方法通常需要大量高质量的示范数据来教导机器人完成复杂任务,特别是对...
-
基于视频采集模块的现代监控技术探析
在当今数字化时代,视频监控系统以其高效性、便捷性及安全性的特点,已经成为城市安全管理和社会治安管理不可或缺的一环。而作为监控系统的“眼睛”和“耳朵”,视频采集模块发挥着举足轻重的作用。本文将围绕视频采集模块的功能原理、技术特性以及在现代社会的多元化应用等层...
-
全面超越GPT-4,Claude 3终于来了,有大学生智商,支持百万token
大模型的纯文本方向,已经卷到头了? 刚刚,OpenAI 最大的竞争对手 Anthropic 发布了新一代 AI 大模型系列 ——Claude3。 该系列包含三个模型,按能力由弱到强排列分别是 Claude3Haiku、Claude3Sonnet 和 Cla...
-
微软发布PyRIT,用于识别生成式AI系统中的风险
2月26日消息,据外媒报道,微软发布了一个名为PyRIT的开放访问自动化框架,用于主动识别生成式AI系统中的风险。 微软人工智能红色团队负责人Ram Shankar Siva Kumar表示,红色团队工具旨在“使全球每个组织都能利用最新的人工智能进步进...
-
掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台
通过我们的指南了解如何为您的企业释放人工智能的力量。了解 RAG 和 CRAG 集成、矢量嵌入、LLM 和提示工程。非常适合负责任地拥抱人工智能的企业。 为企业打造AI-Ready平台 企业在引入生成式人工智能时,会遇到许多需要战略管理的业务风险。这...
-
什么是预训练Pre-training—— AIGC必备知识点,您get了吗?
Look!?我们的大模型商业化落地产品 ?更多AI资讯请??关注 Free三天集训营助教在线为您火热答疑??? 随着人工智能(AI 不断重塑我们的世界,其发展的一个关键方面已经成为现代机器学习模型的支柱:预训练。在本篇文章中,我们将探讨预训练的概...
-
不分割成token,直接从字节中高效学习,Mamba原来还能这样用
在定义语言模型时,通常会使用一种基本分词方法,把句子分为词(word)、子词(subword)或字符(character)。其中,子词分词法一直是最受欢迎的选择,因为它在训练效率和处理词汇表外单词的能力之间实现了自然的折中。然而,一些研究指出了子词分词法...
-
Depth Anything:释放大规模无标注数据的深度估计
本文经自动驾驶之心公众号授权转载,转载请联系出处。 24年1月论文“Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data“,来自香港大学、字节、浙江实验室和浙江大学。 这项...
-
近200+自动驾驶数据集全面调研!一览如何数据闭环全流程
写在前面&个人理解 自动驾驶技术在硬件和深度学习方法的最新进展中迅速发展,并展现出令人期待的性能。高质量的数据集对于开发可靠的自动驾驶算法至关重要。先前的数据集调研试图回顾这些数据集,但要么集中在有限数量的数据集上,要么缺乏对数据集特征的详细调查...
-
链世界:一种简单而有效的人类行为Agent模型强化学习框架
强化学习是一种机器学习的方法,它通过让智能体(Agent)与环境交互,从而学习如何选择最优的行动来最大化累积的奖励。强化学习在许多领域都有广泛的应用,例如游戏、机器人、自动驾驶等。强化学习也可以用于干预人类的行为,帮助人类实现他们的长期目标,例如戒烟、减...
-
Camera or Lidar?如何实现鲁棒的3D目标检测?最新综述!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 0. 写在前面&&个人理解 自动驾驶系统依赖于先进的感知、决策和控制技术,通过使用各种传感器(如相机、激光雷达、雷达等)来感知周围环境,并利用算法和模型进行实时分析和决策。这使得车辆...
-
Llama 2- Open Foundation and Fine-Tuned Chat Models<3>
3.4 RLHF 结果 3.4.1 基于模型的评估 评估LLMs是一个具有挑战性的开放研究问题。人类评估虽然是黄金标准,但可能会因各种 HCI 考虑因素而变得复杂(Clark 等人,2021;Gehrmann 等人,2023),并且并不总是可扩展的...
-
Stable Diffusion中不同的采样方法
在 Stable Diffusion 模型中,采样方法是从学习到的概率分布中生成图像的算法。采样方法影响生成图像的质量、样式、速度以及过程的控制程度。以下是一些采样方法的概述和它们对图像生成可能产生的影响: DPM++系列 DP...
-
视觉Mamba模型的Swin时刻,中国科学院、华为等推出VMamba
Transformer 在大模型领域的地位可谓是难以撼动。不过,这个AI 大模型的主流架构在模型规模的扩展和需要处理的序列变长后,局限性也愈发凸显了。Mamba的出现,正在强力改变着这一切。它优秀的性能立刻引爆了AI圈。 上周四, Vision Mamb...
-
ConvNet与Transformer谁更强?Meta评测4个领先视觉模型,LeCun转赞
如何根据特定需求选择视觉模型? ConvNet/ViT、supervised/CLIP模型,在ImageNet之外的指标上如何相互比较? 来自MABZUAI和Meta的研究人员发表的最新研究,在「非标准」指标上全面比较了常见的视觉模型。 论文地址:ht...
-
请查收使用OpenAI的Whisper进行语音识别的攻略
Whisper是一种令人激动的新型语言模型,采用了全新的语音识别方法,即使是低质量的音频,Whisper也能产生高质量的结果,并且对各种声音和语言的适应性极强,无需进行微调。 Whisper是开源的,有一系列可用的模型尺寸,可以作为众多语音转文字应用的有...
-
大模型伪装「潜伏特工」学会欺骗!OpenAI劲敌重磅研究震惊马斯克
不要教LLM学会骗人!不要教LLM学会骗人!不要教LLM学会骗人! 因为后果可能会很严重,甚至超出人类的想象。 最近,AI初创公司Anthropic的研究表明,一旦LLM学会了人类教授的欺骗行为,它们就会在训练和评估的过程中隐藏自己,并在使用时偷偷输出恶...
-
谷歌AI通过图灵测试,大模型医生来了?GPT-4竟诊断出难倒17个医生的怪病
【新智元导读】AI在医疗领域再次发光!谷歌DeepMind团队发布的全新诊断对话式AI在测试中击败医生,通过了图灵测试,再次引领医疗AI的革命。 我们需要研发对人类有益AGI的原因之一: OpenAI联创Greg Brockman的一番话点明,当前先进A...
-
李飞飞团队新作:AI透视眼,穿越障碍看清你,渲染遮挡人体有新突破了
AR/VR 、电影和医疗等领域都在广泛地应用视频渲染人类形象。由于单目摄像头的视频获取较为容易,因此从单目摄像头中渲染人体一直是研究的主要方式。Vid2Avatar、MonoHuman 和 NeuMan 等方法都取得了令人瞩目的成绩。尽管只有一个摄...
-
生成式人工智能泡沫将于2024年破灭
由于法律挑战、技术限制以及概念框架根本性转变的需要,生成式人工智能泡沫将在2024年破灭。 像ChatGPT这样的项目因其改变人类生活各个方面的潜力而闻名,但由于预期的破坏似乎难以捉摸,因此面临着审查。 随着技术行业寻求克服众多挑战,有必要进行重新调整...
-
这次重生,AI要夺回网文界的一切
重生了,这辈子我重生成了 MidReal。一个可以帮别人写「网文」的 AI 机器人。 这段时间里,我看到很多选题,偶尔也会吐槽一下。竟然有人让我写写 Harry Potter。拜托,难道我还能写的比 J・K・Rowling 更好不成?不过,...
-
LLaMA 简介:一个具有 650 亿参数的基础大型语言模型 官网介绍
2023 年 2 月 24 日 更新:我们刚刚推出了Llama 2 - 有关最新信息的更多信息,请参阅我们关于 Llama 2 的博客文章。 作为 Meta 致力于开放科学的一部分,今天我们公开发布 LL...
-
CMU权威对比Gemini,GPT-3和Mistral8×7B!GPT-3.5依旧拿捏Gemini,开源模型差距依然不小
谷歌最近发布的Gemini掀起了不小的波澜。 毕竟,大语言模型领域几乎是OpenAI的GPT一家独大的局面。 不过作为吃瓜群众,当然希望科技公司都卷起来,大模型都打起来! 所以,作为科技巨无霸谷歌的亲儿子,Gemini自然承受了很高的期待。 虽然Gemi...
-
【LLM】LLaMA简介:一个650亿参数的基础大型语言模型
LLaMA简介:一个650亿参数的基础大型语言模型 Paper Setup 其他资料 作为 Meta 对开放科学承诺的一部分,今天我们将公开发布 LLaMA (大型语言模型 Meta AI ,这是一个最先进的大型语言基础模型,旨在帮...
-
controlnet1.1模型和预处理器功能详解(各预处理器出稿对比及对应模型说明)
ControlNet 1.1 与 ControlNet 1.0 具有完全相同的体系结构,ControlNet 1.1 包括所有以前的模型,具有改进的稳健性和结果质量,且增加并细化了多个模型。 命名规范 项目名+版本号+标识+基础模型版本+功能...
-
AI图片编辑神器Anydoor:开启图片编辑的任意门 图片主体随意移动
随着数字时代图像编辑的飞速发展,来自香港大学、阿里巴巴和蚂蚁集团的新成果AnyDoor为图片编辑开辟了一扇全新的时代之门。 这是一项基于扩散技术的创新,具有将目标物体以和谐的方式传送到用户指定位置的神奇能力。与传统模型需要为每个物体调整参数不同,AnyDo...
-
手机上0.2秒出图、当前速度之最,谷歌打造超快扩散模型MobileDiffusion
在手机等移动端侧运行 Stable Diffusion 等文生图生成式 AI 大模型已经成为业界追逐的热点之一,其中生成速度是主要的制约因素。 近日,来自谷歌的一篇论文「MobileDiffusion: Subsecond Text-to-Image G...
-
Linux 中的机器学习:Whisper——自动语音识别系统
Whisper 是一种自动语音识别 (ASR 系统,使用从网络收集的 680000 小时多语言和多任务数据进行训练,Whisper 由深度学习和神经网络提供支持,是一种基于 PyTorch 构建的自然语言处理系统,这是免费的开源软件。 安装Whisp...
-
ChatGPT一周年,Altman霸气重返OpenAI!自曝回归内幕Ilya去向待定
ChatGPT一周年之际,OpenAI发文官宣:Sam Altman重启OpenAI! 一年前的今天,他作为CEO,正在做着ChatGPT上线前最后的准备工作。他应该怎么也想不到,上线后这一年,会发生这么多事情。 今天OpenAI,也戴上了庆祝自己生...
-
创新性AI系统SoG: 在各种游戏中击败人类,又能学习玩新游戏
在人工智能领域,使用游戏作为性能指标的传统悠久而广泛。EquiLibre Technologies、Sony AI、Amii和Midjourney等研究团队与Google DeepMind合作推出的“Student of Games”(SoG)算法,通过结...
-
历数5年89篇研究,这篇综述告诉我们深度学习中的代码数据增强怎么样了
当今深度学习以及大模型的飞速发展,带来了对创新技术的不断追求。在这一进程中,代码数据增强技术显现出其不可忽视的价值。 最近,由蒙纳士大学、新加坡管理大学、华为诺亚方舟实验室、北京航空航天大学以及澳大利亚国立大学联合进行的对近 5 年的 89 篇相关研究调...