-
一块钱100万token,超强MoE模型开源,性能直逼GPT-4-Turbo
开源大模型领域,又迎来一位强有力的竞争者。 近日,探索通用人工智能(AGI)本质的 DeepSeek AI 公司开源了一款强大的混合专家 (MoE 语言模型 DeepSeek-V2,主打训练成本更低、推理更加高效。 项目地址:https://gi...
-
智谱AI研发国产文生视频模型对标Sora 最快年内发布
据钛媒体报道,智谱 AI 正在研发对标 OpenAI Sora 的高质量文生视频模型,预计最快年内发布。 该公司是国内一家估值过200亿的 AI 大模型独角兽公司,成立于2019年,由清华大学计算机系的技术成转化而来。智谱 AI 已推出多个大模型产品,包括...
-
AI日报:白菜价!DeepSeek发布V2模型;零一万物发布最懂打工人的AI特助;ChatGPT.COM域名启用;全国首例“AI外挂”案公开宣判
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、DeepSeek发布V2模型...
-
苹果新产品明晚10点发布;曝iPhone 17 Slim新机型;昆仑万维净亏损1.87亿元;智谱AI正研发类“Sora”产品
出品 | 51CTO技术栈(微信号:blog51cto)一、商业圈 1.“AI教母”李飞飞首次创业,瞄准空间智能 李飞飞,著名华裔计算机科学家,因其在人工智能领域的卓越贡献而被誉为“AI教母”。根据国外媒体消息,李飞飞正在致力于她的首次创业——一家名为...
-
看透物体的3D表示和生成模型:NUS团队提出X-Ray
项目主页:https://tau-yihouxiang.github.io/projects/X-Ray/X-Ray.html 论文地址:https://arxiv.org/abs/2404.14329 代码地址:https://github.com...
-
苹果 AI 计划曝光:更智能的 Siri 即将到来
苹果在人工智能领域看似起步较晚,但最近的传闻和报告表明,苹果一直在等待时机,准备迈出重要一步。 据报道,苹果正在与 OpenAI 和谷歌合作,同时也在研发自己的模型 Ajax 从苹果公布的 AI 研究来看,公司的 AI 战略逐渐清晰。近期有消息称,苹果计划...
-
低成本LLM应用开发利器——开源FrugalGPT框架
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 本文将详细介绍一个LLM驱动型应用程序的成本节约架构FrugalGPT。 大型语言模型为计算机科学开辟了一个新的前沿;然而,它们(截至...
-
Meta训AI,成本已超阿波罗登月!谷歌豪言投资超千亿美元,赛过OpenAI星际之门
【新智元导读】近日访谈中,LeCun亲口证实:Meta为购入英伟达GPU已经花费了300亿美元,成本超过阿波罗登月。相比之下,微软和OpenAI打造的星际之门耗资1000亿美元,谷歌DeepMind CEO Hassabis则放出豪言:谷歌投入的,比这个数...
-
巨人网络发布2023年报:称将持续研究GiantGPT应用场景
4月29日,巨人网络发布2023年年度报告及2024年一季度报告。 报告显示,2023年公司实现营业收入29.24亿元,同比增长43.50%,实现归属于上市公司股东的净利润10.86亿元,同比增长27.67%;实现归属于上市公司股东的扣除非经常性损益的净利...
-
“地表最强”文生视频模型?Sora 背后有何秘密?
自 2022 年底 ChatGPT 的横空出世,人工智能再度成为全世界的焦点,基于大语言模型(LLM)的 AI 更是人工智能领域的“当红炸子鸡”。此后的一年,我们见证了 AI 在文生文、文生图领域的飞速进展,但在文生视频领域发展相对较慢。而在 2024 年...
-
写真视频击败Sora?人大自研全新多模态大模型Awaker 1.0震撼登场
在人工智能领域,人大系初创公司智子引擎近日发布了一款名为Awaker1.0的全新多模态大模型,标志着向通用人工智能(AGI)迈出了重要一步。该模型在写真视频效果上超越了Sora,展现了其在视觉生成方面的卓越能力。 4月27日,在中关村论坛的通用人工智能平...
-
Sora大片真相:人工特效参与,被指误导大众
啊?Sora火爆短片《气球人》,也“造假”了??? 背后艺术家团队的最新揭秘,可谓一石激起千层浪: 原来,视频画面并非完全由AI生成,其中有大量视觉效果需要人类后期实现。 be like: 这下网友不干了,合着大家伙儿跟OpenAI玩真心,OpenAI...
-
InstantMesh:新AI框架可在10秒内从2D图像生成高质量3D网格
根据研究团队发表的预印本文章,InstantMesh是由腾讯PCG ARC实验室和上海科技大学的研究人员开发的人工智能框架,能够在仅需10秒的时间内,从单个2D图像生成高质量的3D网格。 该开源框架由多视图扩散模型和3D网格重建模型组成,通过使用不同角度...
-
打破壁垒:生成式人工智能如何重塑数据分析场景
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 深入探讨生成式人工智能的原则和模型,以及它在数据分析中的应用。 面对快速变化的市场格局,企业必须不断寻求新的技术突破来保持领先地位。生...
-
震撼!GPT-4 Turbo级国产大模型登场,周冠宇F1赛事数据秒分析惊呆国际大佬
中国的大模型,已经震惊了外国科技圈。 这不,这几天商量大模型的更新,直接让外国网友惊呼:太疯狂了,中国的AI界究竟还有多少我们不知道的巨变? 不怪这些网友太大惊小怪——最近全新升级的日日新·商量大模型5.0(SenseChat V5),在基础能力上再次重...
-
奥特曼斯坦福演讲:专注当前AI局限性没用,GPT-5让一切努力过时
昨天,黄仁勋亲自为 OpenAI 送来了全球第一台 Nvidia DGX H200 超级计算机,三人合影(老黄、奥特曼、Greg Brockman )引得大家津津乐道。 大合影后,奥特曼也没闲着,现身斯坦福大学的 Nvidia 礼堂发表演讲,大约超过...
-
探讨自回归模型和扩散模型的发展应用
在当前大模型驱动的内容创新浪潮中,人工智能产业正以前所未有的力度拥抱一场由大模型技术策动的科技革新运动。这场革命不仅重塑了人机交互的边界,使其跃升至更高层次的认知协作,而且正在颠覆传统的计算思维与执行模式,催生出全新的计算范式,从而深刻地渗透并革新各行各...
-
百度:AI专利申请量、授权量国内第一
快科技4月26日消息,在第24个世界知识产权日来临之际,百度昨日举办专利运用赋能AI产业高质量发展”论坛。 在论坛上,百度首席技术官透露,百度在以大模型为核心的人工智能领域,其专利申请量和授权量在国内均位居第一,且在全球范围内处于领先地位。 特别是在深度学...
-
GPT-4现场被端侧小模型“暴打”,商汤日日新5.0:全面对标GPT-4 Turbo
够刺激,GPT-4竟然当众被“揍”了,甚至连还手的机会都没有: 是的,就是在一场《街头霸王》游戏现场PK中,发生了这样的名场面。 而且二者还是不在一个“重量级”的那种: 绿人:由GPT-4操纵 红人:由一个端侧小模型操纵 那么这位又小又彪悍的选...
-
在线地图还能这样?MapTracker:用跟踪实现在线地图新SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 太强了,在线高精地图还能用跟踪的方式来做!!!本文提出了一种矢量HD建图算法,该算法将在线高精建图公式化为跟踪任务,并使用memory latents的历史来确保随着时...
-
挑战拯救痴心“舔狗”,我和大模型都尽力了
天降猛男,大模型化身为 “痴情男大”,等待人类玩家的拯救。 一款名为 “拯救舔狗” 的大模型原生小游戏出现了。 游戏规则很简单:如果玩家在几轮对话内说服 “他” 放弃追求对他并无青睐的女神,就算挑战成功。 听起来并不难,然而游戏源于生活,模型人设是痴情属...
-
CVPR 2024 | 面向真实感场景生成的激光雷达扩散模型
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:Towards Realistic Scene Generation with LiDAR Diffusion Models 论文链接:https://hancyran.github.io/a...
-
微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了
Llama 3发布刚几天,微软就出手截胡了? 刚刚发布的Phi-3系列小模型技术报告,引起AI圈热议。 其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama 3 8B。 为了方便开源社区使用,还特意设计成了与Llama系列兼容的结...
-
首设大模型挑战赛,琶洲算法大赛为大模型应用赋能加速!
时隔一年,琶洲算法大赛再次强势如约回归。4月23日,2024年第三届琶洲算法大赛正式启动。本届大赛由广州市人民政府、中国人工智能学会联合主办,中国信息通信研究院、海珠区人民政府、广州市科学技术局、广州市工业和信息化局、广州市政务服务和数据管理局、人工智能...
-
新测试基准发布,最强开源Llama 3尴尬了
如果试题太简单,学霸和学渣都能考90分,拉不开差距…… 随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布,业界急需一款更难、更有区分度的基准测试。 大模型竞技场背后组织LMSYS推出下一代基准测试Arena-Hard,引起广泛关注。...
-
领域模型生产指南
领域模型脱胎于通用大模型,两者有相似之处,但通用大模型在训练时使用的是通识数据集,缺少领域知识,导致企业在应用过程中会发现一些问题。比如,如果我们要做一个滴普科技的智能问答机器人,但通用大模型并没有学习到滴普科技的各种产品信息,缺少先验知识。 目前这个问...
-
集体智慧:LLM预测能力与人群可相互媲美
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 现在,AI系统的预测准确率达到甚至超过了人群。 在不断发展的人工智能(AI)领域,语言模型已取得了重大进展,实现了曾经被认为人类认知...
-
AI日报:Model3模型重磅发布;阿里云全面支持Llama 3训练推理;Gorq推出iOS应用;批量去水印工具VSR来了
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Blockade Labs发布...
-
Krea AI将推视频生成功能 界面更加简洁美观了
Krea AI即将推出的视频生成功能,无疑将为设计领域带来新的革命。这个功能的推出,将使得用户能够轻松地生成高质量的视频内容,无论是用于广告、电影、游戏概念设计,还是用于社交媒体分享,都将变得非常方便。 产品入口:https://top.aibase.c...
-
重构、定义、引领,九章云极DataCanvas智算操作系统重磅发布
4月18日,2024九章云极DataCanvas智算操作系统新品发布会于北京隆重召开,全新产品DATACANVAS AIDC OS智算操作系统(以下简称AIDC OS)正式官宣。AIDC OS以卓越的AI技术实力和AI基础软件为根基,以重新定义和突破...
-
Meta 在 WhatsApp 中加入实时AI图像生成功能
当用户在与 Meta AI 的聊天中开始输入文本到图像的提示时,将看到随着添加更多关于想创建的内容的细节,图像如何变化。 在 Meta 分享的示例中,一个用户输入了提示:“想象一场在火星上进行的足球比赛。” 生成的图像迅速从典型的足球运动员变成了在火星景...
-
蚂蚁集团等发布开源大模型知识抽取框架OneKE
蚂蚁集团和浙江大学合作开发了一个名为 OneKE 的开源大模型知识抽取框架。该框架旨在帮助处理信息抽取、文本数据结构化和知识图谱构建等任务,为研究人员和开发者提供有力工具。 这个框架的作用是从海量数据中提取结构化知识,构建高质量的知识图谱,并建立知识要素之...
-
如何利用Transformer有效关联激光雷达-毫米波雷达-视觉特征?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 笔者个人理解 自动驾驶的基础任务之一是三维目标检测,而现在许多方法都是基于多传感器融合的方法实现的。那为什么要进行多传感器融合?无论是激光雷达和相机融合,又或者是毫米波雷达和相机融合,其最主要的目的就是...
-
全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用
LLM界的「真·Open AI」,又来整顿AI圈了! 业内惊呼:首个开源GPT-4级的模型,终于来了!开源模型追上闭源模型的历史性一刻,或许就在眼前了? 一石激起千层浪,Llama3才刚刚发布没几小时,就破纪录地登顶了Hugging Face排行榜。 这...
-
【直播预告】大模型会取代程序员吗?
分享嘉宾: 杨彦波,科大讯飞 AI 工程院智能体研究负责人。 孙逸神,PingCAP AI Lab Data Scientist. 你用过哪些 AI 编码工具?你觉得它能取...
-
开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4
扎克伯格:「有了 Llama3,全世界就能拥有最智能的 AI。」 ChatGPT 拉开了大模型竞赛的序幕,Meta 似乎要后来居上了。 本周四,AI 领域迎来重大消息,Meta 正式发布了人们等待已久的开源大模型 Llama3。 扎克伯格在 Faceboo...
-
新加坡国立大学 | 通过语言分割任何3D目标
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文研究了具有自由形式语言指令的开放词汇3D实例分割(OV-3DIS)。先前的作品只依赖于注释的基本类别进行训练,对看不见的长尾类别的泛化能力有限。最近的工作通过生成类...
-
轨迹预测系列 | HiVT之进化版QCNet到底讲了啥?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 HiVT的进化版(不先看HiVT也能直接读这篇),性能和效率上大幅提升。 文章也很容易阅读。 【轨迹预测系列】【笔记】HiVT: Hierarchical Vector Transformer for...
-
给AI当“奶妈”,是天涯们的生路吗?
老牌中文社区天涯已经住进“ICU”整整一年,破产看来已经注定,但最近一家美国同行搭上AI 快车的消息,又给天涯带来了一丝希望。 去年4月,因拖缴数据机房费用,天涯社区遭“断网”。 症结在缺钱。天涯社区称,危机来自于近几年资金流动性困难加剧,电信IDC欠费,...
-
扩散模型如何帮助创建更好的强化学习系统
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 扩散模型以其令人印象深刻的生成高质量图像的能力而闻名,它们是流行的文本到图像模型(例如DALL-E、Stable Diffusion和...
-
“梗王”大模型,靠讲笑话登上CVPR | 中山大学
谁能想到,只是让大模型讲笑话,论文竟入选了顶会CVPR! 没开玩笑,这还真真儿的是一项正儿八经的研究。 例如看下面这张图,如果让你根据它来讲个笑话或梗,你会想到什么? 现在的大模型看完后会说: 脑子短路。 再看一眼 蜘蛛侠 的海报,大模型会配一句“刚擦的...
-
量子人工智能:创新与协作的交响曲
在不断发展的人工智能领域,量子人工智能的到来是一个关键时刻,它提供了创新与协作的和谐融合。随着高质量的深度伪造挑战数字内容的真实性,量子人工智能成为一股变革力量,为各个领域带来无与伦比的机遇和挑战。 提升深度伪造检测能力:量子人工智能的卓越处理能力,有...
-
国内首款AI音乐大模型一曲封神!核心技术业内首公开,爆改霉霉周杰伦效果惊艳
【新智元导读】国内首个音乐ChatGPT来了!提前试用「天工SkyMusic」后,整个编辑部暴风式哭泣:它改编的周杰伦和凤凰传奇简直封神。团队选择了一条少有人走的路,他们赌赢了:比OpenAI提前押中了Sora架构,并且首次在业内公开技术图。 最近几周的震...
-
ChatGPT首次亮相电视剧创作名单
近日,印度泰卢固语喜剧《Save the Tigers》第二季大结局的片尾演职员表中,音乐团队部分明确标注列出了ChatGPT。这一现象引发了业界的广泛关注,因为这标志着人工智能技术在影视剧音乐制作领域的首次应用。 据了解,《Save the Tiger...
-
量子计算可靠性提升800倍!微软开启2级弹性量子计算新时代
限制量子计算发展的关键问题,就快被解决了! 对于整个量子生态系统来说,这是一个历史性的时刻。 ——近日,微软联合Quantinuum,向全世界展示了有史以来最可靠的逻辑量子比特。 论文地址:https://arxiv.org/pdf/2404.0228...
-
【探索AI】人人都在讲AIGC,什么是AIGC?
AIGC 概述 示例展示 我们日常用到的一些工具/应用 核心技术介绍 核心技术的算法解析 案例及部分代码实现 1. 艺术作品 2. 设计项目 3. 影视特效 4. 广告创意 总结 一张图先了解下: 概述 "人工智能生成创造...
-
人工智能如何使计算更简单?
人工智能(AI 和机器学习(ML 在我们的日常生活中变得越来越普遍,但我们往往没有意识到。这些技术简化了计算的各个方面,使其更加高效、易于访问且用户友好。 人工智能如何使计算更简单? 人工智能的简化和集成 Gerry Wolf提出的智能“简单与力量...
-
Parler-TTS官网体验入口 AI语音生成工具免费使用地址
Parler-TTS是一个由 Hugging Face 开发的轻量级文本转语音(TTS)模型,能够以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然 sounding 的语音。它是基于 Dan Lyth 和 Simon King 发表的论文《Na...
-
用户画像算法:历史、现状与未来
一、用户画像简介 画像是一种人类可理解的、机器可读写的,对用户的结构化描述。它不仅可以提供个性化服务,还在企业的战略决策和商业分析中发挥了重要作用。 1. 画像的分类 画像可以根据数据来源分为社会通识类和领域知识类。社会通识类画像又可以按照时间维度划分成...
-
AI绘画自动生成器:让艺术创作触手可及
随着人工智能技术的飞速发展,越来越多的应用领域逐渐与AI技术融合。在艺术领域,AI绘画自动生成器成为了一款备受关注的产品。它利用深度学习算法,让用户通过输入关键词或描述性文本,就能在几秒钟内生成一幅独特的艺术作品。在这篇文章中,我们将探讨AI绘画自动生成器...