-
微软发布 Azure ND H100 v5 虚拟机,配备 8 个英伟达 H100 GPU
IT之家 11 月 21 日消息,微软 Azure AI 基础设施迎来升级,推出了 ND H100 v5 虚拟机系列,这款虚拟机配备了英伟达 H100 Tensor Core 图形处理单元(GPU)和低延迟网络。 据介绍,微软全新发布 Azure ND...
-
QPS提升近10倍!解读飞桨加持下的文心一言满月成绩单
近期,一直犹抱琵琶半遮面的国内各路AI相关厂商,扎堆发布大模型。一时间,百“模”大战,鱼龙混杂。 此前,作为全球第一个正式发布大模型的大厂,百度文心一言的一举一动,成为业界关注的焦点。 就在4月19日,时隔文心一言发布1个月又3天,一张“百度飞桨对文心...
-
自动驾驶中基于深度学习的预测和规划融合方法综述
本文经自动驾驶之心公众号授权转载,转载请联系出处。 Rethinking Integration of Prediction and Planning in Deep Learning-Based Automated Driving Systems: A...
-
微软开发定制AI芯片“由软变硬”,到底打的什么算盘?
传闻是真的,微软正在开发定制AI芯片,它可以用来训练大语言模型,让微软获得更多独立,避免过度依赖英伟达。不只如此,微软还在开发Arm CPU,主要供云计算网络使用。两款芯片瞄准的都是Azure数据中心,微软企业客户可以用它们来搭建AI平台。 最新消息显...
-
AIGC:使用bert_vits2实现栩栩如生的个性化语音克隆
1 VITS2模型 1.1 摘要 单阶段文本到语音模型最近被积极研究,其结果优于两阶段管道系统。以往的单阶段模型虽然取得了较大的进展,但在间歇性非自然性、计算效率、对音素转换依赖性强等方面仍有改进的空间。本文提出VITS2,一种单阶段的文本到语音模型,...
-
昇腾CANN 7.0 黑科技:大模型推理部署技术解密
本文分享自华为云社区《昇腾CANN 7.0 黑科技:大模型推理部署技术解密》,作者:昇腾CANN。 近期,随着生成式AI、大模型进入公众视野,越来越多的人意识到抓住AI的爆发就是抓住未来智能化变革的契机。AI基础设施如何快速部署使用,以及如何提升推理性能...
-
【2023云栖】黄博远:阿里云人工智能平台PAI年度发布
本文根据2023云栖大会演讲实录整理而成,演讲信息如下: 演讲人:黄博远 | 阿里云计算平台事业部资深产品专家、阿里云人工智能平台PAI产品负责人 演讲主题:阿里云人工智能平台PAI年度发布 AIGC是我们这个时代的新机遇 今年云栖大会,阿里云机器...
-
GenAI能否提升云计算的ROI?
老牌公司在寻求采用云计算时面临着两难境地:尽管好处可能很有吸引力,但采用云平台所需的改变和投资规模使产生诱人的ROI成为一项挑战,但GenAI可能会显著改变这一局面,它有可能大幅减少采用云所需的投资和时间,并通过释放新的业务和技术使用案例来创造新的价值...
-
百度文心一言获批上线 业内人士爆料阿里360讯飞均落榜
8月31日,文心一言率先向全社会全面开放。广大用户可以在应用商店下载“文心一言APP”或登陆“文心一言官网”(https://yiyan.baidu.com)体验。 据悉,百度还将开放一批经过全新重构的AI原生应用,让广大用户充分体验生成...
-
SymphonyAI发布突破性AI金融犯罪调查案例管理平台
SymphonyAI Sensa-NetReveal日前宣布推出Sensa Investigation Hub,这是亚太地区首个高影响力的AI变革金融犯罪调查和检测平台。该平台利用先进的预测和生成式AI技术,结合全球领先的风险和合规专业知识,为金融机构提供...
-
网易云音乐推荐系统的冷启动技术
一、问题背景:冷启动建模的必要性和重要性 作为一个内容平台,云音乐每天都会有大量的新内容上线,虽然相较于短视频等其它平台,云音乐平台的新内容数量相对较少,但实际数量可能远远超出大家的想象。同时,音乐内容与短视频、新闻、商品推荐又有着显著的不同,音乐的...
-
智能工厂的下一步是什么?
工业5.0建立在工业4.0技术的基础上,但强调可持续性以及人与机器之间的协作。 汽车制造商目前为实现智能运营而采取的许多措施,有助于推动未来的进一步改进。虽然数字化和工业4.0的好处已被讨论多年,但人们对工业5.0的兴趣与日俱增。 工业5.0超越工业4....
-
基于Amazon SageMaker平台部署Stable Diffusion模型实现——图片识别
序言: 当谈到机器学习和人工智能的开发和部署时,Amazon SageMaker是一个非常强大和全面的平台。作为一项托管式的机器学习服务,Amazon SageMaker提供了一套完整的工具和功能,帮助开发者轻松构建、训练和部署机器学习模型。 首先,让...
-
AIGC 爆火,浪潮信息要做大模型的数据存储大底座
AIGC 在 2023 年爆火,各类大模型层出不穷,参数动辄达到千亿数量级。这些背后,数据的类型和形式也走向复杂多样。例如大模型会采用到我们真实物理世界中的文字、视觉、音频、3D、雷达、多谱等复杂多样的不同模态信号和数据,数据则又存在结构化、半结构化、非结...
-
NLP-分词器:SentencePiece【参考Chinese-LLaMA-Alpaca在通用中文语料上训练的20K中文词表并与原版LLaMA模型的32K词表进行合并的代码】
背景 随着ChatGPT迅速出圈,最近几个月开源的大模型也是遍地开花。目前,开源的大语言模型主要有三大类:ChatGLM衍生的大模型(wenda、ChatSQL等)、LLaMA衍生的大模型(Alpaca、Vicuna、BELLE、Phoenix、Chim...
-
昇腾CANN DVPP硬件加速训练数据预处理,友好解决Host CPU预处理瓶
本文分享自华为云社区《昇腾CANN 7.0 黑科技:DVPP硬件加速训练数据预处理,友好解决Host CPU预处理瓶颈》,作者: 昇腾CANN 。 随着人工智能的快速发展,越来越多的应用场景需要使用机器学习和深度学习模型。AI网络模型的训练一般分成...
-
来聊聊近期火爆的几个大模型和自动驾驶概念
本文经自动驾驶之心公众号授权转载,转载请联系出处。 近期大模型各种应用依然火爆,10月初前后出现了一系列颇有噱头的文章,试图把大模型应用于自动驾驶。和很多朋友最近也聊了很多相关的话题,写这篇文章,一方面是发现其实包括我在内,在过去其实都混淆了一些很相关...
-
新一代云原生日志架构 - Loggie的设计与实践
Loggie萌芽于网易严选业务的实际需求,成长于严选与数帆的长期共建,持续发展于网易数帆与网易传媒、中国工商银行的紧密协作。广泛的生态,使得项目能够基于业务需求不断完善、成熟。目前已经开源:https://github.com/loggie-io/logg...
-
Python实用技术——爬虫(一):爬虫基础
目录 爬虫这门技术本身是不违法的,但是应该注意: 1,爬取什么数据 2,如何爬取得来的 3,爬取之后如何使用 二,HTTP协议 1,万维网 2,协议: 三,HTTP知识 四,HTTP请求方法: 五,HTTP的响应 六,HTTP的响应状...
-
Flutter耳返和双声道功能的实现
1 耳返功能简介 ZEGO Express SDK 提供了Flutter耳返和双声道的功能,在视频直播、K歌、音频录制等场景下广泛应用,开发者可根据实际业务场景需要设置,一套代码可实现跨平台音视频耳返功能,节省开发成本。 实时音视频的耳返作用就是在嘈杂...
-
全球首发!总结七十余种开源数据集,一览自动驾驶开源数据体系
本文经自动驾驶之心公众号授权转载,转载请联系出处。 基于数据驱动的各类深度学习模型任务,近年来随着数据集规模的不断扩大,性能逐渐被提升,国内外各大自动驾驶公司都在不断建立自己的数据库,以及数据闭环系统,期待数据的丰富能够解决下半场自动驾驶问题,那么如何...
-
大模型: 模型大了难在哪里?
大家好,我是Tim。 自从GPT模型诞生以来,其参数规模就在不停的扩大。但模型并非简单的直接变大,需要在数据、调度、并行计算、算法和机器资源上做相应的改变。 今天就来总结下,什么是大模型,模型变大的难在哪里以及对于CV/NLP或者搜推广场景上有什么应对策...
-
特斯拉 Optimus 机器人项目招兵买马,聘请强化学习等领域工程师
11 月 1 日消息,特斯拉正在加速招聘人形机器人项目 Optimus 的工程师,包括一些强化学习方面的专家。 很多人对这个项目并不看好,认为它只是一个噱头。然而,特斯拉却非常认真地推进这个项目。最近,特斯拉展示了 Optimus 的最新原型,表现...
-
八张3090,1天压缩万亿参数大模型!3.2TB骤降至160GB,压缩率高达20倍
随着GPT-4的架构被知名业内大佬「开源」,混合专家架构(MoE)再次成为了研究的重点。 GPT-4拥有16个专家模型,总共包含1.8万亿个参数。每生成一个token需要使用大约2800亿参数和560TFLOPs 然而,模型更快、更准确的代价,则是巨大...
-
AI如何影响数字化转型
数字化转型是十多年来业务转型的核心,随着AI的崛起,数字化转型本身也在发生改变。AI正在极大地改变数字化转型,从企业设定的目标到从业者用来推进倡议的工具。 产生影响的因素包括传统的AI技术,如ML,以及快速增长的GenAI领域,后一种技术正迅速在企业I...
-
苹果文生图大模型亮相:俄罗斯套娃式扩散,支持1024x1024分辨率
在生成式 AI 时代,扩散模型已经成为图像、视频、3D、音频和文本生成等生成式 AI 应用的流行工具。然而将扩散模型拓展到高分辨率领域仍然面临巨大挑战,这是因为模型必须在每个步骤重新编码所有的高分辨率输入。解决这些挑战需要使用带有注意力块的深层架构,这使...
-
世界模型和DriveGPT这类大模型到底能给自动驾驶带来什么?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 大模型今年爆火,很多领域上的应用如雨后春笋般涌现,很多优秀的工作出现,主要集中在数据生成和场景分析表述两部分,重点解决自动驾驶的长尾分布问题和场景识别。今天自动驾驶之心带大家梳理下自动驾驶行业上的大模...
-
自动驾驶端到端规划方法汇总
本文经自动驾驶之心公众号授权转载,转载请联系出处。 一、Woven Planet(丰田子公司)的方案:Urban Driver 2021 这篇文章是21年的,但一大堆新文章都拿它来做对比基线,因此应该也有必要来看看方法。 大概看了下,主要就是用Po...
-
三星预告 Galaxy S24 Ultra 相机配备 AI 图像堆叠和改进的 4K 变焦功能
三星最近发布了一个视频,展示了由高通的新 Snapdragon 8 Gen 3 芯片组驱动的 ISOCELL 200 MP 传感器的新功能。目前市场上还没有配备此类硬件的智能手机,因此这显然是对即将推出的 Galaxy S24 Ultra 的预告。 该...
-
苹果“套娃”式扩散模型,训练步数减少七成!
苹果的一项最新研究,大幅提高了扩散模型在高分辨率图像上性能。 利用这种方法,同样分辨率的图像,训练步数减少了超过七成。 在1024×1024的分辨率下,图片画质直接拉满,细节都清晰可见。 苹果把这项成果命名为MDM,DM就是扩散模型(Diffusion...
-
最高20倍!压缩ChatGPT等模型文本提示,极大节省AI算力
在长文本场景中,ChatGPT等大语言模型经常面临更高算力成本、更长的延迟以及更差的性能。为了解决这三大难题,微软开源了LongLLMLingua。 据悉,LongLLMLingua的核心技术原理是将“文本提示”实现最高20倍的极限压缩,同时又可以准确评估...
-
首个多视角自动驾驶场景视频生成世界模型 | DrivingDiffusion: BEV数据和仿真新思路
笔者的一些个人思考 在自动驾驶领域,随着BEV-based子任务/端到端方案的发展,高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点,“高质量”可以解耦成三个方面: 不同维度上的长尾场景:如障碍物数据中近距离的车辆以及切车过程中...
-
AI视频后期制作神器ProPainter 一键即可完成视频抠图
最近,出现了一种新的视频修复技术,叫做ProPainter,它可以用画家风格的笔触来填补视频中的缺失区域。 ProPainter是一个基于深度学习的端到端的网络,它由两个模块组成:Recurrent Flow Completion Network和Pain...
-
HiLM-D:自动驾驶多模态大语言模型玩出花了
本文经自动驾驶之心公众号授权转载,转载请联系出处。 笔者个人的一些思考 不得不说,最近大模型在学术界火起来了,基于图文匹配的CLIP预训练模型成为近年来在多模态研究领域的经典之作。除此之外,大语言模型的蓬勃发展也进一步为多模态带来了性能提升。自动驾驶领...