端到端第6页 - AIGC资讯

网络规模、训练学习速度提升，清华团队在大规模光电智能计算方向取得进展

随着大模型等人工智能技术的突破与发展，算法复杂度剧增，对传统计算芯片带来了算力和功耗的双重挑战。近年来，以光计算为基础、通过光电融合的方式构建光电神经网络的计算处理方法已经成为国际热点研究问题，有望实现计算性能的颠覆性提升。然而，光电神经网络的前向数学...

大数据 2023-11-27 人工智能

779阅读

面对AMD英特尔微软谷歌的挑战，英伟达AI计算能否笑到最后？

几天前英伟达发布财报，业绩不错，但不够好，无法推动股价进一步爬升。尽管如此，英伟达已经向投资者证明，竞争对手AMD、英特尔想追上还有很长的路要走。英伟达高管知道竞争很激烈，他们强调，在AI芯片领域英伟达地位超然。如何保持优势？英伟达会加快研发速度，每...

大数据 2023-11-27 人工智能

782阅读

Open Vocabulary Detection 开放世界目标检测竞赛 2023获胜团队方案分享

OVD技术简介目标检测是计算机视觉领域中的一项核心任务，其主要目标是让计算机能够自动识别图片中目标的类别，并准确标示每个目标的位置。目前，主流的目标检测方法主要针对闭集目标的开发，即在任务开始之前需要对待检测目标进行类别定义，并进行人工数据标注，通...

大数据 2023-11-27 人工智能

1495阅读

音频质量评估方法浅析

Part 01 评价方法当涉及音频质量评价时，我们可以从主观评价和客观评价两个角度展开，以全面了解音频质量的好坏。这两种评价方法各自涉及不同的评估方式和应用场景，专家可以根据业务特点选取其中的一种或者多种评价方法结合的形式来评价业务音频质量。主观评...

人工智能 2023-11-25 人工智能

1325阅读

这项AI研究引入 Atom：一种低位量化技术，可实现高效、准确LLM)服务

大型语言模型（LLM）是人工智能领域最新的引入，已经席卷全球。这些模型以其令人难以置信的能力，被人们广泛使用，无论是研究人员、科学家还是学生。凭借其仿人潜力回答问题、生成内容、概括文本、完成代码等方面，这些模型已经走过了很长的路程。 LLM 在情感分析、智...

人工智能 2023-11-24 人工智能

877阅读

LLaMA 2端到端推理打通！来自中国团队

Buddy Compiler 端到端 LLaMA2-7B 推理示例已经合并到 buddy-mlir仓库[1]主线。我们在 Buddy Compiler 的前端部分实现了面向 TorchDynamo 的第三方编译器，从而结合了 MLIR 和 PyTorc...

人工智能 2023-11-23 人工智能

959阅读

聊一聊高精地图的数据问题，无图感知还有哪些坑要踩？

本文经自动驾驶之心公众号授权转载，转载请联系出处。在自动驾驶领域，高精地图在定位、规划和避碰等方面发挥着至关重要的作用，实现行车安全和高质量路线预测。然而高精地图的构建都是昂贵、复杂的，而且专业性很强，无论是在硬件组成还是软件及其所使用的算法方面。...

生成式AI 2023-11-23 人工智能

1082阅读

智能工厂的下一步是什么？展望工业 5.0

工业 5.0 建立在工业 4.0 技术的基础上，但强调可持续性以及人与机器之间的协作。汽车制造商目前为实现智能运营而采取的许多措施有助于推动未来的进一步改进。虽然数字化和工业 4.0 的好处已被讨论多年，但人们对工业 5.0 的兴趣与日俱增。工...

人工智能 2023-11-21 人工智能

770阅读

微软发布 Azure ND H100 v5 虚拟机，配备 8 个英伟达 H100 GPU

IT之家 11 月 21 日消息，微软 Azure AI 基础设施迎来升级，推出了 ND H100 v5 虚拟机系列，这款虚拟机配备了英伟达 H100 Tensor Core 图形处理单元（GPU）和低延迟网络。据介绍，微软全新发布 Azure ND...

大数据 2023-11-21 人工智能

718阅读

QPS提升近10倍！解读飞桨加持下的文心一言满月成绩单

近期，一直犹抱琵琶半遮面的国内各路AI相关厂商，扎堆发布大模型。一时间，百“模”大战，鱼龙混杂。此前，作为全球第一个正式发布大模型的大厂，百度文心一言的一举一动，成为业界关注的焦点。就在4月19日，时隔文心一言发布1个月又3天，一张“百度飞桨对文心...

AIGC 2023-11-21 人工智能

890阅读

自动驾驶中基于深度学习的预测和规划融合方法综述

本文经自动驾驶之心公众号授权转载，转载请联系出处。 Rethinking Integration of Prediction and Planning in Deep Learning-Based Automated Driving Systems: A...

生成式AI 2023-11-20 人工智能

894阅读

微软开发定制AI芯片“由软变硬”，到底打的什么算盘？

传闻是真的，微软正在开发定制AI芯片，它可以用来训练大语言模型，让微软获得更多独立，避免过度依赖英伟达。不只如此，微软还在开发Arm CPU，主要供云计算网络使用。两款芯片瞄准的都是Azure数据中心，微软企业客户可以用它们来搭建AI平台。最新消息显...

生成式AI 2023-11-17 人工智能

792阅读

AIGC：使用bert_vits2实现栩栩如生的个性化语音克隆

1 VITS2模型 1.1 摘要单阶段文本到语音模型最近被积极研究，其结果优于两阶段管道系统。以往的单阶段模型虽然取得了较大的进展，但在间歇性非自然性、计算效率、对音素转换依赖性强等方面仍有改进的空间。本文提出VITS2，一种单阶段的文本到语音模型，...

AIGC 2023-11-17 人工智能

1618阅读

昇腾CANN 7.0 黑科技：大模型推理部署技术解密

本文分享自华为云社区《昇腾CANN 7.0 黑科技：大模型推理部署技术解密》，作者：昇腾CANN。近期，随着生成式AI、大模型进入公众视野，越来越多的人意识到抓住AI的爆发就是抓住未来智能化变革的契机。AI基础设施如何快速部署使用，以及如何提升推理性能...

生成式AI 2023-11-16 人工智能

871阅读

【2023云栖】黄博远：阿里云人工智能平台PAI年度发布

本文根据2023云栖大会演讲实录整理而成，演讲信息如下：演讲人：黄博远 | 阿里云计算平台事业部资深产品专家、阿里云人工智能平台PAI产品负责人演讲主题：阿里云人工智能平台PAI年度发布 AIGC是我们这个时代的新机遇今年云栖大会，阿里云机器...

大数据 2023-11-16 人工智能

936阅读

GenAI能否提升云计算的ROI?

老牌公司在寻求采用云计算时面临着两难境地：尽管好处可能很有吸引力，但采用云平台所需的改变和投资规模使产生诱人的ROI成为一项挑战，但GenAI可能会显著改变这一局面，它有可能大幅减少采用云所需的投资和时间，并通过释放新的业务和技术使用案例来创造新的价值...

人工智能 2023-11-16 人工智能

783阅读

百度文心一言获批上线业内人士爆料阿里360讯飞均落榜

8月31日，文心一言率先向全社会全面开放。广大用户可以在应用商店下载“文心一言APP”或登陆“文心一言官网”（https://yiyan.baidu.com）体验。据悉，百度还将开放一批经过全新重构的AI原生应用，让广大用户充分体验生成...

生成式AI 2023-11-16 人工智能

755阅读

SymphonyAI发布突破性AI金融犯罪调查案例管理平台

SymphonyAI Sensa-NetReveal日前宣布推出Sensa Investigation Hub，这是亚太地区首个高影响力的AI变革金融犯罪调查和检测平台。该平台利用先进的预测和生成式AI技术，结合全球领先的风险和合规专业知识，为金融机构提供...

生成式AI 2023-11-15 人工智能

845阅读

网易云音乐推荐系统的冷启动技术

一、问题背景：冷启动建模的必要性和重要性作为一个内容平台，云音乐每天都会有大量的新内容上线，虽然相较于短视频等其它平台，云音乐平台的新内容数量相对较少，但实际数量可能远远超出大家的想象。同时，音乐内容与短视频、新闻、商品推荐又有着显著的不同，音乐的...

大数据 2023-11-14 人工智能

1182阅读

智能工厂的下一步是什么？

工业5.0建立在工业4.0技术的基础上，但强调可持续性以及人与机器之间的协作。汽车制造商目前为实现智能运营而采取的许多措施，有助于推动未来的进一步改进。虽然数字化和工业4.0的好处已被讨论多年，但人们对工业5.0的兴趣与日俱增。工业5.0超越工业4....

大数据 2023-11-13 人工智能

761阅读

基于Amazon SageMaker平台部署Stable Diffusion模型实现——图片识别

序言：当谈到机器学习和人工智能的开发和部署时，Amazon SageMaker是一个非常强大和全面的平台。作为一项托管式的机器学习服务，Amazon SageMaker提供了一套完整的工具和功能，帮助开发者轻松构建、训练和部署机器学习模型。首先，让...

生成式AI 2023-11-13 人工智能

873阅读

AIGC 爆火，浪潮信息要做大模型的数据存储大底座

AIGC 在 2023 年爆火，各类大模型层出不穷，参数动辄达到千亿数量级。这些背后，数据的类型和形式也走向复杂多样。例如大模型会采用到我们真实物理世界中的文字、视觉、音频、3D、雷达、多谱等复杂多样的不同模态信号和数据，数据则又存在结构化、半结构化、非结...

AIGC 2023-11-12 人工智能

829阅读

NLP-分词器：SentencePiece【参考Chinese-LLaMA-Alpaca在通用中文语料上训练的20K中文词表并与原版LLaMA模型的32K词表进行合并的代码】

背景随着ChatGPT迅速出圈，最近几个月开源的大模型也是遍地开花。目前，开源的大语言模型主要有三大类：ChatGLM衍生的大模型（wenda、ChatSQL等）、LLaMA衍生的大模型（Alpaca、Vicuna、BELLE、Phoenix、Chim...

生成式AI 2023-11-11 人工智能

1591阅读

昇腾CANN DVPP硬件加速训练数据预处理，友好解决Host CPU预处理瓶

本文分享自华为云社区《昇腾CANN 7.0 黑科技：DVPP硬件加速训练数据预处理，友好解决Host CPU预处理瓶颈》，作者：昇腾CANN 。随着人工智能的快速发展，越来越多的应用场景需要使用机器学习和深度学习模型。AI网络模型的训练一般分成...

AIGC 2023-11-10 人工智能

844阅读

来聊聊近期火爆的几个大模型和自动驾驶概念

本文经自动驾驶之心公众号授权转载，转载请联系出处。近期大模型各种应用依然火爆，10月初前后出现了一系列颇有噱头的文章，试图把大模型应用于自动驾驶。和很多朋友最近也聊了很多相关的话题，写这篇文章，一方面是发现其实包括我在内，在过去其实都混淆了一些很相关...

生成式AI 2023-11-09 人工智能

811阅读

新一代云原生日志架构 - Loggie的设计与实践

Loggie萌芽于网易严选业务的实际需求，成长于严选与数帆的长期共建，持续发展于网易数帆与网易传媒、中国工商银行的紧密协作。广泛的生态，使得项目能够基于业务需求不断完善、成熟。目前已经开源：https://github.com/loggie-io/logg...

AIGC 2023-11-08 大数据

866阅读

Python实用技术——爬虫（一）：爬虫基础

目录爬虫这门技术本身是不违法的，但是应该注意： 1，爬取什么数据 2，如何爬取得来的 3，爬取之后如何使用二，HTTP协议 1，万维网 2，协议：三，HTTP知识四，HTTP请求方法：五，HTTP的响应六，HTTP的响应状...

人工智能 2023-11-08 大数据

832阅读

Flutter耳返和双声道功能的实现

1 耳返功能简介 ZEGO Express SDK 提供了Flutter耳返和双声道的功能，在视频直播、K歌、音频录制等场景下广泛应用，开发者可根据实际业务场景需要设置，一套代码可实现跨平台音视频耳返功能，节省开发成本。实时音视频的耳返作用就是在嘈杂...

大数据 2023-11-08 大数据

871阅读

全球首发！总结七十余种开源数据集，一览自动驾驶开源数据体系

本文经自动驾驶之心公众号授权转载，转载请联系出处。基于数据驱动的各类深度学习模型任务，近年来随着数据集规模的不断扩大，性能逐渐被提升，国内外各大自动驾驶公司都在不断建立自己的数据库，以及数据闭环系统，期待数据的丰富能够解决下半场自动驾驶问题，那么如何...

AIGC 2023-11-06 人工智能

893阅读

大模型: 模型大了难在哪里？

大家好，我是Tim。自从GPT模型诞生以来，其参数规模就在不停的扩大。但模型并非简单的直接变大，需要在数据、调度、并行计算、算法和机器资源上做相应的改变。今天就来总结下，什么是大模型，模型变大的难在哪里以及对于CV/NLP或者搜推广场景上有什么应对策...

人工智能 2023-11-03 人工智能

1611阅读

特斯拉 Optimus 机器人项目招兵买马，聘请强化学习等领域工程师

11 月 1 日消息，特斯拉正在加速招聘人形机器人项目 Optimus 的工程师，包括一些强化学习方面的专家。很多人对这个项目并不看好，认为它只是一个噱头。然而，特斯拉却非常认真地推进这个项目。最近，特斯拉展示了 Optimus 的最新原型，表现...

人工智能 2023-11-01 人工智能

909阅读

八张3090，1天压缩万亿参数大模型！3.2TB骤降至160GB，压缩率高达20倍

随着GPT-4的架构被知名业内大佬「开源」，混合专家架构（MoE）再次成为了研究的重点。 GPT-4拥有16个专家模型，总共包含1.8万亿个参数。每生成一个token需要使用大约2800亿参数和560TFLOPs 然而，模型更快、更准确的代价，则是巨大...

人工智能 2023-10-31 人工智能

965阅读

AI如何影响数字化转型

数字化转型是十多年来业务转型的核心，随着AI的崛起，数字化转型本身也在发生改变。AI正在极大地改变数字化转型，从企业设定的目标到从业者用来推进倡议的工具。产生影响的因素包括传统的AI技术，如ML，以及快速增长的GenAI领域，后一种技术正迅速在企业I...

AIGC 2023-10-31 人工智能

792阅读

苹果文生图大模型亮相：俄罗斯套娃式扩散，支持1024x1024分辨率

在生成式 AI 时代，扩散模型已经成为图像、视频、3D、音频和文本生成等生成式 AI 应用的流行工具。然而将扩散模型拓展到高分辨率领域仍然面临巨大挑战，这是因为模型必须在每个步骤重新编码所有的高分辨率输入。解决这些挑战需要使用带有注意力块的深层架构，这使...

AIGC 2023-10-30 人工智能

883阅读

世界模型和DriveGPT这类大模型到底能给自动驾驶带来什么？

本文经自动驾驶之心公众号授权转载，转载请联系出处。大模型今年爆火，很多领域上的应用如雨后春笋般涌现，很多优秀的工作出现，主要集中在数据生成和场景分析表述两部分，重点解决自动驾驶的长尾分布问题和场景识别。今天自动驾驶之心带大家梳理下自动驾驶行业上的大模...

AIGC 2023-10-30 人工智能

1145阅读

自动驾驶端到端规划方法汇总

本文经自动驾驶之心公众号授权转载，转载请联系出处。一、Woven Planet（丰田子公司）的方案：Urban Driver 2021 这篇文章是21年的，但一大堆新文章都拿它来做对比基线，因此应该也有必要来看看方法。大概看了下，主要就是用Po...

AIGC 2023-10-30 人工智能

873阅读

三星预告 Galaxy S24 Ultra 相机配备 AI 图像堆叠和改进的 4K 变焦功能

三星最近发布了一个视频，展示了由高通的新 Snapdragon 8 Gen 3 芯片组驱动的 ISOCELL 200 MP 传感器的新功能。目前市场上还没有配备此类硬件的智能手机，因此这显然是对即将推出的 Galaxy S24 Ultra 的预告。该...

人工智能 2023-10-29 人工智能

860阅读

苹果“套娃”式扩散模型，训练步数减少七成！

苹果的一项最新研究，大幅提高了扩散模型在高分辨率图像上性能。利用这种方法，同样分辨率的图像，训练步数减少了超过七成。在1024×1024的分辨率下，图片画质直接拉满，细节都清晰可见。苹果把这项成果命名为MDM，DM就是扩散模型（Diffusion...

人工智能 2023-10-25 人工智能

823阅读

最高20倍！压缩ChatGPT等模型文本提示，极大节省AI算力

在长文本场景中，ChatGPT等大语言模型经常面临更高算力成本、更长的延迟以及更差的性能。为了解决这三大难题，微软开源了LongLLMLingua。据悉，LongLLMLingua的核心技术原理是将“文本提示”实现最高20倍的极限压缩，同时又可以准确评估...

AIGC 2023-10-25 人工智能

1022阅读

首个多视角自动驾驶场景视频生成世界模型 | DrivingDiffusion: BEV数据和仿真新思路

笔者的一些个人思考在自动驾驶领域，随着BEV-based子任务/端到端方案的发展，高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点，“高质量”可以解耦成三个方面：不同维度上的长尾场景：如障碍物数据中近距离的车辆以及切车过程中...

人工智能 2023-10-24 人工智能

1460阅读

AI视频后期制作神器ProPainter 一键即可完成视频抠图

最近，出现了一种新的视频修复技术，叫做ProPainter，它可以用画家风格的笔触来填补视频中的缺失区域。 ProPainter是一个基于深度学习的端到端的网络，它由两个模块组成:Recurrent Flow Completion Network和Pain...

AIGC 2023-10-24 人工智能

910阅读

HiLM-D：自动驾驶多模态大语言模型玩出花了

本文经自动驾驶之心公众号授权转载，转载请联系出处。笔者个人的一些思考不得不说，最近大模型在学术界火起来了，基于图文匹配的CLIP预训练模型成为近年来在多模态研究领域的经典之作。除此之外，大语言模型的蓬勃发展也进一步为多模态带来了性能提升。自动驾驶领...

人工智能 2023-10-24 人工智能

1024阅读