性能提升第5页 - AIGC资讯

语言模型：GPT与HuggingFace的应用

本文分享自华为云社区《大语言模型底层原理你都知道吗？大语言模型底层架构之二GPT实现》，作者：码上开花_Lancer 。受到计算机视觉领域采用ImageNet对模型进行一次预训练，使得模型可以通过海量图像充分学习如何提取特征，然后再根据任务目标进行模型...

人工智能 2023-12-08 人工智能

933阅读

Meta、微软表示将购买 AMD 的最新 AI 芯片 MI300X，作为英伟达芯片的替代品

在 AMD 周三的投资者活动上，最新的人工智能芯片——Instinct MI300X">Meta、OpenAI 和微软宣布，他们将使用 AMD 最新的人工智能芯片——Instinct MI300X。这是迄今为止科技公司寻找替代 Nvidia 昂贵图形...

AIGC 2023-12-07 人工智能

842阅读

锐龙8040官宣！AMD首创的AI PC性能飙升60％明年再涨3倍

AMD 2023年初发布的锐龙7040系列处理器，不但为笔记本带来了迄今最先进的4nm制造工艺、Zen4 CPU架构、RDNA3 GPU架构，还第一次为x86处理器加入了独立的NPU AI引擎硬件单元。这就是Ryzen AI，也创造了AI P...

大数据 2023-12-07 人工智能

855阅读

中文大模型 Chinese-LLaMA-Alpaca-2 开源且可以商用

“ Meta 开源 LLAMA2 后，国内出现了不少以此为基座模型训练的中文模型，这次我们来看看其中一个不错的中文模型：Chinese-LLaMA-Alpaca-2 。” 01 — 目前在开源大模型中，比较有名的是Meta的LLAM...

AIGC 2023-12-05 人工智能

1281阅读

微调语言大模型选LoRA还是全参数？基于LLaMA 2深度分析

本文对比了全参数微调和LoRA，并分析了这两种技术各自的优势和劣势。作者使用了三个真实用例来训练LLaMA 2模型，这提供了比较特定任务的性能、硬件要求和训练成本的基准。本文证明了使用LoRA需要在serving效率和模型质量之间做出权衡，而这...

AIGC 2023-12-05 人工智能

1027阅读

DetZero：Waymo 3D检测榜单第一，媲美人工标注！

本文经自动驾驶之心公众号授权转载，转载请联系出处。本文提出了一套离线3D物体检测算法框架DetZero，通过在 Waymo 公开数据集上进行全面的研究和评估，DetZero可生成连续且完整的物体轨迹序列，并充分利用长时序点云特征显着提升感知结果的质...

大数据 2023-12-04 人工智能

873阅读

小红书推搜场景下如何优化机器学习异构硬件推理突破算力瓶颈！

本文将分享小红书推搜场景下，全 GPU 化建设过程中的模型服务、GPU 优化等相关工作。一、前言近年来，机器学习领域的视频、图像、文本和推广搜等应用不断发展，其模型计算量和参数量远远超过了 CPU 摩尔定律的增长速度。在此背景下，GPU 的算力发展...

AIGC 2023-12-04 人工智能

1090阅读

720亿参数大模型都拿来开源了！通义千问开源全家桶，最小18亿模型端侧都能跑

「Qwen-72B 模型将于 11 月 30 日发布。」前几天，X 平台上的一位网友发布了这样一则消息，消息来源是一段对话。他还说，「如果（新模型）像他们的 14B 模型一样，那将是惊人的。」有位网友转发了帖子并配文「千问模型最近表现不错」。这句话...

大数据 2023-12-01 人工智能

957阅读

280万大模型中文开发者拿到最后一块拼图

2023年5月，微软CEO纳德拉抛出一个惊人数字，未来全球的开发者数量将会达到10亿。那时候Meta的Llama已经开源4个月，但一些国内的开发者发现，从小以英文语料喂养起来的Llama，对中文世界并不友好。这未来的“10亿”开发者里会有多少中文开发者...

生成式AI 2023-12-01 人工智能

852阅读

使用PyTorch加速生成式 AI模型

PyTorch 团队发布了一篇名为《Accelerating Generative AI with PyTorch II: GPT， Fast》的博文，重点介绍如何使用纯原生 PyTorch 加速生成式 AI 模型。正如最近在PyTorch 开发者大会上...

生成式AI 2023-12-01 人工智能

1206阅读

英特尔推Extension for Transformers工具包大模型推理性能提升40倍

在当前技术发展的背景下，英特尔公司推出的Extension for Transformers工具包成为一个重要创新，实现了在CPU上对大型语言模型（LLM）推理性能的显著加速。该工具包通过LLM Runtime技术，优化了内核，支持多种量化选择，提供更优的...

人工智能 2023-11-30 人工智能

847阅读

联手英伟达、ChatGPT 最强竞品 Claude，亚马逊云科技开启生成式 AI 大决战

2000年，亚马逊带着“网络就是计算机”疑惑，懵懂地叩开了云计算的大门，在其电子商务网站初尝试后，成功推出 S3（Simple Storage Service）和 EC2(Elastic Cloud Computer 产品，自此高歌猛进，将云计算正式带入大...

生成式AI 2023-11-30 人工智能

876阅读

Arm最新Cortex-M52芯片助力小型物联网设备实现AI分析功能

人工智能（AI）的普及已经无处不在，但真正需要它的地方是在物联网(IoT 设备生成大量数据的边缘。Arm公司最新推出的Cortex-M52芯片旨在实现在边缘进行小型IoT设备上的AI分析，为开发者提供更多硬件能力和简化的软件开发平台。 Arm的高级副总裁兼...

AIGC 2023-11-28 人工智能

873阅读

IDEA提出ToG思维图谱大模型性能提升214%！

近期，由IDEA研究院、微软亚洲研究院、香港科技大学等多方研究团队合作推出的Think-on-Graph技术，在深度推理领域掀起了一场革新。这一技术通过紧耦合大模型（LLM）与知识图谱(KG ，成功弥补了大模型在金融、法律、医疗等领域幻觉问题上的能力短板。...

大数据 2023-11-27 人工智能

1206阅读

AI视野：Azure AI新增40种大模型；Yi-34B-Chat微调模型开源；GPT-4在图灵测试中成功率超过41%；微软谷歌推出AI入门课程

???AI新鲜事微软Azure AI新增40种大模型微软宣布在Azure AI云开发平台中新增40个大模型，包括Whisper V3、Stable Diffusion、Phi、Falcon、SAM、CLIP、Code Llama等，支持文本生成、图像处...

AIGC 2023-11-27 人工智能

1025阅读

谷歌：LLM找不到推理错误，但能纠正它

今年，大型语言模型（LLM）成为 AI 领域关注的焦点。LLM 在各种自然语言处理（NLP）任务上取得了显著的进展，在推理方面的突破尤其令人惊艳。但在复杂的推理任务上，LLM 的表现仍然欠佳。那么，LLM 能否判断出自己的推理存在错误？最近，剑桥大学和...

人工智能 2023-11-27 人工智能

779阅读

看百度文心一言实力，再聊ChatGPT触类旁通的学习能力如何而来？

图文原创：亲爱的数据美国大模型水平领先，国内大模型蓄势而发。国内大模型参与者众多，百度文心一言第一个有勇气站出来发布。此处应有掌声。事前事后，中国网友的呐喊声不绝于耳：“文心一言到底什么水平啊？” 其实网友更想知道：国内A...

生成式AI 2023-11-27 人工智能

877阅读

Llama 2 论文《Llama 2: Open Foundation and Fine-Tuned Chat Models》阅读笔记

文章目录 Llama 2: Open Foundation and Fine-Tuned Chat Models 1.简介 2.预训练 2.1 预训练数据 2.2 训练详情 2.3 LLAMA 2 预训练模型评估 3. 微调 3.1 s...

AIGC 2023-11-27 人工智能

1529阅读

比「让我们一步一步思考」这句咒语还管用，提示工程正在被改进

大型语言模型（LLM）已经是许多自然语言处理任务的强大工具，只要能给出正确的提示。然而，由于模型的敏感性，找到最优提示通常需要进行大量手动尝试和试错努力。此外，一旦将初始提示部署到生产环境中，可能会出现意想不到的边缘情况，需要更多轮的手动调整来进一步完善...

生成式AI 2023-11-26 人工智能

866阅读

深度解读AIGC存储解决方案

5月26日，2023数据基础设施技术峰会在苏州举办，腾讯云首席存储技术专家温涛受邀出席并分享了腾讯云领先的存储技术在AIGC场景中的应用，通过对AIGC业务流程和场景的提炼，从内容生成、内容审核和内容智理三要素介绍了如何智能的存储和管理数据。下面我们一起回...

大数据 2023-11-26 人工智能

1068阅读

大模型之Bloom&LLAMA----Pre-Training(二次预训练)

0. 简介随着chatgpt的爆火，最近也有很多大模型在不断地出现，比如说Bloom系列以及以LLAMA为基础的ziya和baichuan。这些模型相较于chatglm来说，更加具有发展前景，因为其是完全可商用，并可以不断迭代更新的。最近作者在跟着h...

生成式AI 2023-11-25 人工智能

1069阅读

xFormers安装使用

xFormers是一个模块化和可编程的Transformer建模库，可以加速图像的生成。这种优化仅适用于nvidia gpus，它加快了图像生成，并降低了vram的使用量，而成本产生了非确定性的结果。下载地址： https://github.co...

人工智能 2023-11-25 人工智能

1101阅读

AIGC数据处理与存储解决方案

针对在AIGC的场景下，如何解决在AIGC训练过程中数据的存储和数据处理的问题，杨冠军从三个方面进行介绍与解读：一是AIGC对存储提的新需求；二是介绍腾讯云可以给用户提供的整体存储解决方案； ...

大数据 2023-11-25 人工智能

997阅读

AI视野：ElevenLabs发布“语音转语音”；realme GT5Pro 12月7日发布；Claude2.1被指严重虚标；清华大学提出全新加速训练大模型方法SoT

???AI应用 ElevenLabs发布“语音转语音” ElevenLabs的语音生成式AI平台发布了“语音转语音”功能，用户可上传语音并自动转换为不同音色，实现声音的自由切换，为用户带来全新的语音生成体验。免费体验地址:https://elevenl...

AIGC 2023-11-24 人工智能

1044阅读

清华大学提出全新加速训练大模型方法SoT

近日，微软研究和清华大学的研究人员共同提出了一种名为“Skeleton-of-Thought（SoT）”的全新人工智能方法，旨在解决大型语言模型(LLMs 生成速度较慢的问题。尽管像GPT-4和LLaMA等LLMs在技术领域产生了深远影响，但其处理速度的...

大数据 2023-11-24 人工智能

809阅读

OpenAI，请重新思考 Retrieval Assistant 的方案

作者：栾小凡 Zilliz 合伙人、技术总监近期， OpenAI 在首届开发者大会上公布了系列最新进展，引发各大媒体和从业人员的广泛关注。其中最引人注目的是全新推出的 GPT-4 Turbo ——一个更经济、更高效的服务版本，可以显著提升用户体验。...

大数据 2023-11-23 人工智能

1086阅读

一文搞懂 AI Agents 的不同类型

Hello folks，我是 Luga，今天我们继续来聊一下人工智能（AI）生态领域相关的技术 - AI Agents（AI 代理），本文将聚焦在针对不同类型的 AI Agents 技术进行解析，使得大家能够了解不同 AI Agents 实现机制以及所...

生成式AI 2023-11-23 人工智能

976阅读

AIGC繁花，绽放在精耕的算力土壤之上

2023年的春天，称得上一句AI之春。大模型成为技术力量新的爆发点，生成式AI（AIGC）应用风起云涌。产业界争先恐后训大模型之际，广大用户最大的困惑是——发布了，但就是玩不到啊！ OpenAI有地域限制且不去说它，各种国产大模型也很...

AIGC 2023-11-22 人工智能

830阅读

UC伯克利研究人员推出Ghostbuster:用于检测 LLM 生成文本的最先进 AI 方法

LLM，如 ChatGPT，可以轻松地产生各种流利的文本，但是它们的准确性有多高呢?语言模型容易产生事实错误和幻觉，这让读者在决定是否相信一个信息来源时知道是否使用了这些工具来做新闻文章或其他信息文本的幽灵写作。这些模型的发展也引发了对文本的真实性和原创性...

生成式AI 2023-11-21 人工智能

1256阅读

联发科发布AI处理器天玑8300 Redmi K70E 将全球首发

联发科在11月21日举行了天玑8300处理器的发布会。天玑8300采用了台积电第二代4nm 制程，搭载了4个 Cortex-A715性能核心和4个 Cortex-A510能效核心的八核 CPU，性能提升了20%，峰值功耗降低了30%。在游戏体验方面，天玑...

大数据 2023-11-21 人工智能

870阅读

图像相似度比较之 CLIP or DINOv2

在人工智能领域，计算机视觉的两大巨头是CLIP和DINOv2。CLIP改变了图像理解的方式，而DINOv2为自监督学习带来了新的方法。在本文中，我们将探索定义CLIP和DINOv2的强项和微妙之处的旅程。我们旨在发现这些模型中哪一个在图像相似度任务的世界...

AIGC 2023-11-21 人工智能

1394阅读

QPS提升近10倍！解读飞桨加持下的文心一言满月成绩单

近期，一直犹抱琵琶半遮面的国内各路AI相关厂商，扎堆发布大模型。一时间，百“模”大战，鱼龙混杂。此前，作为全球第一个正式发布大模型的大厂，百度文心一言的一举一动，成为业界关注的焦点。就在4月19日，时隔文心一言发布1个月又3天，一张“百度飞桨对文心...

AIGC 2023-11-21 人工智能

902阅读

AntDB数据库受邀参加第六届上海人工智能大会，分享AIGC时代核心交易系统升级方案

近日，第六届上海人工智能大会春季论坛圆满落幕。大会以“数智互联，瞰见未来”为主题，邀请了来自国内外十余个国家和地区的学术界顶级学者和业内知名企业的技术大咖，探讨人工智能的学术、人才、技术、行业发展痛点。亚信科技AntDB数据库作为数智转型时代的基础软件受邀...

AIGC 2023-11-18 人工智能

817阅读

高通推出第三代骁龙7处理器 AI性能提升90%

高通宣布推出第三代骁龙7移动平台，第三代骁龙7移动平台采用了全新的CPU架构，最高主频高达2.63GHz，采用64位架构，CPU整体性能提升近15%，GPU性能提升超过50%。同时，第三代骁龙7移动平台整体功耗降低20%，并带来更持久的续航。在AI方面...

AIGC 2023-11-17 人工智能

756阅读

聚焦 AIGC，函数计算为 AI 应用插上腾飞翅膀

6月1日，2023 阿里云峰会·粤港澳大湾区在广州举办，Serverless 加速创新分论坛如约亮相，阿里云函数计算 FC 聚焦 AIGC 应用开发，GPU 性能体验再升级，让 AIGC 应用开发更简单。以更少的代码，实现业务创新函数计算 FC...

AIGC 2023-11-16 人工智能

1005阅读

NVIDIA RTX显卡AI推理提速5倍！RTX PC轻松在本地搞定大模型

正在举行的微软Iginte全球技术大会上，微软发布一系列AI相关的全新优化模型、开发工具资源，帮助开发者更深入地释放硬件性能，拓展AI场景。尤是对于当下在AI领域占据绝对主导地位的NVIDIA来说，微软这次送上了一份大礼包，无论是面向OpenAI Cha...

AIGC 2023-11-16 人工智能

866阅读

掰开安卓手机，满屏都是三个字：大模型丨模力时代

这年头，安卓厂商没个大模型，都不敢开手机发布会了。前脚OPPO刚用大模型升级了语音助手，后脚vivo就官宣自研手机AI大模型; 小米发布会则直接将大模型当场塞进手机系统……其竞争激烈程度，不亚于抢芯片首发。到底是怎么回事? 究其原因，还是智能终端已经成...

生成式AI 2023-11-16 人工智能

988阅读

掰开安卓手机，满屏都是三个字：大模型

这年头，安卓厂商没个大模型，都不敢开手机发布会了。前脚OPPO刚用大模型升级了语音助手，后脚vivo就官宣自研手机AI大模型；小米发布会则直接将大模型当场塞进手机系统……其竞争激烈程度，不亚于抢芯片首发。到底是怎么回事？究其原因，还是智能终端已经...

AIGC 2023-11-16 人工智能

849阅读

老黄深夜炸场，世界最强AI芯片H200震撼发布！性能飙升90%，Llama 2推理速度翻倍，大批超算中心来袭

英伟达的节奏，越来越可怕了。就在刚刚，老黄又一次在深夜炸场——发布目前世界最强的AI芯片H200！较前任霸主H100，H200的性能直接提升了60%到90%。不仅如此，这两款芯片还是互相兼容的。这意味着，使用H100训练/推理模型的企业，可以无缝更...

生成式AI 2023-11-14 人工智能

816阅读

ICLR 2024论文审稿结果出炉！7000+高产论文创新纪录，扩散模型占比最高

ICLR 2024审稿结果公布了！ ICLR是机器学习领域重要的学术会议之一，每年举办一次。2024年是第十二届，将在奥地利维也纳5月7日-11日召开。根据OpenReview官方放出的结果显示，今年共有7135篇投稿论文。此外，另有国内开发者魏国...

大数据 2023-11-13 人工智能

1041阅读

语言作“纽带”，拳打脚踢各模态，超越Imagebind

北大联合腾讯打造了一个多模态15边形战士！以语言为中心，“拳打脚踢”视频、音频、深度、红外理解等各模态。具体来说，研究人员提出了一个叫做LanguageBind的多模态预训练框架。用语言作为与其它模态之间的纽带，冻结语言编码器，然后用对比学习方法...

生成式AI 2023-11-13 人工智能

837阅读

GPT-4比你更会问问题：让大模型自主复述，打破与人类对话的壁垒

在最新的人工智能领域动态中，人工生成的提示（prompt）质量对大语言模型（LLM）的响应精度有着决定性影响。OpenAI 提出的建议指出，精确、详细且具体的问题对于这些大语言模型的表现至关重要。然而，普通用户是否能够确保他们的问题对于 LLM 来说足够...

人工智能 2023-11-13 人工智能

792阅读

【网安AIGC专题10.11】2 ILF利用人类编写的自然语言反馈来训练代码生成模型：自动化反馈生成+多步反馈合并+处理多错误反馈+CODEGEN -M ONO 6.1 B model

Improving Code Generation by Training with Natural Language Feedback 写在最前面主要工作启发背景介绍应用现有工作的不足 Motivation动机方法 ILF...

大数据 2023-11-12 人工智能

1061阅读

乌镇峰会十年，“桨”声“心”影里的百度AI

11月8日，2023年世界互联网大会乌镇峰会开幕。世界互联网大会早已成为国内规格最高的科技盛事，是展现全球数字经济最新科技成果的舞台，是观察数字经济潮水奔涌方向的瞭望台，堪称数字经济风向标。在生成式人工智能掀起新一轮技术革命的2023年，乌镇峰会具备承前...

生成式AI 2023-11-11 人工智能

800阅读

全面对比GPT-3.5与LLaMA 2微调

通用大模型虽好，但通过微调得到一个专属大模型不仅可以提高模型的可操控性、输出格式的可靠性和语气的一致性，还能让用户缩短提示长度，加速API调用，降低成本。本文作者Sam L'Huillier对GPT-3.5与LLaMA 2的微调进行了基准...

大数据 2023-11-10 人工智能

894阅读

【云栖2023】王峰：开源大数据平台3.0技术解读

本文根据2023云栖大会演讲实录整理而成，演讲信息如下：演讲人：王峰 | 阿里云研究员，阿里云计算平台事业部开源大数据平台负责人演讲主题：开源大数据平台3.0技术解读实时化与Serverless是开源大数据3.0时代的必然选择阿里云开源...

生成式AI 2023-11-10 人工智能

984阅读

老黄H100再破纪录，4分钟训完GPT-3！全新「特供版」H20、L20和L2曝光，性能史诗级缩水

H100再次在MLPerf中刷新了记录! 英伟达超算NVIDIA Eos在GPT-3模型的基准测试中，只用了3.9分钟就完成了训练。这比6月份的刷新记录的成绩——10.9分钟，提升了近3倍。 Eos使用了多达10，752个H100和NVIDIA Quan...

AIGC 2023-11-10 人工智能

822阅读

昇腾CANN DVPP硬件加速训练数据预处理，友好解决Host CPU预处理瓶

本文分享自华为云社区《昇腾CANN 7.0 黑科技：DVPP硬件加速训练数据预处理，友好解决Host CPU预处理瓶颈》，作者：昇腾CANN 。随着人工智能的快速发展，越来越多的应用场景需要使用机器学习和深度学习模型。AI网络模型的训练一般分成...

AIGC 2023-11-10 人工智能

856阅读

仅开放2个多月百度：文心一言用户规模已达7000万

快科技11月9日消息，在2023年世界互联网大会乌镇峰会上，百度CTO王海峰披露，文心一言用户规模现已达到7000万。百度官方发文称，文心一言自8月31日面向全社会开放至今，用户规模达到7000万，场景4300个，应用2492个。飞桨和文心生态已凝聚8...

人工智能 2023-11-09 人工智能

741阅读

AI视野：ChatGPT和API发生重大中断；GPTs分阶段推出计划延迟；中国第二批11个大模型备案获批；阿里将开源720亿参数大模型

???AI新鲜事 ChatGPT和API发生重大中断! 11月9日凌晨，OpenAI在官网发布，ChatGPT和API发生重大中断，导致全球所有用户无法正常使用，宕机时间超过2小时。OpenAI已经找到问题所在并进行了修复，但仍然不稳定，会继续进行安全监控...

生成式AI 2023-11-09 人工智能

960阅读