gpu 第12页 - AIGC资讯

这个团队做了OpenAI没Open的技术，开源OpenRLHF让对齐大模型超简单

随着大型语言模型（LLM）规模不断增大，其性能也在不断提升。尽管如此，LLM 依然面临着一个关键难题：与人类的价值和意图对齐。在解决这一难题方面，一种强大的技术是根据人类反馈的强化学习（RLHF）。但是，随着模型越来越大，RLHF 通常需要维持多个模型...

生成式AI 2024-06-06 人工智能

794阅读

OpenAI前员工预测：2027年AGI降临！GPT智商飙升，4年从幼儿园蹿到高中生

AGI到底是科技公司画的大饼，还是可预测的未来？几天前，Anthropic一名25岁的高管在博客上发文，表示自己已经准备好了3年后退休，让AI取代自己的工作。最近，OpenAI前员工的一篇博客文章也有类似的观点。图片他不仅认为AGI很可能实现，而...

大数据 2024-06-06 人工智能

893阅读

无需搭建环境，零门槛带你体验Open-Sora文生视频应用

案例体验 ?* 本案例需使用 Pytorch-2.0.1 GPU-V100 及以上规格运行 ?* 点击Run in ModelArts，将会进入到ModelArts CodeLab中，这时需要你登录华为云账号，如果没有账号，则需要...

AIGC 2024-06-06 人工智能

864阅读

斯坦福让“GPU高速运转”的新工具火了，比FlashAttention2更快

AI算力资源越发紧张的当下，斯坦福新研究将GPU运行效率再提升一波—— 内核只有100行代码，让H100比使用FlashAttention-2，性能还要提升30%。怎么做到的？研究人员从“硬件实际需要什么？如何满足这些需求？”这两个问题出发，设计了...

人工智能 2024-06-06 人工智能

940阅读

一夜暴富50亿，老黄新晋「流量明星」！英伟达市值破3万亿，超越苹果成全球第二

3万亿美元，英伟达市值再次创造历史！当地时间周三，股价涨超5%。现在的英伟达，已经成为全球第二大市值最高的公司，超越苹果，仅次微软。距离世界第一，仅差一步之遥。而上一次英伟达市值首超苹果，还是2002年。当时，两家公司的市值不到100亿美元。...

人工智能 2024-06-06 人工智能

855阅读

如何在本地运行Stable Diffusion生成震撼图像

2022年AI的奇迹：如何在本地运行Stable Diffusion生成震撼图像 2022年是人工智能领域的奇迹之年。Stability.ai 开源的 Stable Diffusion 模型与 OpenAI 发布的 ChatGPT，像两颗耀眼的明星，点...

AIGC 2024-06-06 人工智能

938阅读

马斯克旗下xAI与孟菲斯市合作拟打造全球最大超算基地

埃隆·马斯克旗下人工智能公司xAI正与田纳西州孟菲斯市洽谈合作，拟在该市建设全球规模最大的超级计算机"算力超级工厂"。这一项目的投资规模可能高达数十亿美元。这座超算将采用英伟达最新的H100系列GPU芯片，为xAI开发的对话AI系统Grok提供强大算力支...

生成式AI 2024-06-06 人工智能

831阅读

基于 Amazon EC2 快速部署 Stable Diffusion WebUI + chilloutmax 模型

自2023年以来，AI绘图已经从兴趣娱乐逐渐步入实际应用，在众多的模型中，作为闪耀的一颗明星，Stable diffusion已经成为当前最多人使用且效果最好的开源AI绘图软件之一。Stable Diffusion Web UI 是由AUTOMATIC11...

大数据 2024-06-06 人工智能

868阅读

使用llama.cpp在linux cuda环境部署llama2方法记录及遇到的问题

一、编译lllama.cpp 拉取llama.cpp库 cd llama.cpp make LLAMA_CUBLAS=1 LLAMA_CUDA_NVCC=/usr/local/cuda/bin/nvcc bug：编译问题使用make，nv...

生成式AI 2024-06-06 人工智能

2237阅读

面向AIGC的InfiniBand网络技术特性分析

    在AIGC的训练场景，基本上不差钱的客户都会首选InfiniBand，作为跨AI服务器节点的网络组网方案，今天我们就来讲一讲InfiniBand到底有那些针对AIGC场景的技术优化： &nbs...

大数据 2024-06-05 人工智能

1141阅读

英特尔牙膏挤爆：功耗降40%、AI算力120TOPS，你的下一代笔记本没有内存条了

英特尔为了AI，再次做出重大架构变革：像手机一样搞起SoC（系统级芯片），你的下一台笔记本不会再有独立内存条。刚刚推出的新一代AI PC低功耗移动平台架构Lunar Lake，采用全新MoP（Memory on Package）封装，片上集成16或3...

大数据 2024-06-05 人工智能

807阅读

Stable Diffusion安装（非秋叶包一键部署）

Stable Diffusion安装与配置详细步骤一、下载前置资源下载CUDA 1. 查看CUDA版本通过以下命令查看CUDA版本： nvidia-smi 复制确保CUDA版本符合要求。 2. 下载CUDA ...

生成式AI 2024-06-05 人工智能

1493阅读

LLM并发加速部署方案（llama.cpp、vllm、lightLLM、fastLLM）

大模型并发加速部署解析当前应用较广的几种并发加速部署方案！ llama.cpp、vllm、lightllm、fastllm四种框架的对比： llama.cpp：基于C++，①请求槽，②动态批处理，③CPU/GPU混合推理 vllm：基于Pyth...

大数据 2024-06-05 人工智能

3170阅读

利用 NVIDIA Riva 快速部署企业级中文语音 AI 服务并进行优化加速

一、Riva 概览 1. Overview Riva 是 NVIDIA 推出的一款 SDK，用于实时的 Speech AI 服务。它是一个高度可定制的工具，并且使用 GPU 进行加速。NGC 上提供了很多预训练好的模型，这些模型开箱即用，可以直接使用...

大数据 2024-06-05 人工智能

1080阅读

XSKY对象存储深度结合Alluxio分布式缓存系统，GPU利用率提高至90%以上

近日，Alluxio分布式缓存系统完成了与XSKY星辰天合的 XEOS V6.4 对象存储的兼容性测试，旨在解决数据管理和加速方面的挑战。双方进行了深度的产品对接和联合开发，将 Alluxio 分布式缓存系统与 XEOS 对象存储的众多应用特性进行结合，推...

大数据 2024-06-05 人工智能

920阅读

报道称，马斯克将数千个AI芯片从特斯拉转移到了X

根据CNBC获得的芯片制造商的电子邮件，埃隆·马斯克（Elon Musk）订购了数千个运往特斯拉的英伟达制造的AI芯片，这些芯片将被转移到他的社交媒体公司X。据该媒体报道，此举有可能将特斯拉收购价值5亿美元的处理器的时间推迟数月。图源备注：图片由AI生...

大数据 2024-06-05 人工智能

795阅读

【SD教程- ! 清晰易懂 ! 】1 本地部署Stable Diffusion绘图环境【超简单】

废话不多说直接上内容附上SD官网：https://stability.ai/ 1 部署SD环境分类我们知道SD需要对电脑配置有一定的要求，如果自己的电脑配置够用，就可以直接拿自己的电脑使用SD，如果电脑配置不够，需要在花钱云端部署（类型买一个...

大数据 2024-06-05 人工智能

1571阅读

儿童节变身小小音乐家，用ModelArts制作一张AIGC音乐专辑

本文分享自华为云社区《儿童节变身小小音乐家，用ModelArts制作一张AIGC音乐专辑》，作者：华为云社区精选。儿童节，如何给小朋友准备一份特别的礼物？这份AIGC音乐专辑制作攻略一定要收下一段文字灵感就能编织出一曲悠扬悦耳的旋律童话、...

大数据 2024-06-05 人工智能

897阅读

苏妈杀疯了：移动端最强NPU算力达50TOPS，最强AI芯片挑战英伟达

一年一度的 Computex 科技大会成为了 GPU 厂商们秀肌肉的舞台，其中当属英伟达和 AMD 最为亮眼。英伟达现场拿出了量产版 Blackwell 芯片，还公布了未来三年的产品路线，包括下一代 Rubin AI 平台。 AMD 当然也不甘示弱，CE...

生成式AI 2024-06-04 人工智能

908阅读

被作者删库的Llama 3-V原文再现！效果匹敌GPT4-V，训练费用暴降，区区不到500 美元，尺寸小100 倍，如何做到的

编译 | 言征作者 | Aksh Garg 备注：发稿前作者已经删掉原文出品 | 51CTO技术栈（微信号：blog51cto）近日，一款Llama3V最近被“先红后黑”的出了圈。作为全球顶尖研究学府的团队，身陷“抄袭”中国大模型的泥潭后，火速删稿...

生成式AI 2024-06-04 人工智能

964阅读

Mamba-2新架构出世一统江湖！普林斯顿CMU华人再出神作，性能狂飙8倍

年前，Mamba被顶会ICLR拒稿的消息曾引起轩然大波。甚至有研究人员表示：如果这种工作都被拒了，那我们这些「小丑」要怎么办？这次，新一代的Mamba-2卷土重来、再战顶会，顺利拿下了ICML 2024！仍是前作的两位大佬（换了个顺序），仍是熟...

AIGC 2024-06-04 人工智能

1300阅读

挑战英伟达！AMD亮出旗下最强AI芯片锐龙AI 300系列算力达50TOPS

在一年一度的Computex科技大会上，GPU厂商们展示了他们的最新技术成果。其中，英伟达和AMD的表现尤为突出。英伟达在会上展示了量产版的Blackwell芯片，并宣布了未来三年的产品路线图，包括下一代Rubin AI平台。而AMD的CEO苏姿丰则展示...

大数据 2024-06-04 人工智能

1034阅读

一年一款大更新，英伟达AI芯片能打破摩尔定律？

是的，正如黄仁勋在台北电脑展2024展前演讲中所说，生成式AI技术正在不知不觉中影响着我们的生活与工作。而早在2014年就提出CUDA（通用计算平台）概念的英伟达，已经尝到人工智能带给它的甜头。市值从1万亿美元到2.7万亿美元，英伟达仅仅用了一年左右的时...

AIGC 2024-06-04 人工智能

826阅读

不想炸薯条的Ilya和不送GPU的英伟达，Hinton最新专访：道路千万条，安全第一条

从谷歌离职一年之际，「人工智能教父」Hinton接受了采访。 ——也许是因为徒弟Ilya终于被从核设施中放了出来？（狗头）视频地址：https://www.youtube.com/watch?v=tP-4njhyGvo 当然了，采访教父的小伙子也非等...

大数据 2024-06-03 人工智能

799阅读

意外！老黄剧透下一代GPU芯片，新演讲又把摩尔定律按在地上摩擦

刚刚，中国台湾大学体育场，欢呼阵阵如同演唱会，但这次“摇滚巨星”，其实是英伟达创始人黄仁勋，再次回到学校，带来Computex重磅演讲，以及英伟达的新一代GPU。是的，英伟达新架构Blackwell宣布不过3个月，老黄就把后三代路线图全公开了： 20...

人工智能 2024-06-03 人工智能

855阅读

活体脑细胞做成16核芯片，用Python就能编程，九个机构开展实验36所大学排队

首个“脑PU”来了！由“16核”类人脑器官（human brain organoids）组成。这项研究来自瑞士生物计算创业公司FinalSpark，并且他们宣称：这种生物处理器（bioprocessor）的功耗比传统数字处理器低100万倍。这些类脑...

AIGC 2024-06-03 人工智能

927阅读

Llama-Factory 简介二，脚本详解 LLaMA-Factory/src/train_bash.py LLaMA-Factory/src/llmtuner/train/pt/workfl

examples/ ├── lora_single_gpu/ │ ├── pretrain.sh: 基于 LoRA 进行增量预训练 │ ├── sft.sh: 基于 LoRA 进行指令监督微调 │ ├── reward.sh: 基于 LoRA...

生成式AI 2024-06-03 人工智能

1715阅读

7B？13B？175B？解读大模型的参数

大模型也是有大有小的，它们的大小靠参数数量来度量。GPT-3就有1750亿个参数，而Grok-1更是不得了，有3140亿个参数。当然，也有像Llama这样身材苗条一点的，参数数量在70亿到700亿之间。这里说的70B可不是指训练数据的数量，而是指模型中...

生成式AI 2024-06-03 人工智能

1465阅读

下代GPU会非常难买！黄仁勋敦促企业快买AI芯片买越多越省钱

快科技6月3日消息，近日，黄仁勋公开表示称，下代GPU会非常难买，并希望企业买多一些自家的AI芯片。黄仁勋预警，下一代GPU会非常难买。同时他还敦促企业采购更多AI芯片。你买的越多，省的就越多。这就是所谓的CEO数学。虽然不准确，但却是正确的。”黄仁勋...

AIGC 2024-06-03 人工智能

709阅读

老黄一口气解密三代GPU！粉碎摩尔定律打造AI帝国，量产Blackwell解决ChatGPT全球耗电难题

想了解更多AIGC的内容，请访问：51CTO AI.x社区 https://www.51cto.com/aigc/ 就在刚刚，老黄手持Blackwell向全世界展示的那一刻，全场的观众沸腾了。它，是迄今为止世界最大的芯片！眼前的这块产品，凝聚着数...

大数据 2024-06-03 人工智能

820阅读

Nvidia发布GeForce RTX增强版，为AI PC数字助手提供支持

Nvidia 在Computex 展会上推出了新的 RTX 技术，为新的 GeForce RTX AI 笔记本电脑提供动力。其中，Project G-Assist 技术演示为 PC 游戏和应用提供上下文感知的帮助。这项技术首次在 Studio Wildca...

生成式AI 2024-06-03 人工智能

921阅读

基于llama.cpp的GGUF量化与基于llama-cpp-python的部署

前言：笔者在做GGUF量化和后续部署的过程中踩到了一些坑，这里记录一下。 1.量化项目地址：llama.cpp 1.1 环境搭建笔者之前构建了一个用于实施大模型相关任务的docker镜像，这次依然是在这个镜像的基础上完成的，这里给出Dock...

人工智能 2024-06-03 人工智能

1852阅读

【AIGC调研系列】XTuner、Unsloth方案对比

XTuner和Unsloth都是用于大型语言模型（LLM）训练和微调的工具，但它们在设计理念、技术实现和性能表现上存在一些差异。技术架构与支持的模型规模： XTuner支持千亿级参数的模型，并能够处理超过百万个tokens的序列。它通过序列...

人工智能 2024-06-03 人工智能

1905阅读

【独家】万字长文带你梳理Llama开源家族：从Llama-1到Llama-3

Datawhale干货作者：张帆，陈安东，Datawhale成员引言在AI领域，大模型的发展正以前所未有的速度推进技术的边界。北京时间4月19日凌晨，Meta在官网上官宣了Llama-3，作为继Llama-1、Llama-...

AIGC 2024-06-02 人工智能

1044阅读

欢迎 Llama 3：Meta 的新一代开源大语言模型

介绍 Meta 公司的 Llama 3 是开放获取的 Llama 系列的最新版本，现已在 Hugging Face 平台发布。看到 Meta 持续致力于开放 AI 领域的发展令人振奋，我们也非常高兴地全力支持此次发布，并实现了与 Hugging Fac...

生成式AI 2024-06-02 人工智能

1061阅读

10 分钟，教你如何用 LLama-Factory 训练和微调 LLama3 模型

本文将探讨于2024年3月21日发布的LLama-Factory，并学习如何使用 DigitalOcean 旗下的 Paperspace平台对 LLama 3 进行微调。为了完成我们的任务，我们将使用 NVIDIA A4000 GPU，它被认为是功能最强大...

大数据 2024-06-02 人工智能

1467阅读

轻松上手！Midjourney AI绘画生成器免费使用秘籍全解析

Midjourney是一款AI绘画平台，通过智能化的算法和自学习的机制，为用户提供高效、精确、易用的创作工具。自2018年起，Midjourney已经在互联网创作和设计领域广泛应用，吸引了越来越多的用户和粉丝。在本文中，我们将为您详细介绍Midjourne...

大数据 2024-06-02 人工智能

1111阅读

Midjourney教程(完整版)-看这篇就够了

Midjourney使用指南 - 订阅计划费用比较 Midjourney 具有三个订阅版本。按月或全年支付可享受 20% 的折扣。每个订阅计划都包括访问 Midjourney 图库、官方 Discord、一般商业使用条款等。如何订阅使用...

大数据 2024-06-02 人工智能

1738阅读

“全网最全”LLM推理框架集结营 | 看似微不足道，却决定着AIGC项目的成本、效率与性能!

00-前序随着ChatGPT、GPT-4等大语言模型的出现，彻底点燃了国内外的学者们与企业家们研发LLM的热情。国内外的大语言模型如雨后春笋一般的出现，这些大语言模型有一部分是开源的，有一部分是闭源的。伴随着大语言模型的出现，国...

人工智能 2024-06-02 人工智能

2477阅读

玩转AI，笔记本电脑安装属于自己的Llama 3 8B大模型和对话客户端

2024 年 4 月 18 日，Meta开源了 Llama 3 大模型，把 AI 的门槛降低到了最低，这是人工智能领域的一个重要飞跃。我们个人也可以部署大模型了，这简直就是给个人开发者发了个大红包！Llama 3 模型有不同的参数版本，本文主要分享我在个人...

大数据 2024-06-01 人工智能

1138阅读

AI智能体研发之路-模型篇（一）：大模型训练框架LLaMA-Factory在国内网络环境下的安装、部署及使用

博客导读：《AI—工程篇》 AI智能体研发之路-工程篇（一）：Docker助力AI智能体开发提效 AI智能体研发之路-工程篇（二）：Dify智能体开发平台一键部署 AI智能体研发之路-工程篇（三）：大模型推理服务框架Ollama...

大数据 2024-06-01 人工智能

1477阅读

LLaMA-Factory 微调训练

LLaMA-Factory 微调训练该框架功能，标注-微调-导出-合并-部署，一整条流程都有，而且训练时消耗的gpu算力也会小一些一，安装（推荐在linux中训练，win可以用wsl+docker） git clone https:...

大数据 2024-06-01 人工智能

1740阅读

stable diffusion的从安装到使用

stable-diffusion，一个免费开源的文生图软件，文章主要讲怎么从源码开始安装，以及使用的方式 git地址：https://github.com/AUTOMATIC1111/stable-diffusion-webui 本人电脑环境win10...

人工智能 2024-06-01 人工智能

1292阅读

驾驭Stable Diffusion：本地机器上文本到图像生成的全面指南

引言 Stable Diffusion 席卷全球，彻底改变了我们通过文本提示创建图像的方式。在本篇针对中级用户的综合指南中，我们将深入探讨在本地机器上使用 Stable Diffusion 进行文本到图像生成的世界。无论您是艺术家、设计师还是人工智能爱好...

生成式AI 2024-06-01 人工智能

905阅读

Datawhale |【独家】万字长文带你梳理Llama开源家族：从Llama-1到Llama-3

本文来源公众号“Datawhale”，仅用于学术分享，侵权删，干货满满。原文链接：【独家】万字长文带你梳理Llama开源家族：从Llama-1到Llama-3 0. 引言在AI领域，大模型的发展正以前所未有的速度推进技术的边界。北京时间4月1...

人工智能 2024-06-01 人工智能

1022阅读

GpuMall智算云：meta-llama/llama3/Llama3-8B-Instruct-WebUI

LLaMA 模型的第三代，是 LLaMA 2 的一个更大和更强的版本。LLaMA 3 拥有 35 亿个参数，训练在更大的文本数据集上GpuMall智算云 | 省钱、好用、弹性。租GPU就上GpuMall,面向AI开发者的GPU云平台 Llama 3 的推...

人工智能 2024-05-31 人工智能

1079阅读

从零开始学AI绘画，万字Stable Diffusion终极教程（一）

【第1期】SD入门 2022年8月，一款叫Stable Diffusion的AI绘画软件开源发布，从此开启了AIGC在图像上的爆火发展时期率先学会SD的人，已经挖掘出了越来越多AI绘画有趣的玩法从开始的AI美女、线稿上色、真人漫改、头...

AIGC 2024-05-31 人工智能

1079阅读

Stable Diffusion 3.0技术论文解读

前几周 AI绘画领域扔出了一颗重磅炸弹那就是Stability AI发布了备受期待的Stable Diffusion 3.0 简称SD3 一周后官方放出了一篇详尽的技术论文阐述了SD3实现突破性进展的底层原理但是同时也引发了一连串疑问...

生成式AI 2024-05-31 人工智能

959阅读

使用llama.cpp量化部署LLM

以llama.cpp工具为例，介绍模型量化并在本地部署的详细步骤。这里使用 Meta最新开源的 Llama3-8B 模型。 1 环境系统应有make（MacOS/Linux自带）或cmake（Windows需自行安装）编译工具 Python 3....

大数据 2024-05-31 人工智能

2084阅读

LLaMa系列模型详解（原理介绍、代码解读）：LLaMA 3

LLaMA 3 2024年4月18日，Meta 重磅推出了Meta Llama 3，Llama 3是Meta最先进开源大型语言模型的下一代，包括具有80亿和700亿参数的预训练和指令微调的语言模型，能够支持广泛的应用场景。这一代Llama在一系列行业标...

AIGC 2024-05-31 人工智能

1599阅读