pytorch 第8页 - AIGC资讯

20240203在Ubuntu20.04.6下配置stable-diffusion-webui.git

20240203在Ubuntu20.04.6下配置stable-diffusion-webui.git 2024/2/3 11:55 【结论：在Ubuntu20.04.6下，生成512x512分辨率的图像，大概需要11秒钟！】前提条件，可以通过技术...

生成式AI 2024-04-05 人工智能

784阅读

【Python实用API】语音转文本-whisper

Whisper安装及使用教程 0.Whisper介绍 1.Whisper安装 1.1 依赖库安装 1.2 Whisper安装 2.Whisper使用 2.1 Whisper基本使用（语音识别） 2.2 Whisper进阶使用 2.2.1...

大数据 2024-04-04 人工智能

1197阅读

AIGC学习笔记——DALL-E2详解+测试

它主要包括三个部分：CLIP，先验模块prior和img decoder。其中CLIP又包含text encoder和img encoder。（在看DALL·E2之前强烈建议先搞懂CLIP模型的训练和运作机制,之前发过CLIP博客）论文地址：https...

AIGC 2024-04-04 人工智能

1176阅读

大模型中常用的注意力机制GQA详解以及Pytorch代码实现

分组查询注意力 (Grouped Query Attention 是一种在大型语言模型中的多查询注意力 (MQA 和多头注意力 (MHA 之间进行插值的方法，它的目标是在保持 MQA 速度的同时实现 MHA 的质量。这篇文章中，我们将解释GQA的...

AIGC 2024-04-03 人工智能

683阅读

Stable Diffusion WebUI 1.8.0来了

上周 Stable Diffusion WebUI 发布了 1.8.0 版本，更新内容比较多，据说显存使用有了大幅的下降，这几天我也找时间把 AutoDL 镜像的版本做了个升级，有兴趣的同学可以去体验下新版本了。这里分享下其中几个我认为比较重要的更新。...

生成式AI 2024-04-03 人工智能

774阅读

Meta LLaMA 2实操：从零到一搭建顶尖开源大语言模型【超详篇】

前言本文章由 [jfj] 编写，所有内容均为原创。涉及的软件环境是在nvidia-docker环境进行的，如对docker未了解如何使用的，可以移步上一篇文章nvidia-docker安装详解。在 nvidia-docker 容器中运行时，Dock...

大数据 2024-04-02 人工智能

1349阅读

马斯克突发Grok 1.5！上下文长度至128k、HumanEval得分超GPT-4

就在刚刚，马斯克Grok大模型宣布重大升级。难怪之前突然开源了Grok-1，因为他有更强的Grok-1.5了，主打推理能力。来自xAI的官方推送啥也没说，直接甩链接。主打一个“字少事大” 图片新版本Grok有啥突破？一是上下文长度飙升，从8192...

人工智能 2024-04-01 人工智能

707阅读

谷歌狂喜：JAX性能超越Pytorch、TensorFlow！或成GPU推理训练最快选择

谷歌力推的JAX在最近的基准测试中性能已经超过Pytorch和TensorFlow，7项指标排名第一。而且测试并不是在JAX性能表现最好的TPU上完成的。虽然现在在开发者中，Pytorch依然比Tensorflow更受欢迎。但未来，也许有更多...

人工智能 2024-04-01 人工智能

672阅读

Python使用whisper实现语音识别（ASR）

目录 Whisper的安装 Whisper的基本使用识别结果转简体中文断句 Whisper的安装 Whisper是OpenAI的一个强大的语音识别库，支持离线的语音识别。在使用之前，需要先安装它的库： pip install ope...

人工智能 2024-03-31 人工智能

831阅读

AI绘画Imagen大力出奇迹生成图像

AI绘画Imagen大力出奇迹生成图像介绍 Imagen是一个文本到图像的扩散模型，由Google大脑团队研究所开发。 Imagen通过创新的设计，摈弃了需要预训练视觉-语言模型的繁琐步骤，直接采用了T5等大规模语言模型作为文...

大数据 2024-03-29 人工智能

843阅读

开源AI平台Lightning AI发布AI编译器“Thunder”以加速模型训练

开源人工智能平台Lightning AI宣布与Nvidia合作，发布了名为“Thunder”的下一代AI编译器，旨在加速人工智能模型的训练速度。据Lightning AI称，该编译器在实际场景中相比未优化的代码，可将大型语言模型（LLMs）的训练速度提高高...

人工智能 2024-03-29 人工智能

833阅读

llama factory学习笔记

模型模型名模型大小默认模块 Template Baichuan2 7B/13B W_pack baichuan2 BLOOM 560M/1.1B/1.7B/3B/7.1B/176B query_key_value - BLOOM...

大数据 2024-03-28 人工智能

1069阅读

Stable Diffusion~自注意力替换技术

在这篇文章中，作者展示了一个较为复杂的基于 Diffusers 开发的自注意力替换示例项目，用于提升 SD 视频生成的一致性。在这个过程中，作者讲述了 AttentionProcessor 相关接口函数的使用，并了解了如何基于全局管理类实现一个代码可维护性...

生成式AI 2024-03-28 人工智能

1343阅读

Stable Diffusion生成式扩散模型代码实现原理

Stable Diffusion可以使用PyTorch或TensorFlow等深度学习框架来实现。这些框架提供了一系列的工具和函数，使得开发者可以更方便地构建、训练和部署深度学习模型。因此可以使用PyTorch或TensorFlow来实现Stable Di...

人工智能 2024-03-27 人工智能

1180阅读

【在线回放】NVIDIA GTC 2024 大会 | 如何降低 AI 工程成本？蚂蚁从训练到推理的全栈实践

本文内容来源于蚂蚁集团 AI Infra部门负责人张科，在 GTC 2024 大会 China AI Day 线上专场的演讲。在演讲中张科分享了 AI 工程当前的现状和主要挑战，以及蚂蚁集团在 AI 工程领域的实践经验和开源项目，也欢迎 AI 工程领域的同...

AIGC 2024-03-27 人工智能

825阅读

TensorFlow深度学习框架模型推理Pipeline进行人像抠图推理

概述为了使ModelScope的用户能够快速、方便的使用平台提供的各类模型，提供了一套功能完备的Python library，其中包含了ModelScope官方模型的实现，以及使用这些模型进行推理，finetune等任务所需的数据预处理，后处理，效果...

大数据 2024-03-26 人工智能

709阅读

使用 Keras 的 Stable Diffusion 实现高性能文生图

前言在本文中，我们将使用基于 KerasCV 实现的 Stable Diffusion 模型进行图像生成，这是由 stable.ai 开发的文本生成图像的多模态模型。 Stable Diffusion 是一种功能强大的开源的文本到图像生成模型。虽然...

大数据 2024-03-25 人工智能

857阅读

3140参数Grok-1推理加速3.8倍，PyTorch+HuggingFace版来了

马斯克说到做到开源Grok-1，开源社区一片狂喜。但基于Grok-1做改动or商用，都还有点难题： Grok-1使用Rust+JAX构建，对于习惯Python+PyTorch+HuggingFace等主流软件生态的用户上手门槛高。 △图注：Grok登...

AIGC 2024-03-25 人工智能

719阅读

Fastwhisper + Pyannote 实现 ASR + 说话者识别

文章目录前言一、faster-whisper简单介绍二、pyannote.audio介绍三、faster-whisper + pyannote.audio 实现语者识别四、多说几句前言最近在研究ASR相关的业务，也...

AIGC 2024-03-24 人工智能

1369阅读

一图揽尽全球LLM崛起之路；LLM概念速查清单；DALL·E提示词红宝书·在线版；fast.ai新课带你从零实现Stable Diffusion | ShowM

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? LLM 崛起之路：全球大语言模型「规模增长」可视化交互图 informationisbeautiful.net/visualizati…...

人工智能 2024-03-23 人工智能

927阅读

最全总结！机器学习优化算法！

机器学习的最优化算法是用于找到最佳模型参数，以最小化预测误差的算法。这些算法通过迭代地调整模型参数，以不断改进模型的性能。本文系统地介绍了优化算法，基本脉络是从优化的基础知识，到各种优化算法原理的介绍及代码示例，最后放上各种算法的对比及实践经验总结!...

人工智能 2024-03-22 人工智能

972阅读

人工智能如何发展到AIGC？解密一份我四年前写的机器学习分享材料

正文共：777 字 26 图，预估阅读时间：2 分钟我第一次参与到人工智能中，还是在H3C的时候，当时H3C搞领航者峰会，准备了一个智能问答机器人——吱吱答。当时的吱吱答，是真的“人工”智能，实现机制就是传统的关键词识别、系统问题匹配等，...

人工智能 2024-03-22 人工智能

711阅读

Windows下安装BigDL-LLM的总结（附Whisper加速环境需求）

1. 下载安装Anaconda 2. 新建Python虚拟环境在Windows下启动Anaconda PowerShell Prompt，输入以下命令新建名为bigdl-llm的虚拟环境 conda create -n bigdl-llm p...

生成式AI 2024-03-22 人工智能

814阅读

英伟达推出6G研究云平台，致力于实现6G RAN雄伟目标

在凭借RAN加速器进军移动网络领域之后，英伟达希望依托芯片和AI技术，能够在6G领域发挥更大、更关键的作用。在日前举办的2024年度GTC AI大会上，英伟达宣布推出新的6G研究云平台(6G Research Cloud Platform 。这是一种...

人工智能 2024-03-21 人工智能

715阅读

如何从头开始编写LoRA代码，这有一份教程

LoRA（Low-Rank Adaptation）作为一种用于微调 LLM（大语言模型）的流行技术，最初由来自微软的研究人员在论文《 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 》中提出。不同于其...

人工智能 2024-03-20 人工智能

779阅读

Python AI 之Stable-Diffusion-WebUI

Stable-Diffusion-WebUI简介通过Gradio库，实现Stable Diffusion web 管理接口 Windows 11 安装Stable-Diffusion-WebUI 个人认为Stable-Diffusion-We...

AIGC 2024-03-19 人工智能

963阅读

AIGC: 2 语音转换新纪元-Whisper技术在全球客服领域的创新运用

背景现实世界，人跟人的沟通相当一部分是语音沟通，比如打电话，聊天中发送语音消息。而在程序的世界，大部分以处理字符串为主。所以，把语音转换成文字就成为了编程世界非常普遍的需求。 Whisper 是由 OpenAI 开发的一种高效的语音识别（AS...

生成式AI 2024-03-19 人工智能

779阅读

小妙招：Copilot 当跳板免费调用 GPT4

GPT4 每月 20 刀，Github Copilot 每月 10 刀首先叠个甲：免费不是 0 成本。由于我在日常开发过程中，Copilot 对我来说是必需品，我会用它检查代码、写工具函数、写注释、干苦力。所以这钱是我的必要支出。而这篇文章是介...

人工智能 2024-03-18 人工智能

985阅读

20240203在WIN10下配置stable-diffusion-webui.git

20240203在WIN10下配置stable-diffusion-webui.git 2024/2/3 11:55 【结论：在WIN10下，生成512x512分辨率的图像，大概需要9秒钟！】【结论：在Ubuntu20.04.6下，生成512x512...

AIGC 2024-03-17 人工智能

791阅读

Whisper实现语音识别转文本

#教程主要参考开源免费离线语音识别神器whisper如何安装，OpenAI开源模型Whisper——音频转文字 Whisper是一个开源的自动语音识别系统，它在网络上收集了680,000小时的多语种和多任务监督数据进行训练，使得它可以将多种语言的音频...

生成式AI 2024-03-15 人工智能

1010阅读

Meta公布Llama 3训练集群细节！储备60万块H100迎接AGI

每年3月份，照例各家大厂又要开始秀自己最新的产品和研究了。 OpenAI刚刚发布了震惊世人的Sora，最新的ChatGPT版本似乎也是箭在弦上。谷歌更是举全公司之力，从去年底就开始放出了包括Gemini Ultra，Gemini 1.5，Gemma在内...

生成式AI 2024-03-15 人工智能

719阅读

Meta新增两大万卡集群，投入近50000块英伟达H100 GPU

Meta日前推出两个功能强大的GPU集群，用于支持下一代生成式AI模型的训练，包括即将推出的Llama 3。据悉，这两个数据中心的GPU数量均高达24,576块，专为支持比之前发布的更大、更复杂的生成式AI模型而构建。作为一种流行的开源算法模型，M...

大数据 2024-03-14 人工智能

733阅读

超强！深度学习Top10算法！

自2006年深度学习概念被提出以来，20年快过去了，深度学习作为人工智能领域的一场革命，已经催生了许多具有影响力的算法。那么，你所认为深度学习的top10算法有哪些呢？以下是花哥我心目中的深度学习top10算法，它们在创新性、应用价值和影响力方面都具...

生成式AI 2024-03-14 人工智能

778阅读

探索Kubernetes与AI的结合：PyTorch训练任务在k8s上调度实践

概述 Kubernetes的核心优势在于其能够提供一个可扩展、灵活且高度可配置的平台，使得应用程序的部署、扩展和管理变得前所未有的简单。通用计算能力方面的应用已经相对成熟，云原生化的应用程序、数据库和其他服务可以轻松部署在Kubernetes环境中，实现...

生成式AI 2024-03-14 人工智能

744阅读

端到端没有数据怎么办？ActiveAD：面向规划的端到端自动驾驶主动学习！

本文经自动驾驶之心公众号授权转载，转载请联系出处。自动驾驶的端到端可微学习最近已成为一种突出的范式。一个主要瓶颈在于其对高质量标记数据的巨大需求，例如3D框和语义分割，这些数据的手动注释成本是出了名的昂贵。由于AD中样本内的行为往往存在长尾分布这一...

人工智能 2024-03-13 人工智能

759阅读

Llama-3背后基础训练设施全揭秘：两个24KGPU集群，共4.9万个H100

作者丨Kevin Lee、Adi Gangidi、Mathew Oldham 编译丨诺亚出品 | 51CTO技术栈（微信号：blog51cto）日前，Meta在官网公布了两个全新的24K H100 GPU集群（49,152个），并就新集群的技术细节...

人工智能 2024-03-13 人工智能

1240阅读

【AI实战】从零开始搭建中文 LLaMA-33B 语言模型 Chinese-LLaMA-Alpaca-33B

【AI实战】从零开始搭建中文 LLaMA-33B 语言模型 Chinese-LLaMA-Alpaca-33B 简介环境配置环境搭建依赖安装代码及模型权重拉取拉取 Chinese-LLaMA-Alpaca 拉取 llama-30b...

大数据 2024-03-13 人工智能

714阅读

AIGC:语音克隆模型Bert-VITS2-2.3部署与实战

1 VITS2模型 1.1 摘要单阶段文本到语音模型最近被积极研究，其结果优于两阶段管道系统。以往的单阶段模型虽然取得了较大的进展，但在间歇性非自然性、计算效率、对音素转换依赖性强等方面仍有改进的空间。本文提出VITS2，一种单阶段的文本到语音模型...

大数据 2024-03-12 人工智能

1558阅读

DALL·E 2 文生图模型实践指南

前言：本篇博客记录使用dalle2模型进行推断时借鉴的相关资料和DEBUG流程。相关博客：超详细！DALL · E 文生图模型实践指南目录 1. 环境搭建和预训练模型准备环境搭建预训练模型下载 2. 代码 3. B...

人工智能 2024-03-11 人工智能

840阅读

一键Run带你体验扩散模型的魅力

在文生视频领域，Sora将带来短视频的智能化变革，打破当前内容平台等额原有数据壁垒，短视频创作的生态护城河，同时Sora融入短视频工作流，极大的增强用户的体验，降低创作难度和成本，极大拓展创作者的能力边界，激发短视频创作空间。在视频创作...

生成式AI 2024-03-11 人工智能

668阅读

本地开启stable diffusion web-ui体验AIGC文生图，图生图

目录准备工作主机电脑配置检查安装以下软件 Python Git 下载stable-diffusion-webui仓库根据显卡属性安装CUDA 2.下载stable diffusion的训练模型启动问题处理模型加载问题...

人工智能 2024-03-11 人工智能

977阅读

GPU部署AI绘画实践（腾讯云部署）

GPU部署AI绘画实践背景 AI绘画模型（以StableDiffusion为首）自去年推出后快速迭代。近期，市面上又出现了一批效果惊艳的新突破。本文将演示如何使用 GPU云服务器，快速部署 AI 绘画模型。从创建机器到完成部署...

AIGC 2024-03-10 人工智能

837阅读

不到百行代码，使用Whisper进行视频字幕生成。

前言最近在学习视频剪辑的时候，希望找一款软件进行翻译；发现大多数是调用某云的Api进行翻译。通过查询资料,打算使用Whisper进行本地视频语音的识别，然后进行字幕文件的编辑（srt），最后通过ffmpeg添加到视频中。 Whisper 是...

AIGC 2024-03-10 人工智能

929阅读

0.8秒一张图40hx矿卡stable diffusion webui 高质极速出图组合(24.3.3）

新消息是。经过三个月的等待，SD Webui (automatic1111 终于推出了新版本1.8.0，本次版本最大的更新，可能就是pytorch更新到2.1.2, 不过还是晚了pytorch 2.2.2版。不过这版的一些更新，在forget分支上早就...

人工智能 2024-03-09 人工智能

895阅读

AI绘画再提速-stable diffusion LCM Lora模型简书

这是基于stable diffusion webui (automatic1111项目）中安装LCM 模型的方法，可大幅提升绘图速度。方法一：SD1.5基础模型，方法比较简单，直接从https://huggingface.co/latent-consi...

AIGC 2024-03-09 人工智能

1034阅读

前谷歌大佬离职创业，不到一年造出GPT3.5和Gemini Pro，惨痛忠告：GPU简直菜鸡，就像是买彩票！

作者 | Yi Tay 编译 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）你敢相信吗？一位前谷歌大佬，离职成立公司，不到一年，从头训练出了“GPT3.5”/“Gemini Pro”，注意，后者是多模态大模型！本文主人公Y...

生成式AI 2024-03-08 人工智能

731阅读

PyTorch 该怎么学？太简单了

挺多小伙伴问过PyTorch该怎么学，经过长期实践来看，初学者需要熟知的概念和用法真的不多，以下总结的简明指南一起看看吧！构建Tensor PyTorch 中的 Tensors 是多维数组，类似于 NumPy 的 ndarrays，但可以在 GPU...

大数据 2024-03-07 人工智能

763阅读

「还是谷歌好」，离职创业一年，我才发现训练大模型有这么多坑

如何在不到一年的时间里创办一家公司、筹集资金、购买芯片，并搭建出追赶 Gemini pro/GPT 3.5 的 LLM？很多人都对构建基础架构和训练大语言模型和多模态模型感到好奇，但真正走完「从零开始」这一流程的人很少。我们普遍认为，储备技术人才是前提...

人工智能 2024-03-07 人工智能

692阅读

AI加速引擎PAI-TorchAcc：OLMo训练加速最佳实践

作者：黄奕桐、沈雯婷、艾宝乐、王昂、李永摘要阿里云机器学习平台PAI开发的Pytorch训练加速框架PAI-TorchAcc已接入最新开源的大语言模型 OLMo。在保证模型效果和易用性的前提下，PAI-TorchAcc相对 PyTorch 性能在...

大数据 2024-03-07 人工智能

777阅读

【AI绘画】免费GPU Tesla A100 32G算力部署Stable Diffusion

免责声明在阅读和实践本文提供的内容之前，请注意以下免责声明：侵权问题: 本文提供的信息仅供学习参考，不用做任何商业用途，如造成侵权，请私信我，我会立即删除，作者不对读者因使用本文所述方法而导致的任何损失或损害负责。信息准确性: 本文提供...

人工智能 2024-03-07 人工智能

783阅读