pytorch 第12页 - AIGC资讯

【Stable Diffusion应用案例系列】【1】一键抠图--rembg插件安装与使用

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐----...

大数据 2024-01-09 人工智能

930阅读

Whisper OpenAI开源语音识别模型

介绍 Whisper 是一个自动语音识别（ASR，Automatic Speech Recognition）系统，OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）和多任务（multitask）监督数据对 Whisper 进行了训练...

大数据 2024-01-09 人工智能

2010阅读

whisper深入-语者分离

文章目录学习目标：如何使用whisper 学习内容一：whisper 转文字 1.1 使用whisper.load_model( 方法下载，加载 1.2 使用实例对文件进行转录 1.3 实战学习内容二：语者分离（pyannote.aud...

生成式AI 2024-01-09 人工智能

995阅读

1、aigc图像相关

aigc图像相关一、Diffusion webui 在autodl上部署一些问题二、lora和kohyass （1）角色模型（2）风格模型（3）dreambooth （4）模型合并（5）Lora加Adetail 其他三、sd a...

人工智能 2024-01-09 人工智能

2198阅读

如何用Stable Diffusion模型生成个人专属创意名片？

目录 1 什么是二维码？ 2 什么是扩散模型？ 3 Stable Diffusion环境搭建 4 开始制作创意名片结语 1 什么是二维码？二维码是一种用于存储和传输信息的方便而广泛使用的图像编码技术。它是由黑色方块和白色空白区...

大数据 2024-01-08 人工智能

1059阅读

Colossal-AI团队开源了SwiftInfer 大模型无限流式输入推理飙升46%

近日，国产开源项目SwiftInfer实现了无限流式输入推理，成功提升了大模型推理性能46%。这是一个重大突破，可以为多轮对话场景提供高效可靠的落地方案。它采用了attention sink注意力机制、窗口注意力优化、KV Cache机制优化等方法，Sw...

生成式AI 2024-01-08 人工智能

866阅读

AIGC之文本内容生成概述（下）——Transformer

在上一篇文章中，我们一口气介绍了LSTM、Word2Vec、GloVe、ELMo等四种模型的技术发展，以及每种模型的优缺点与应用场景，全文超过一万字，显得冗长且繁杂，在下文部分我们将分开介绍Transformer、BERT、GPT1/GPT2/GPT3/C...

生成式AI 2024-01-08 人工智能

1033阅读

学习实践-Whisper语音识别模型实战（部署+运行）

1、Whisper内容简单介绍 OpenAI的语音识别模型Whisper，Whisper 是一个自动语音识别（ASR，Automatic Speech Recognition）系统，OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）...

生成式AI 2024-01-08 人工智能

1117阅读

13个优秀开源语音识别引擎

语音识别（ASR）在人机交互方面发挥着重要的作用，可用于：转录、翻译、听写、语音合成、关键字定位、语音日记、语言增强等场景。语音识别基本过程一般包括：分析音频、音频分解、格式转换、文本匹配，但实际的语音识别系统可能会更复杂，并且可能包括其他步骤和功能组件...

人工智能 2024-01-08 人工智能

1267阅读

400万token上下文、推理再加速46%！最新开源方案升级MIT成果，推理成本再降低

22倍加速还不够，再来提升46%，而且方法直接开源！这就是开源社区改进MIT爆火项目StreamingLLM的最新成果。 StreamingLLM可以在不牺牲生成效果、推理速度的前提下，实现多轮对话共400万个token，22.2倍推理速度提升。该项...

大数据 2024-01-08 人工智能

943阅读

使用LLaMA-Factory微调ChatGLM3

1、创建虚拟环境略 2、部署LLaMA-Factory （1）下载LLaMA-Factory https://github.com/hiyouga/LLaMA-Factory （2）安装依赖 pip3 install -r requi...

人工智能 2024-01-08 人工智能

1434阅读

大模型无限流式输入推理飙升46%！国产开源加速「全家桶」，打破多轮对话长度限制

在大型语言模型（LLM）的世界中，处理多轮对话一直是一个挑战。前不久麻省理工Guangxuan Xiao等人推出的StreamingLLM，能够在不牺牲推理速度和生成效果的前提下，可实现多轮对话总共400万个token的流式输入，22.2倍的推理速度提升...

人工智能 2024-01-08 人工智能

1134阅读

如何在你的电脑上完成whisper的简单部署

如何在你的电脑上完成whisper的简单部署（超详细教程）前言一、显卡驱动、CUDA ToolKit、cuDNN的下载 1. 显卡驱动 2. CUDA ToolKit 3. cuDNN的安装二、windows下安装conda 三、使...

大数据 2024-01-08 人工智能

1660阅读

使用PyTorch实现去噪扩散模型

在深入研究去噪扩散概率模型(DDPM 如何工作的细节之前，让我们先看看生成式人工智能的一些发展，也就是DDPM的一些基础研究。 VAE VAE 采用了编码器、概率潜在空间和解码器。在训练过程中，编码器预测每个图像的均值和方差。然后从高斯分布中对这些值进...

人工智能 2024-01-08 人工智能

855阅读

突破 Pytorch 核心点，自动求导！！

嗨，我是小壮！关于pytorch中的自动求导操作，介绍有关pytorch自动求导的概念. 自动求导是深度学习框架中的一项重要功能，它允许机器学习模型自动计算梯度，进而进行参数更新和优化。 PyTorch是一个流行的深度学习框架，它通过动态计算图和自动...

AIGC 2024-01-08 人工智能

894阅读

Meta最新模型LLaMA详解（含部署+论文）

来源：投稿作者：毛华庆编辑：学姐前言本课程来自深度之眼《大模型——前沿论文带读训练营》公开课，部分截图来自课程视频。文章标题：LLaMA: Open and Efficient Foundation Language Mode...

大数据 2024-01-08 人工智能

1018阅读

【AI实战】llama.cpp量化cuBLAS编译；nvcc fatal:Value ‘native‘ is not defined for option ‘gpu-architecture‘

【AI实战】llama.cpp量化cuBLAS编译；nvcc fatal:Value 'native' is not defined for option 'gpu-architecture' llama.cpp量化介绍 llama.cpp 编...

人工智能 2024-01-08 人工智能

1076阅读

使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion

使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion 0. 前言 1. Amazon SageMaker 与机器学习 1.1 机器学习流程 1.2 Amazon SageMaker 简介 1.3 Amaz...

生成式AI 2024-01-07 人工智能

1084阅读

Stable Diffusion实现之 Huggingface

Stable Diffusion 以及Huggingface的安装实现介绍： Stable Diffusion AI是指将Stable Diffusion模型应用于人工智能领域的相关技术和方法。通常情况下，Stable Diffusion AI主...

大数据 2024-01-07 人工智能

1168阅读

[玩转AIGC]如何训练LLaMA2（模型训练、推理、代码讲解，并附可直接运行的kaggle连接）

目录一、clone仓库二、数据集下载与处理 1、数据集下载 2、数据集标记化（耗时较长）三、修改配置四、开始训练五、模型推理六、train.py训练代码讲解 1、导包 2、定义模型训练参数与相关设置 3、加载模型配置 4、迭代...

AIGC 2024-01-07 人工智能

1160阅读

stable diffusion webui安装和运行中出现的bug及解决方式

webui的运行实在名为venv的虚拟环境中进行的，所以通过launch.py运行的时候，一定要先通过source venv/bin/activate激活虚拟环境venv。 1、报错：Couldn’t install gfpgan 原因：代理的问题...

生成式AI 2024-01-07 人工智能

1195阅读

20分钟，使用Amazon SageMaker快速搭建属于自己的AIGC应用

真火！作为最近一段时间人工智能领域内的顶流之一，AIGC（AI-Generated Content）早已火爆出圈，频登各大互联网平台热搜。 cite: 微软亚洲研究院官方微博这段时间以来，基于深度学习的内容生成在图像、视频、语音、音乐、...

大数据 2024-01-07 人工智能

822阅读

如何在亚马逊 SageMaker 进行 Stable Diffusion 模型在线服务部署

文章目录前言 - 浅谈 AIGC AIGC - 引领人工智能走向春天春天里盛开的 AI 绘画 AI 绘画之Stable Diffusion 2.0 登场人人都有机会成为前沿的技术探索者基于Amazon SageMaker进行Stab...

大数据 2024-01-06 人工智能

983阅读

AI平台：NVIDIA Toronto AI Lab

站点网址：https://nv-tlabs.github.io...

人工智能 2024-01-06 人工智能

1081阅读

精调训练中文LLaMA模型实战教程，民间羊驼模型

羊驼实战系列索引博文1：本地部署中文LLaMA模型实战教程，民间羊驼模型博文2：本地训练中文LLaMA模型实战教程，民间羊驼模型博文3：精调训练中文LLaMA模型实战教程，民间羊驼模型（本博客）简介在学习完上篇【博文2：本地训练中文LLaM...

大数据 2024-01-06 人工智能

859阅读

stable diffusion硬件要求

硬件要求# 内存# 建议使用不少于 16 GB 内存。在一些情况下，可能需要调高虚拟内存，以容纳模型文件。存储# 建议准备 40 GB 以上的可用硬盘空间。显卡# WARNING 注意显卡温度，有报道称显卡太热炸了。显卡型号#...

AIGC 2024-01-06 人工智能

1849阅读

Stable Diffusion AI绘画系列【23】:赛博朋克-机甲美女系列

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐----...

AIGC 2024-01-05 人工智能

897阅读

突破Pytorch核心，tensor ！！

今天会把pytorch在张量这方面的内容做一个记录。同时希望可以给大家提供一丢丢帮助！因为今儿分享的内容，绝对是非常干货的一些示例。先简单介绍下，在PyTorch中，张量是核心数据结构，它是一个多维数组，类似于NumPy中的数组。张量不仅仅是存储数...

AIGC 2024-01-05 人工智能

769阅读

突破Pytorch核心点，优化器！！

嗨，我是小壮！今儿咱们聊聊Pytorch中的优化器。优化器在深度学习中的选择直接影响模型的训练效果和速度。不同的优化器适用于不同的问题，其性能的差异可能导致模型更快、更稳定地收敛，或者在某些任务上表现更好。因此，选择合适的优化器是深度学习模型调优中...

人工智能 2024-01-05 人工智能

845阅读

pytorch快速训练ai作画模型的python代码

在 PyTorch 中训练 AI 作画模型的基本步骤如下: 准备数据集: 需要准备一个包含许多图像的数据集, 这些图像可以是手绘的或者是真实的图像. 定义模型: 选择一个适当的深度学习模型, 并使用 PyTorch 定义该模型. 例如...

人工智能 2024-01-05 人工智能

943阅读

斯坦福炒虾机器人爆火全网！华人团队成本22万元，能做满汉全席还会洗碗

今天，会做一大桌子菜的斯坦福机器人Mobile ALOHA刷屏全网。滑蛋虾仁、干贝烧鸡、蚝油生菜，色香味俱全，看着很诱人。就拿滑蛋虾仁这道菜来说，Mobile ALOHA在烧水的过程中先打上3颗鸡蛋，然后把虾仁放到水中焯熟，平底锅倒入鸡蛋液再加入...

AIGC 2024-01-04 人工智能

853阅读

阿里云容器服务助力万兴科技 AIGC 应用加速

2023 年堪称是 AIGC 元年，文生图领域诞生了 Stable Diffusion 项目，文生文领域诞生了 GPT 家族。一时间风起云涌，国内外许多企业投身 AIGC 创新浪潮，各大云厂商紧随其后纷纷推出自己的大语言模型。在文生图领域落地的企业更多，国...

AIGC 2024-01-04 人工智能

924阅读

[linux-sd-webui]api化之训练lora

lora的训练使用的文件是https://github.com/Akegarasu/lora-scripts lora训练是需要成对的文本图像对的，需要准备相应的训练数据。 1.训练数据准备使用deepbooru/blip生成训练数据，建筑类建议使...

AIGC 2024-01-04 人工智能

1036阅读

端到端的自动驾驶会取代Apollo、autoware这类框架吗？

本文经自动驾驶之心公众号授权转载，转载请联系出处。 Rethinking the Open-Loop Evaluation of End-to-End Autonomous Driving in nuScenes 作者单位：百度作者：共一 Jian...

人工智能 2024-01-04 人工智能

922阅读

人工智能利用深度学习技术增强高级驾驶辅助系统(ADAS)

译者 | 李睿审校 | 重楼人工智能和机器学习利用深度学习技术的优势，使高级驾驶辅助系统(ADAS 发生了重大变革。ADAS在很大程度上依赖深度学习来分析和解释从各种传感器获得的大量数据。摄像头、激光雷达(光探测和测距、雷达和超声波传感器都是传感器...

大数据 2024-01-04 人工智能

970阅读

基于whisper和whisperx的语音视频和字幕对齐

环境的安装创建py310虚拟环境，需要安装Anaconda的Python环境。 Python初学者在不同系统上安装Python的保姆级指引 Win10+Python3.9+GPU版pytorch环境搭建最简流程 Python虚拟环境的安装和使用...

大数据 2024-01-03 人工智能

834阅读

配置 Stable Diffusion WebUI 纯 CPU 或核显绘画

(如有更新，见原文：https://blog.iyatt.com/?p=12345 1 前言我笔记本电脑的独显上半年的时候烧掉了，所以只能用 CPU，折腾了一下午总算给配置出来了。我这里用的官方 Python，网上很多教程用 Anaconda（...

人工智能 2024-01-03 人工智能

1175阅读

论最近热门的AI绘画技术—从小白绘画到文创手账设计【文末送书-13】

文章目录 ?前言 ⚽AI绘图技术栈 ⚾️简单的代码实现案例 ?iPad萌系简笔画：从小白绘画到文创手账设计【文末送书-13】 ⛳粉丝福利：文末推荐与福利免费包邮送书！ ?前言 AI绘画技术，也称为人工智能绘画，是指利用人工智能技术...

AIGC 2024-01-03 人工智能

846阅读

利用Lama Cleaner本地实现AIGC试玩：擦除对象、替换对象、更换风格等等

目录一、安装二、擦除功能 1. LaMa模型实操实例一：去除路人实操实例二：去水印实操实例三：老照片修复 2. LDM模型 3. ZITS模型 4. MAT模型 5. FcF模型 6. Manga模型三、替换对象功能 1....

生成式AI 2024-01-03 人工智能

2498阅读

突破Pytorch核心点，模型定义与搭建！！

嗨，我是小壮！咱们今儿来聊聊关于模型定义与搭建。很适合初学者！在使用PyTorch进行深度学习时，首先需要了解的是如何定义和搭建模型。这块内容非常重要。在PyTorch中，模型的定义通常通过创建一个继承自torch.nn.Module的类来完成。...

人工智能 2024-01-02 人工智能

799阅读

LLaMA模型论文《LLaMA: Open and Efficient Foundation Language Models》阅读笔记

文章目录 1. 简介 2.方法 2.1 预训练数据 2.2 网络架构 2.3 优化器 2.4 高效的实现 3.论文其余部分 4. 参考资料 1. 简介 LLaMA是meta在2023年2月开源的大模型，在这之后，很多开源模型都...

AIGC 2024-01-02 人工智能

1205阅读

stable-diffusion-webui 安装采坑日记

这里写自定义目录标题安装容易采坑的点效果测试安装容易采坑的点 1、不愿安装大佬的整合包。在自己时间足够多的情况下，可以尝试自己搭环境。但是自己安装的时间成本真的非常高，环境配置报错会让人陷入崩溃，如果没有代码排错能力，还是建...

人工智能 2024-01-02 人工智能

1009阅读

神经网络中的分位数回归和分位数损失

在使用机器学习构建预测模型时，我们不只是想知道“预测值(点预测 ”，而是想知道“预测值落在某个范围内的可能性有多大(区间预测 ”。例如当需要进行需求预测时，如果只储备最可能的需求预测量，那么缺货的概率非常的大。但是如果库存处于预测的第95个百分位数(需求...

AIGC 2024-01-01 人工智能

857阅读

AI绘图模型不会写字的难题，被阿里AnyText破解了

能准确写汉字的AI绘图工具，终于登场了! 包括中文在内一共支持四种语言，而且还能文字的位置还能任意指定。从此，人们终于可以和AI绘图模型的“鬼画符”说再见了。这款名为AnyText的绘图工具来自阿里巴巴，可以按照指定位置精准地向图中加入文字。此前的绘...

生成式AI 2024-01-01 人工智能

926阅读

AI秒出图！StableDiffusion Automatic1111正式支持Tensorrt

秒级出图的AI绘画终于支持Automatic1111。今天在AI绘画的开源平台Automatic1111上发布了Tensorrt项目，项目地址是 https://github.com/AUTOMATIC1111/stable-diffusion-we...

人工智能 2023-12-31 人工智能

1152阅读

一个超强 Pytorch 操作！！

哈喽，我是小壮！这几天关于深度学习的内容，已经分享了一些。另外，类似于numpy、pandas常用数据处理函数，在Pytorch中也是同样的重要，同样的有趣！！ Pytorch同样提供了许多用于数据处理和转换的函数。今儿来看下，最重要的几个必会函数...

大数据 2023-12-31 人工智能

805阅读

九大Pytorch最重要操作！！

今儿咱们聊聊pytorch的事情，今儿总结了九个最重要的pytorch的操作，一定会给你一个总体的概念。张量创建和基本操作 PyTorch的张量类似于NumPy数组，但它们提供了GPU加速和自动求导的功能。张量的创建可以通过torch.tensor，...

生成式AI 2023-12-31 人工智能

839阅读

4、stable diffusion

github 安装anaconda环境 conda env create -f environment.yaml conda activate ldm 安装依赖 conda install pytorch==1.12.1 torchvision=...

人工智能 2023-12-31 人工智能

891阅读

win10部署NovelAI绘画，Stable Diffusion，Chilloutmix，实现txt2img，img2img（含调参）

文章目录 1、Stable Diffusion是什么 2、深度学习环境搭建 3、Stable Diffusion环境搭建（可跳过） 4、Stable Diffusion WebUI环境搭建（主要） 5、NovelAI模型的修改与调参 6、Chi...

AIGC 2023-12-31 人工智能

1054阅读

Stable Diffusion WebUI 1.4「gradio」报错解决方案

今天有很多朋友在运行 Stable Diffusion WebUI 1.4 时都遇到了「ModuleNotFoundError: No module named 'gradio'」这个报错，在这里给大家一个解决方案。（请注意这里针对的是 Google...

人工智能 2023-12-31 人工智能

887阅读