-
探索无限创意:基于C++的Stable Diffusion图像生成库
探索无限创意:基于C++的Stable Diffusion图像生成库 axodox-machinelearning This repository contains a C++ ONNX implementation of StableDiffus...
-
将LLaMA模型导出为ONNX格式的教程
将LLaMA模型导出为ONNX格式的教程 export_llama_to_onnx export llama to onnx 项目地址: https://gitcode.com/gh_mirrors/ex/export_llama_to_onn...
-
stable-diffusion-xl_pytorch生成高质量的图像的AIGC模型
stable-diffusion-xl_pytorch 论文 SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis https://arxiv.org/...
-
stable diffusion 反推提示词插件 tagger 的安装,很详细
stable diffusion 反推提示词插件 tagger 的安装,很详细 一、前言 二、下载 1、方式一 2、方式二 一、前言 最近想下载 stable diffusion 反推提示词插件 tagger ,也是好一番折腾...
-
rk3588使用npu加速运行whisper语音识别模型
rk3588运行whisper模型有三种方法:1.使用纯cpu运行原始pytorch模型;2.将whisper模型转成onnx格式,再转成rknn格式使用npu运行;3.利用npu提供的矩阵运算功能,结合cpu一起运行原始pytorch模型。方法1做不到实...
-
AIGC实践——asr识别FunASR手把手部署流程
💡 大家好,我是可夫小子,《小白玩转ChatGPT》专栏作者,关注AIGC、互联网和自媒体。 FunASR是什么? FunASR 是一个基本的语音识别工具包,提供多种功能,包括语音识别 (ASR 、语音活动检测 (VAD 、标点符号恢复、语言模型...
-
ootdiffusion_pytorch AIGC虚拟衣物试穿算法模型
OOTDiffusion 论文 OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on https://arxiv.org/pdf/...
-
Distil-Whisper 开源项目教程
Distil-Whisper 开源项目教程 distil-whisperDistilled variant of Whisper for speech recognition. 6x faster, 50% smaller, within 1% wor...
-
导出 Whisper 模型到 ONNX
前言 在语音识别领域,Whisper 模型因其出色的性能和灵活性备受关注。为了在更多平台和环境中部署 Whisper 模型,导出为 ONNX 格式是一个有效的途径。ONNX(Open Neural Network Exchange)是一个开放格式...
-
Amuse .NET application for stable diffusion
Amuse github地址:https://github.com/tianleiwu/Amuse .NET application for stable diffusion, Leveraging OnnxStack, Amuse seamlessl...
-
Stable Diffusion:Roop换脸插件安装
一、简介 今天给大家分享Stable Diffusion:Roop换脸插件安装,之前在B站上看了很多教程都不太全面,现在出一版最全的Roop换脸插件安装操作流程,希望能帮大家解决安装roop插件过程遇到的各种问题,下面我会把Roop换脸插件安装操作过程和...
-
Stable Diffusion AMD加速方法-ZLUDA重出江湖
目前几大开源的Stable Diffusion平台,更新速度都慢了,一个是没有太多新技术出现,新出的基础模型也都不完整开源了(API调用),能整的功能,也都整得差不多了。然后一群AMD死忠还在等着有一个能有一天小三上位;毕竟现在还被CUDA压...
-
探索深度学习艺术:Stable Diffusion的ONNX & FP16革命
探索深度学习艺术:Stable Diffusion的ONNX & FP16革命 项目地址:https://gitcode.com/Amblyopius/Stable-Diffusion-ONNX-FP16 在当今的艺术与技术交汇处,一个令人兴奋...
-
AI绘画专栏之Stablediffusion webui Controlnet SDXL 插件之segment-anything(40)
1.是什么 分割任何物体模型,还记得语义分割和镜头风格词库,这个原理就是根据语义分割做的词库 ## [2024最全大厂面试题无需C币点我下载或者在网页打开全套面试题已打包](https://pan.quark.cn/s/865a0bbd5...
-
Stable Diffusion安装(非秋叶包一键部署)
Stable Diffusion安装与配置详细步骤 一 、下载前置资源 下载CUDA 1. 查看CUDA版本 通过以下命令查看CUDA版本: nvidia-smi 复制 确保CUDA版本符合要求。 2. 下载CUDA ...
-
Stable Diffusion模型基于 TensorFlow 或 PyTorch 训练
安装必要的软件和库: 安装 Python(建议使用 Python 3.x 版本)。 安装 TensorFlow 或 PyTorch,具体版本取决于你的模型是基于哪个框架训练的。 安装其他可能需要的依赖,如 NumPy、Matplotlib 等。...
-
Stable Diffusion使用Roop插件一键换脸教程
一、前言 先做个声明,下面图片都是AI工具生成,此技术不要做危害他人之事。 在AI绘画的学习过程中,有不少人希望可以用AI做个人写真,或者将AI生成的图片换成真人的脸做服装展示。训练模型也可以实现上面的需求,但是需要的图比较多,很麻烦。今天教大家使用...
-
【Stable Diffusion】ModuleNotFoundError: No module named ‘ifnude‘ and roop v0.0.2
提示:ModuleNotFoundError: No module named ‘ifnude’ 一、issues/299:ModuleNotFoundError: No module named ‘ifnude’ 路径 cmd 中也可以看到,...
-
学习Stable Diffusion使用 Roop插件轻松换脸
在今天的分享中,将了解到如何获取并应用Stable Diffusion的Roop插件,以达到完美的面部替换效果。 Roop是一款强大的工具,使您能够轻松地交换面孔并达到逼真的效果。 无论是艺术家、内容创作者,还是仅仅想要尝试图像处理的乐趣,今天将为您提...
-
手把手教你基于华为云,实现MindSpore模型训练
本文分享自华为云社区《【昇腾开发全流程】MindSpore华为云模型训练》,作者:沉迷sk。 前言 学会如何安装配置华为云ModelArts、开发板Atlas 200I DK A2。 并打通一个Ascend910训练到Ascend310推理的全流程...
-
Yolov10:详解、部署、应用一站式齐全!
一、前言 在过去的几年里,YOLOs由于其在计算成本和检测性能之间的有效平衡,已成为实时目标检测领域的主导范式。研究人员探索了YOLO的架构设计、优化目标、数据扩充策略等,取得了显著进展。然而,依赖非极大值抑制(NMS)进行后处理阻碍了YOLO的...
-
【Stable Diffusion】Roop换脸插件,全网最简单傻瓜式安装教程
今天也是应粉丝的要求,出一篇关于roop插件安装的教程。之前已经写过两篇关于roop插件的使用文章,它确实是目前最方便快捷的一款换脸插件了。 无需Lora,一键换脸插件Roop(点击下方图片跳转) 多人物脸部替换,一键换脸插件Roop(2)(点击下方图...
-
微软发布Phi-3 Vision等最新大模型系列
微软发布了其最新的大型语言模型系列,Phi-3,包括Phi-3Vision、Phi-3Small7B和Phi-3Medium14B型号。这些模型在性能上与当前领先的大型模型相媲美,同时在特定领域提供了一些独特的优势。 Phi-3Medium14B 型号的...
-
超越ORB-SLAM3!SL-SLAM:低光、严重抖动和弱纹理场景全搞定
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 今天我们探讨下深度学习技术如何改善在复杂环境中基于视觉的SLAM(同时定位与地图构建)性能。通过将深度特征提取和深度匹配方法相结合,这里介绍了一种多功能的混合视觉SLAM系统,旨在提高在诸如低...
-
一文读懂多家厂商的大模型训练、推理、部署策略
大合影 get ✅ 披萨和礼物不能少! 接下来进入主题演讲回顾环节。可扫描下方二维码、关注“OSC 开源社区”视频号,进入“直播回放”页面查看完整视频回顾: 刘昊:大模型分析与趋势展望 武汉人...
-
基于香橙派AIpro将开源框架模型转换为昇腾模型
本文分享自华为云社区《如何基于香橙派AIpro将开源框架模型转换为昇腾模型》,作者:昇腾CANN。 在前面的介绍中,我们知道了如何基于香橙派AIpro开发AI推理应用,也大致了解到在推理之前,需要把原始网络模型 (可能是 PyTorch 的、Tensor...
-
Python一个高效的机器学习库:HummingBird
Python HummingBird库是一个高效的机器学习库,它可以将训练好的机器学习模型转换为高性能的代码,以便在边缘设备上进行推理。HummingBird库可以将模型转换为多种格式,包括C++、CUDA和ONNX等,这使得它非常适合在嵌入式设备、移动...
-
ReActor丨一文教你学会用Stable Diffusion插件换脸
本教程将带您了解如何下载和使用 stable diffusion 的 ReActor扩展,实现完美的换脸效果。 ReActor 是一个强大的工具,允许您无缝地交换面孔并获得逼真的效果。 无论您是艺术家、内容创作者,还是仅仅想要体验图像操作的乐趣,这份指...
-
无需服务器!浏览器上直接运行近 700 个 AI 模型!
本文阿宝哥将介绍 Github 上一个超强的开源项目 —— transformers.js[1]。有了它,你可以直接在浏览器中运行 Transformers,无需服务器! 利用它提供的超能力,你可以在浏览器上直接运行不同的 AI 模型,实现很多非常有用的...
-
【在线回放】NVIDIA GTC 2024 大会 | 如何降低 AI 工程成本?蚂蚁从训练到推理的全栈实践
本文内容来源于蚂蚁集团 AI Infra部门负责人张科,在 GTC 2024 大会 China AI Day 线上专场的演讲。在演讲中张科分享了 AI 工程当前的现状和主要挑战,以及蚂蚁集团在 AI 工程领域的实践经验和开源项目,也欢迎 AI 工程领域的同...
-
Fastwhisper + Pyannote 实现 ASR + 说话者识别
文章目录 前言 一、faster-whisper简单介绍 二、pyannote.audio介绍 三、faster-whisper + pyannote.audio 实现语者识别 四、多说几句 前言 最近在研究ASR相关的业务,也...
-
C# RAM Stable Diffusion 提示词反推 Onnx Demo
目录 介绍 效果 模型信息 项目 代码 下载 C# RAM Stable Diffusion 提示词反推 Onnx Demo 介绍 github地址:GitHub - xinyu1205/recognize-anything: Open...
-
智能邮件防护:ML.NET 3.0助力垃圾邮件过滤,让你告别烦扰
概述:ML.NET3.0等机器学习工具,我们可以利用这一数据集训练模型,实现自动分类邮件为垃圾或正常,提高电子邮件过滤效果。 ML.NET是Microsoft推出的开源机器学习框架,可用于在.NET应用程序中集成机器学习功能。ML.NET提供了基础用法...
-
(含代码)利用TensorRT的8位PTQ将Stable Diffusion速度提高 2 倍
利用TensorRT的8位PTQ将Stable Diffusion速度提高 2 倍 在生成人工智能的动态领域中,扩散模型脱颖而出,成为生成带有文本提示的高质量图像的最强大的架构。 像稳定扩散这样的模型已经彻底改变了创意应用。 然而,由于需要迭代去...
-
如何只用两个Python函数在几分钟内创建完整的计算机视觉应用程序
译者 | 李睿 审校 | 重楼 本文首先概述典型的计算机视觉应用程序的要求。然后,介绍Pipeless这一为嵌入式计算机视觉提供无服务器开发体验的开源框架。最后,提供一个详细的步骤指南,介绍如何创建和执行一个简单的对象检测应用程序,该应用程序只需采用几...
-
微软“办公新时代”活动前瞻,主打 AI:新画图应用、提高游戏帧率等
3 月 8 日消息,微软已敲定北京时间 3 月 22 日凌晨 1 点举办线上新品发布会,主题为“办公新时代”,预估主要内容是 Copilot、Windows 和 Surface,利用 AI 提高用户生产力。 根据 Windows Latest 报道,微...
-
C# SwinV2 Stable Diffusion 提示词反推 Onnx Demo
目录 介绍 效果 模型信息 项目 代码 下载 C# SwinV2 Stable Diffusion 提示词反推 Onnx Demo 介绍 模型出处github地址:https://github.com/SmilingWolf/SW-C...
-
性能8.6倍于竞品!高通AI大揭秘:NPU引领四兄弟无敌
生成式AI的变革,对于基础硬件设计、软件生态开发都提出了新的、更高的要求,尤其是底层硬件和算力必须跟上新的形势,并面向未来发展做好准备。 近日,高通特别发布了《通过NPU和异构计算开启终端侧生成式AI》白皮书,对于终端侧生成式AI的发展趋势,以及高通骁龙处...
-
AIGC专栏9——Scalable Diffusion Models with Transformers (DiT)结构解析
AIGC专栏9——Scalable Diffusion Models with Transformers (DiT)结构解析 学习前言 源码下载地址 网络构建 一、什么是Diffusion Transformer (DiT 二、DiT的组成...
-
Ubuntu环境中Stable Diffusion的roop插件安装(8.12更新)
roop插件是一款换脸神器,可以在Stable Diffusion中实现一键换脸,现在已经有了基于automatic1111的web-ui开源项目上的插件。 windows版本上的安装教程已经很多了,这边就不说了。下面是ubuntu中的安装过程。 1....
-
动手实践丨轻量级目标检测与分割算法开发和部署(RK3568)
本文分享自华为云社区《自动驾驶(AIOT - 轻量级目标检测与分割算法开发和部署(RK3568 【玩转华为云】》,作者:HouYanSong。 本文将在ModelArts平台上开发轻量级目标检测与分割算法,并使用ModelBox框架在RK3568开发板...
-
20240202在WIN10下部署faster-whisper
20240202在WIN10下部署faster-whisper 2024/2/2 12:15 前提条件,可以通过技术手段上外网!^_ 首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】800¥ 2...
-
Stable Diffusion教程——使用TensorRT GPU加速提升Stable Diffusion出图速度
概述 Diffusion 模型在生成图像时最大的瓶颈是速度过慢的问题。为了解决这个问题,Stable Diffusion 采用了多种方式来加速图像生成,使得实时图像生成成为可能。最核心的加速是Stable Diffusion 使用了编码器将图像从原始的...
-
【AIGC扫盲】人工智能大模型快速入门
人工智能大模型的技术框架主要有以下几种: TensorFlow:这是一个由Google Brain团队开发的开源库,用于进行高性能数值计算,特别是用于训练和运行深度学习模型。TensorFlow提供了一种称为计算图的编程模型,它允许用户定义复杂的计算...
-
【深度学习】SDXL tensorRT 推理,Stable Diffusion 转onnx,转TensorRT
文章目录 1 sdxl 转 diffusers 2 转onnx 3 转TensorRT 1 sdxl 转 diffusers juggernautXL_version6Rundiffusion.safetensors文件...
-
stable diffusion如何确保每张图的面部一致?
可以使用roop插件,确定好脸部图片后,使用roop固定,然后生成的所有图片都使用同一张脸。 这款插件的功能简单粗暴:一键换脸。 如图所示: 任意上传一张脸部清晰的图片,点击启用。 在其他提示词不变的情况下,Stable Diffu...
-
秒速出图!体验 TensorRT 加速 Stable Diffusion 图像创作
TensorRT 如何加速 Stable Diffusion? 生成式 AI 图像内容生成技术近年来发展迅速,可以根据人类语言描述生成图片,在时尚、建筑、动漫、广告、游戏等领域有着广泛应用。 Stable Diffusion WebUI 是 Githu...
-
如何使用Stable Diffusion的ReActor换脸插件
ReActor插件是从roop插件分叉而来的一个更轻便、安装更简单的换脸插件。操作简单,非常容易上手,下面我们就介绍一下,如何将ReActor作为stable diffusion的插件进行安装和使用。 一:安装ReActor插件 项目地址:https:...
-
【思路合集】talking head generation+stable diffusion
1 以DiffusionVideoEditing为baseline: 改进方向 针对于自回归训练方式可能导致的漂移问题: 训练时,在前一帧上引入小量的面部扭曲,模拟在生成过程中自然发生的扭曲。促使模型查看身份帧以进行修正。 在像VoxCeleb或L...
-
检测路在何方?YOLOv8终极指南
本文经自动驾驶之心公众号授权转载,转载请联系出处。 YOLOv8是计算机视觉领域的最新发展,它是一种用于目标检测、实例分割和分类的最新先进模型。除了对模型架构本身的改进之外,YOLOv8通过一个用于使用YOLO模型的PIP包为开发者提供了一个新的友好界...