-
RWKV-7 预览版、大量新论文...RWKV 社区 9 月动态速览
欢迎大家收看《RWKV 社区最新动态》第五期,本期内容收录了 RWKV 社区 2024 年 9 月的最新动态。 9 月动态省流版(TL;DR) RWKV 官方新闻动态 RWKV-7 发布预览版 RWKV-7 论文撰写已面向社区开放...
-
开源模型应用落地-qwen2.5-7b-instruct-LoRA微调-LLaMA-Factory-单机单卡-V100(十八)
一、前言 本篇文章将使用LLaMA-Factory去高效微调(命令和界面方式)QWen2.5系列模型,通过阅读本文,您将能够更好地掌握这些关键技术,理解其中的关键技术要点,并应用于自己的项目中。 QWen2系列模型微调: 开源模型应用落...
-
分享50个超好用的Stable Diffusion提示词,图片、提示词、参数全都有
这是一个系列主题,分享那些非常厉害的 Stable Diffusion 绘画提示词,给你带来绘画灵感, 让你的显卡再次转起来。这一系列将会有接近1万个作品的提示词,包括图片、提示词、参数,让你快速模仿出大师级作品。乔布斯曾说:“Good artists c...
-
24最新Stable Diffusion Lora模型训练详细教程!
前言 1. 介绍 通过Lora小模型可以控制很多特定场景的内容生成。 但是那些模型是别人训练好的,你肯定很好奇,我也想训练一个自己的专属模型(也叫炼丹~_~)。 甚至可以训练一个专属家庭版的模型(family model),非常有意思。 将自...
-
Stable Diffusion原理说明
本文参考:深入浅出讲解Stable Diffusion原理,新手也能看明白 - 知乎 目录 1、Stable Diffusion能做什么? 2、扩散模型(Diffusion model) (1)前向扩散(Forward Diffusion)...
-
【AI绘画】FLUX模型,或许这几点你还未曾都了解,附常用模型下载包
大家好,我是写编程的木木。 当我们还在沉浸在惊叹和体验快手的Kolors模型之时,SD原开发团队组成的“黑森林”出的FLUX模型就袭来了。我们不得不感叹FLUX模型给我们带来的冲击,模型所绘制的画面质感、精细度的确让我们眼前一亮,之前发布的SD3开源模型...
-
Datawhale X 魔搭 AI夏令营 第四期-AIGC方向Task2笔记
baseline的流程图 Baseline代码 !pip install simple-aesthetics-predictor !pip install -v -e data-juicer !pip uninstall pytorch-...
-
“免费的AI绘画软件推荐:开启你的创作之旅“
免费的AI绘画软件推荐: 开启你的创作之旅 ad开头1 在人工智能快速发展的今天,AI绘画软件为艺术爱好者提供了全新的创作方式。 无需复杂的绘画技巧,只需简单的文字描述或图片引导,即可生成令人惊叹的艺术作品。 以下是几款免费且功能强大的A...
-
【AI绘画教程】SD界面介绍—新手入门StableDiffusion全面了解SD的各个功能,从小白到大神轻松拿捏!!(含资料)
哈喽,大家好,我是程序员晓晓 写了这么久的AI绘画StableDiffusion方面的教程,最近还是有很多小伙伴说自己对于SD的各种用法不甚了解,那么今天就给大家说一下如何使用AI绘画Stable Diffusion的各个功能的作用 今天让大家轻松看懂...
-
LLM | llama.cpp 安装使用(支持CPU、Metal及CUDA的单卡/多卡推理)
1. 详细步骤 1.1 安装 cuda 等 nvidia 依赖(非CUDA环境运行可跳过) # 以 CUDA Toolkit 12.4: Ubuntu-22.04/24.04(x86_64 为例,注意区分 WSL 和 Ubuntu,详见 http...
-
用 LoRA 微调 Stable Diffusion:拆开炼丹炉,动手实现你的第一次 AI 绘画
总得拆开炼丹炉看看是什么样的。这篇文章将带你从代码层面一步步实现 AI 文本生成图像(Text-to-Image)中的 LoRA 微调过程,你将: 了解 Trigger Words(触发词)到底是什么,以及它们如何影响生成结果。 掌握 LoRA 微调...
-
【AI学习】AI绘画发展简史
无意中读了一篇发表自2022年的文章,《AI绘画何以突飞猛进? 从历史到技术突破, 一文读懂火爆的AI绘画发展史》,写的比较有意思,科普了好多我原来不知道的历史。 简单提炼一下,做个笔记。 AI绘画重要事件 2012年 Google两位大名鼎鼎的...
-
[AIGC] DAG任务调度的概述与实践
DAG(Directed Acyclic Graph,有向无环图 作为任务调度的基础模型,在大规模数据处理和计算过程中有着广泛的应用。本文将对DAG模型的原理进行解释并列出一些常用的任务调度工具。 文章目录 一、什么是DAG? 二、...
-
llama-factory实战: 基于qwen2.5-7b 手把手实战 自定义数据集清洗 微调
基于qwen2.5 手把手实战 自定义数据集 微调(llama-factory) 准备工作 1.数据集准备(例:民法典.txt) 2.服务器准备(阿里云 DSW 白嫖) 3.环境配置 pip 升级 模型下载 微调助手 4.数据集处理 脚...
-
微软推送Windows 11 2024更新:新增多项AI体验 NPU终于有了用武之地
快科技10月3日消息,近日,微软开始向广大用户全面推送Windows 11 2024更新。 其实按照惯例应被成为Windows 11 24H2更新,但由于微软放弃了以往1年2次重大版本更新周期,整个2024年只更新了这一个大版本,因此被设定为Windows...
-
【AIGC】ComfyUI安装及常见问题cuda及pytorch安装教程
说明:ComfyUI安装方式有很两种,第一种是下载独立包。独立包下载到本地后,即可使用。不需要搭建(安装)python、cuda、cudnn、pytorch环境. 第二种是,手动安装。手动安装要复杂很多,需要搭建开发环境,即安装python、cuda、c...
-
效率暴涨!5 款设计师必备的 Stable Diffusion WebUI 模型,三分钟十张图,再也不用熬夜加班了!
大家好,我是画画的小强 今天继续为大家推荐 5 款优质的设计类 Stable Diffusion WebUI 风格模型,包含电商设计、产品摄影、矢量扁平插画、古风工笔等多种风格。 一、设计 | 电商展台 这是一款非常优秀的电商展台设计模型,包含极简...
-
【AIGC】Kolors:快手开源的文生图大模型
GitHub:GitHub - Kwai-Kolors/Kolors: Kolors Team 论文:Kolors/imgs/Kolors_paper.pdf at master · Kwai-Kolors/Kolors · GitHub comfyu...
-
调用大模型API-文心一言
一、准备工作 进入百度智能云千帆大模型平台,点击应用接入-创建应用;按提默认完成创建 二、开始使用 单轮调用 进入API列表 - ModelBuilder以第一个ERNIE-4.0-8K为例,选择“HTTP请求调用”,把第一步创建应用的 应用A...
-
Ubuntu LLaMA-Factory实战
一、Ubuntu LLaMA-Factory实战安装: CUDA 安装 CUDA 是由 NVIDIA 创建的一个并行计算平台和编程模型,它让开发者可以使用 NVIDIA 的 GPU 进行高性能的并行计算。 首先,在 https://develop...
-
基于 ROS 的Terraform托管服务轻松部署Stable Diffusion
介绍 Stable Diffusion是文本到图像的潜在扩散模型,它可以根据文本提示词生成对应的图像。Stable Diffusion模型是扩散模型的变种,可以通过逐步对随机高斯噪声进行去噪以获得感兴趣的样本。与传统生成模型相比,Stable Diff...
-
Insanely Fast Whisper CLI 项目教程
Insanely Fast Whisper CLI 项目教程 insanely-fast-whisper-cli The fastest Whisper optimization for automatic speech recognition a...
-
【AI绘画教程】Flux.1工作流整合包准备好了,快来挑战Flux.1的创作极限!
F5 AI社区提供了工作流、提示词、一键整合包,有兴趣的来挑战一下! 提示词: Create a bustling marketplace in a fantastical floating city. Layer 1 (Background : D...
-
Swift Diffusion: 在Swift中实现Stable Diffusion模型
Swift Diffusion: 将Stable Diffusion带到移动设备 Swift Diffusion是一个雄心勃勃的项目,旨在将强大的Stable Diffusion图像生成模型移植到Swift平台上。该项目由Liu Liu开发,目标是让St...
-
AIGC生成图像检测
AI生成图像技术的进展与影响 技术进步: 视觉质量与效率提升:近年来,AI生成图像在视觉质量、语义复杂度及运行时间效率上均实现了显著飞跃。 成本降低与普及:生成虚假图像所需的专业知识和成本大幅下降,促使在线图像生成平台(如Midjourney、DAL...
-
Stable Diffusion入门指南(看完必会)超全面
作者:SuMu 链接:https://zhuanlan.zhihu.com/p/703196651 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 今天写这个帖子是带大家了解一款强大的 AI 绘画工具——Stable...
-
OpenAI Whisper API (InvalidRequestError)
题意: OpenAI Whisper API(无效请求错误) 问题背景: I'm trying to use OpenAI Whisper API to transcribe my audio files. When I run it by o...
-
【论文阅读笔记 + 思考 + 总结】MoMask: Generative Masked Modeling of 3D Human Motions
创新点: VQ-VAE 👉 Residual VQ-VAE,对每个 motion sequence 输出一组 base motion tokens 和 v 组 residual motion tokens bidirectional 的 Masked...
-
LlamaFactory可视化微调大模型 - 参数详解
LlamaFactory 前言 LLaMA Factory 是一个用于微调大型语言模型的强大工具,特别是针对 LLaMA 系列模型。 可以适应不同的模型架构和大小。 支持多种微调技术,如全参数微调、LoRA( Low-Rank Adaptation...
-
Datawhale X 魔搭 AI0夏令营 魔搭-AIGC文生图方向 Tsak 3 就要完成了...
本文为AI方向小白记录暑期参加魔搭夏令营-AIGC文生图方向的Task 01 报名赛事链接:可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的赛制 欢迎所有小白,大神前来交流学习。 一. 初识C...
-
【AI绘画】超详细!ComfyUI 全方位入门指南,初学者必看,附多个实践操作
本文正文字数约 8300 字,阅读时间 20 分钟。如果按照文章实操一遍,预计时间在半小时到两小时不等。 在上一篇文章中,我向大家介绍了有关于 Stable Diffusion 的基本概览,同时也在文章里放置了一些相关的工具链接可以方便的使用 Stab...
-
这两个AI,让你的国庆出行没有废片。
马上国庆七天乐了,相信大家肯定也是要出去好好happy happy的对吧。 然后这两天就有朋友来问我,有没有那种能修图的AI,就是扩图+消除啥的傻瓜好用的。 毕竟国庆七天,你去哪玩,都必然是人人人人人人人,都是人,我就不信你拍照的时候不会有奇怪的路人混入,...
-
Stable Diffusion WebUI Forge 支持 Flux 了!
大家好,我是每天分享AI应用的萤火君! Flux横空出世有段时间了,模型效果也得到了广泛的认可,但是 Stable Diffusion WebUI 官方迟迟没有跟进,据说是因为要修改很多底层的处理机制,加之ComfyUI如火如荼,可能越南大佬的心气也不是...
-
丹摩智算(damodel)部署stable diffusion实验
名词解释: 丹摩智算(damodel):是一款带有RTX4090,Tesla-P40等显卡的公有云服务器。 stable diffusion:是一个大模型,可支持文生图,图生图,文生视频等功能 一.实验目标 注册丹摩智算(damodel) 账户...
-
AIGC:Flux.1 NF4 使用 diffusers 推理
背景介绍 Flux 参数量很大 (包括 ext encoder2, autoencoder, 以及 diffusion model , 使用Diffusers推理,显存占用 30GB。 有大佬做了 NF4 版本,效果依旧能打。所以本文使用 diffu...
-
Datawhale训练营AIGC方向 第二期
Datawhale训练营AIGC方向 第二期 AI生图模型 概念 AI生图模型属于多模态机器学习模型,通过海量的图库和文本描述的深度神经网络学习,最终的目标是可以根据输入的指示(不管是文本还是图片还是任何 生成符合语义的图片。 通俗来说...
-
Datawhale X 魔搭 AI夏令营-AIGC文生图方向Task3笔记
#目录# 一、ComfyUI安装及实践 (一)什么是ComfyUI (二)ComfyUI核心模块 (三)ComfyUI图片生成流程 ...
-
【AI绘画】最简单的 FLUX 入门教程:一键搭建环境,附工作流、整合包分享
大家好,我是写编程的木木。 大家都在讨论FLUX,效果很好。但对于新手来说,下载与选择模型的第一步就迷茫了,那么多模型不知道下载哪一个? 节点也是一堆堆,新手看到就迷茫了。 今天木木就给大家分享最简单的 FLUX 入门流程,文末给大家准备好了大量实用工...
-
【AI绘画】Comfyui工作流原理拆解分析
前言 大家好,我是写编程的木木。 前面几篇有讲到Comfyui的安装和入门基础的文生图,图生图加上CN和局部重绘的工作流教程,这工作流是基于sd webui的工作流原理跟大家简单讲了Comfyui工作流的基本原理。 今天我们通过拆解组合的方式再稍微深...
-
【记录贴 | 持续更新】搜广推/aigc 面试题记录
目录 nlp/搜广推 transformer结构? 位置编码的作用? 解释 self-attention? attention中 /√(d_k 的作用是什么? 解释Multi-Head Attention? FeedForward的作用...
-
Flux【基础篇】:一键快速体验Flux,开启AI绘画新的旅程
大家好我是安琪!!! 在数字艺术领域,AI绘画技术已经逐渐成为艺术创作的新趋势。现在,Flux为你带来一键快速体验,让你轻松开启AI绘画的新旅程。 Flux一键快速体验:简单易用的AI绘画工具 Flux的基础篇,让你轻松实现一键快速体验。无论你是艺术家...
-
Insanely Fast Whisper CLI 使用教程
Insanely Fast Whisper CLI 使用教程 insanely-fast-whisper-cli The fastest Whisper optimization for automatic speech recognition a...
-
Stable-Diffusion-web UI运行环境搭建和界面配置
Stable-Diffusion-web UI运行环境搭建和界面配置 前言 一、论文 二、源码下载 三、权重模型和文件下载 (1)下载sd-v1-4.ckpt模型 (2)下载openai/clip-vit-large-patch14模型...
-
高精度定时器实现
本文分享自微信公众号 - dotNET跨平台(opendotnet)。如有侵权,请联系 support@oschina.cn 删除。本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。...
-
Pycharm配置copilot踩坑全总结
第一次配置(失败) 某天心血来潮想在pycharm上安装copilot来帮助代码的阅读和编写,第一次在惠普笔记本上安装了两天,结果失败了,下面是当时的系统配置: 系统 Windows 11 IDE PyCharm 2023.5...
-
<Project-3 Video2SubTitle> Python coding Flask应用:从视频中,提取对白,生成独立的字幕文件 浏览器页面交互 调用cuda, Whisper模型
原因: 在网上看到一个视频没有字幕。 记者问小泉纯一郎 (前日本首相 ,我只是好奇,想知道Y说的是什么。 上面这个帖子里的视频:https://x.com/i/status/1834489208398115295 视频没有字幕,那就自己做...
-
【AI绘画】反推:comfyui一键生成提示词!
大家好,我是写编程的木木。 探索ComfyUI工作流:一键生成提示词 工作流我放在文末了,需要的小火伴自取! 大家好, 你是否曾想过,如何能让图像处理变得更智能、更便捷? 或者,你是否在寻找一种方法,可以快速为你的图片生成提示词和标签?如果这些问...
-
Datewhale×魔搭 AI夏令营第四期 AIGC方向Task3笔记
·Part1 ComfyUI 1.ComfyUI简介: GUI 是 "Graphical User Interface"(图形用户界面)的缩写。简单来说,GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的交互方式。 ComfyUI 是GUI的一...
-
解决LLaMA Factory的webUI界面显示“错误”的问题
按照官网使用PAI-DSW出现“错误” 执行llamafactory-cli version后显示webUI但是每行都变成“错误” 解决办法 1.查看是否完整执行官网命令 pip uninstall -y vllm pip install l...
-
五一 Llama 3 超级课堂 | LMDeploy 高效部署 Llama3 实践笔记
准备环境与模型 环境配置 conda create -n lmdeploy python=3.10 conda activate lmdeploy conda install pytorch==2.1.2 torchvision==0.16.2 torc...