-
Datawhale X 魔搭 AI夏令营-AIGC方向-task2知识总结
文生图背景 早期探索 (1960-1990) 最早出现于计算机视觉和图像处理。 早期图像生成技术主要依赖与规则和模板匹配,通过预定义的规则将文本转换为简单的图形。 受限于计算能力和算法,此阶段生成的图像质量较低,应用场景受限。 基于统计...
-
【Qwen2部署实战】探索Qwen2-7B:通过FastApi框架实现API的部署与调用
系列篇章💥 No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat:阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验:用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...
-
AI绘画关键词、指令、参数整理(参数指令为Midjourney使用)
一 提示词书写规范 提示词 是ai生成图像的短文本提示语 ai会将提示词 中提到的单词和短语分解成更小的部分,叫做token,可以将其与其训练的数据进行比较,然后用于生成图像。一个优秀的提示词可以生成一张独特且令人兴奋的图像 首先得清楚的知道A...
-
AI绘画SD写实模型,逼真的人物风格,简直不要太简单,新手小白看完也可以一键出图
大家好我是安琪!!! 随着AI技术的飞速发展,AI绘画在艺术创作领域中崭露头角。而Stable Diffusion(SD),一款基于深度学习的图像生成模型,以其强大的图像生成能力和个性化风格迁移能力,在艺术创作领域掀起了一场革命。本文将带你深入了解Sta...
-
Datawhale AI夏令营第四期 AIGC方向 task02 初学者笔记
一、Prompt工程介绍:1、概念: Prompt工程,也称为提示工程或指令工程,是在自然语言处理(NLP)领域中一种重要的技术和方法。它主要用于指导预训练的大规模语言模型(Large Language Models, LLMs)生成高质量、准确且有针对...
-
Flux:Stable Diffusion 创始人团队再创开源 AI 巅峰之作
前言 TLDR 还记得 Stable Diffusion 吗?这款开源文本到图像生成模型,现在其部分创始成员成立了新公司 Black Forest Labs,并带来了全新的力作——Flux,一个拥有 120 亿参数的文本到图像模型,也是目前最大...
-
Datawhale X 魔搭 AI夏令营–AIGC Task1
Datawhale X 魔搭 AI夏令营–AIGC Task1 文章目录 Datawhale X 魔搭 AI夏令营--AIGC Task1 赛事介绍 文生图基础知识介绍 实践操作 step0:开通阿里云PAI-DSW试用 step1...
-
【论文+中文文生图】Kolors:快手可图绘画模型实测(24.07.06开源)
代码:https://github.com/Kwai-Kolors/Kolors | 权重 论文原文:Kolors: Effective Training of Diffusion Model for Photorealistic Text-to-Imag...
-
我果然还是喜欢二次元一些(Stable Diffusion进阶篇:ComfyUI 画风迁移)
现在Stable Diffusion也能做到把一张真人的照片转绘成动漫风格,在保持人物大概形象不变的同时为图片添加合适的背景。 时间仓促(有点糙) WebUI的操作(流程演示) 这种操作在WebUI里面不算难,大概一分多钟就能完成这样的操...
-
多语言声音克隆,CosyVoice模型最强部署
CosyVoice是由阿里通义实验室开源的一款多语言语音理解模型,它主要聚焦于高质量的语音合成,能够生成自然且逼真的语音。 CosyVoice模型经过超过15万小时的数据训练,支持中文、英语、日语、粤语和韩语多种语言的合成,且在多语言语音生成、零样本语音...
-
在亚马逊云科技上部署Llama大模型并开发负责任的AI生活智能助手
项目简介: 小李哥将继续每天介绍一个基于亚马逊云科技AWS云计算平台的全球前沿AI技术解决方案,帮助大家快速了解国际上最热门的云计算平台亚马逊云科技AWS AI最佳实践,并应用到自己的日常工作里。 本次介绍的是如何在亚马逊云科技上利用SageMaker...
-
Datawhale X 魔搭 AI夏令营第四期 AIGC方向 Task01笔记
第一次任务比较简单,只需要配置好环境,简单运行一次 项目背景 赛题任务 可图Kolors-LoRA风格故事挑战赛 1.参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格........
-
利用Qt实现调用文字大模型的API,文心一言、通义千问、豆包、GPT、Gemini、Claude。
利用Qt实现调用文字大模型的API,文心一言、通义千问、豆包、GPT、Gemini、Claude。 下载地址: AI.xyz 1 Qt实现语言大模型API调用 视频——Qt实现语言大模型API调用 嘿,大家好!分享一个最近做的...
-
Datawhale X 魔搭 AI夏令营 “AIGC”方向 task1
一、任务要求 task1 的任务和上一期的类似,都是跑通给出的代码即可,没有太大难度。 具体要求是训练 Lora 模型,实现文生图,额外的要求是8张图片必须组成一个连贯的故事,需要一定的“写小作文”能力。 二、代码解析 下载数据集 这一步不用分析...
-
ComfyUI搭建教程
ComfyUI是一个功能丰富、高度可定制的Stable Diffusion操作界面,适合需要精细控制和高度自定义的用户。通过其模块化、低内存需求和快速启动等特点,ComfyUI为图像生成、AI研究、游戏开发等领域提供了强大的支持。 下载(需要科学上...
-
【实操教程】手把手教你如何用Stable Diffusion,做服装款式设计!
使用Stable Diffusion进行服装款式设计是一个充满创意和可能性的过程。Stable Diffusion作为一种强大的文本到图像的生成模型,能够根据用户提供的描述性文本生成相应的图像,这为服装设计师提供了一个全新的设计工具。 今天小元老师就手把...
-
Stable Diffusion 亲测这几个SDXL大模型,真的非常好用!
大家好我是极客菌,前两周Stable Diffusion WebUI1.6.0发布了,新增了很多对SDXL生态的支持。 而ControlNET也对SDXL的支持也逐渐稳定。 SDXL的生态终于有一点起色了,我也觉得是时候,可以来写一篇SDXL的大模型推...
-
Datawhale X 魔搭 AI夏令营-AIGC文生图-task1-笔记
目录 1 赛题解读 2 文生图的历史 3 文生图基础知识介绍 3.1 提示词 3.2 Lora 3.3 ComfyUI 3.4 参考图控制 4 实践-通过代码完成模型微调&AI生图-Test 4.1 体验base...
-
Stable Diffusion【真人模型】:人脸特美&光效&氛围感增强摄影大模型wuhaXL_realisticMixV4.0
大家好我是安琪!!! 在数字艺术领域,AI绘画技术已经逐渐成为艺术创作的新趋势。Stable Diffusion作为一款领先的AI绘画工具,推出了全新的人脸特美、光效与氛围感增强摄影大模型wuhaXL_realisticMixV4.0。现在,让我们一起来...
-
【机器学习】Google开源大模型Gemma2:原理、微调训练及推理部署实战
目录 一、引言 二、模型简介 2.1 Gemma2概述 2.2 Gemma2 模型架构 三、训练与推理 3.1 Gemma2 模型训练 3.1.1 下载基座模型 3.1.2 导入依赖库 3.1.3 量化配置 3.1.4 分词器和模型实...
-
ECCV2024|AIGC(图像生成,视频生成,3D生成等)相关论文汇总(附论文链接/开源代码)【持续更新】
ECCV2024|AIGC相关论文汇总(如果觉得有帮助,欢迎点赞和收藏) Awesome-ECCV2024-AIGC 1.图像生成(Image Generation/Image Synthesis Accelerating Diffusio...
-
最强开源模型 Llama 3.1 部署推理微调实战大全
目录 引言 一、Llama 3.1简介 二、Llama 3.1性能评估 三、Llama 3.1模型推理实战 1、环境准备 2、安装依赖 3、模型下载 4、模型推理 四、Llama 3.1模型微调实战 1、数据集准备 2、导入依赖包 3、读...
-
【Qwen2微调实战】Lora微调Qwen2-7B-Instruct实践指南
系列篇章💥 No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat:阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验:用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...
-
体验 Whisper ,本地离线部署自己的 ASR 语音识别服务
需求背景 最近看视频,过几天后经常忘记内容,所以有了把重点内容总结提炼到自己知识库的需求,这涉及到了提取视频中的音频数据、离线语音识别等功能。 提取视频中的音频数据,可以使用格式工厂或 FFmpeg 等工具, FFmpeg 可以使用命令 ffmpeg...
-
java集成stable diffusion
在Java中直接集成Stable Diffusion模型(一个用于文本到图像生成的深度学习模型,通常基于PyTorch或TensorFlow 是非常具有挑战性的,因为Java本身并不直接支持深度学习模型的运行。不过,我们可以通过JN...
-
Datawhale AI夏令营第四期 AIGC方向 task01小白学习笔记
本人是信安专业的在校大学生,对AIGC方向属于小白一枚,以下是本次学习的初步成果展示。 从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活动(“AIGC”方向),基于魔搭社区“可图Kolors-LoR...
-
【AI绘画】FLUX:这款新的人工智能图像生成器非常善于创造人手
FLUX.1 是 Stable Diffusion 的公开重量级继承者,可将文本转化为图像。 FLUX.1 dev 生成图像:“A beautiful queen of the universe holding up her hands, face in...
-
Midjourney中文版来了,这里有一份保姆级上手指南!
前言 中文版Midjourney来了! 没有一点预热,Midjourney中文版(以下简称 MJCN)在本周开放了两次内测邀请,只需用 QQ 扫描邀请码,就可以在 QQ 频道里使用针对中文指令进行过优化、极大地降低了使用门槛的 Midjourney。...
-
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记--切记我是一个温柔的刀客
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记 作者: 福州大学 切记我是一个温柔的刀客 2024/8/10 从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活...
-
Datawhale X魔搭AI夏令营 魔搭-AIGC方向 Task2笔记
Datawhale X魔搭AI夏令营 魔搭-AIGC方向 Task2笔记 经过TASK1的学习,我们都或多或少地了解了AI作图的相关知识,那么接下来我们需要学习的便是深入Prompt工程与微调,精准理解AI作图个中原理,深刻探究文生图背...
-
【04】LLaMA-Factory微调大模型——数据准备
在上文【03】LLaMA-Factory微调大模型——多模型部署中完成了Qwen2、GLM-4、LLaMA3-8B-Chinese-Chat三个模型的部署,本文则进行数据准备,为后续的微调模型提供高质量、格式规范的数据支撑。 一、数据格式 LLaMA-...
-
Datawhale X 魔搭 AI夏令营第四期AIGC方向的实践学习
学习简介 从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活动(“AIGC”方向),基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习—— 适合想 入门并实践 AIGC文生图、工作...
-
Datawhale X 魔搭 AI夏令营-AIGC方向 task01笔记
目录 文生图技术的相关知识储备 SD结构图 种子 提示词 生成过程简单介绍 接下来开始随教程操作 Ⅰ开通阿里云PAI-DSW试用 Ⅱ在魔搭社区进行授权 Ⅲ报名“可图Kolors-LoRA风格故事挑战赛 Ⅳ在魔搭社区创建PAI实例编辑...
-
Datawhale X 魔搭 AI夏令营第四期AIGC文生图方向Task1笔记
目录 前置知识 生成对抗网络(GAN) 大规模预训练模型 LoRA baseline一站式实现过程 下载baseline文件 安装环境,然后重启kernel 调整prompt 总结 前置知识 指导手册里写得很详细,这里写一...
-
日入200的AI绘画变现实战,新手小白必看指南(附教程)
这篇文章将探讨目前AI人工智能绘画的最流行变现方式,这已经不再是秘密,因为门槛相对较低,实际上有很多变现途径可供选择。我将在适当的时候分享更多关于这方面的信息。首先,让我们来看一下最近使用MidJourney生成的一张图。 赠送一个描述词: Blu...
-
Datawhale X 魔搭 AI夏令营第四期 | AIGC文生图——可图Kolors-LoRA风格故事 Task1笔记
Hi,大家好,我是半亩花海。最近在尝试学习AIGC的内容,并报名参加了Datawhale举办的2024年AI第四期夏令营,主要学习内容是从零入门AI生图原理和实践。本次活动基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”进而开展的项目实践学习,很适...
-
ComfyUI基础篇:Stable Diffusion 基础原理详述
前言 个人认为学习 ComfyUI 应该先从理论学起。 与传统绘图工具(如 Photoshop 或 Figma)相比,AI 绘图工具有着显著不同。首先,许多设置和操作在 AI 绘图工具中是非可视化的,这意味着即使你更改了某个配置,界面上也未必会有任何变...
-
LLM大模型:一文彻底搞定 RAG、知识库、 Llama-3
简介: Llama-3 用于 RAG,增强大语言模型的性能,整合外部知识。关键组件包括:1 自定义知识库,存储更新的信息;2 分块处理,拆解文本便于管理;3 嵌入模型,转化多模态数据为数值向量;4 向量数据库,快速检索相似性;5 用户聊天界面,交...
-
实操: 如何在AirBox上跑Stable Diffusion 3
以下文章来源于Radxa ,作者瑞莎 Stable Diffusion 3 Medium 是一种多模态扩散变换器 (MMDiT 文本到图像模型,在图像质量、排版、复杂提示理解和资源效率方面具有显著提升的性能。 目前瑞莎团队使用 Stab...
-
LLM(大语言模型)和AIGC入门学习路线图
01 — 学习路线图 基础了解 目标: 理解人工智能、机器学习、深度学习的基本概念。 资源: 在线课程(如Coursera, edX上的入门课程)、博客文章、YouTube视频。 专业知识 目标: 深入了解大型语言模型(如GPT-...
-
Datawhale X 魔搭 AI夏令营第四期AIGC task1
本期夏令营AIGC方向是通过参加可图Kolors-LoRA风格故事挑战赛https://tianchi.aliyun.com/competition/entrance/532254,学习并实践文生图AIGC、工作流搭建、LoRA微调等技术。 赛题内容...
-
【震撼来袭】Flux横空出世,吊打Midjourney,重塑AI艺术创作新格局!(附保姆级部署教程)
目录 一、Flux介绍 二、ComfyUI本地电脑部署 2.1、Flux模型下载 2.2、Clip模型下载 2.3、VAE模型 2.4、更新ComfyUI 2.5、导入工作流并进行测试 2.6、云服务部署并体验 一、Flux介绍...
-
【Stable Diffusion】(基础篇二)—— 关键词和参数设置
提示词和文生图参数设置 本系列笔记主要参考B站nenly同学的视频教程,传送门:B站第一套系统的AI绘画课!零基础学会Stable Diffusion,这绝对是你看过的最容易上手的AI绘画教程 | SD WebUI 保姆级攻略_哔哩哔哩_bilibil...
-
LLaMA.cpp 是什么?与 GPT 哪个效果更好?
LLaMA.cpp 概述 LLaMA.cpp 是 Facebook LLaMA 模型的 C/C++ 端口,LLaMA 模型是一种大型语言模型 (LLM ,可以生成文本、翻译语言、编写不同类型的创意内容,并以信息丰富的方式回答您的问题。它仍在开发中,但它...
-
AIGC大模型面经汇总,太全了!
字节 暑期实习 多模态算法 (二面凉经 一面 2024/3/28 下午17:00-18:00 1.上来没有自我介绍 2.直接介绍NeurIPS论文,中间穿插着一些提问 3.说一下Transformer的整体结构 4.了解有哪些位置编码方式吗 5.说一...
-
LangChain +Streamlit+ Llama :将对话式人工智能引入您的本地设备成为可能(上篇)
🦜️ LangChain +Streamlit🔥+ Llama 🦙:将对话式人工智能引入您的本地设备🤯 将开源LLMs和LangChain集成以进行免费生成式问答(不需要API密钥) 在过去的几个月中,大型语言模型(LLMs 得到了广...
-
LLaMA-Factory微调llama3之模型的合并,并采用llama.cpp量化成ollama支持的gguf格式模型,生成api使用
上期我们已经成功的训练了模型,让llama3中文聊天版知道了自己的名字 这次我们从合并模型开始,然后使用llama.cpp量化成gguf格式,并且调用api (1 前期准备 上期链接: 基于LLaMA-Factory微调llama3成为一个角色扮演...
-
“Datawhale X 魔搭 AI夏令营”-AIGC文生图方向Task1笔记
前言 就自己学习过程对于Datawhale AI的夏令营第四期魔搭-AIGC文生图方向,做了个初级版教程,供小白参考,后期有机会也会通过自己的学习总结相关知识教程,期待和大家一起相互学习,共同进步! 正文 第一步:报名参加赛事! 点击赛事链接: :天池平...
-
免费替代Midjourney!FLUX.1使用方法大全,支持ComfyUI
一:Flux.1概述 1.1 它是什么 如果你想直接查看使用教程,MeoAI建议你直接跳到第四章:4种使用方法教程。 Flux.1是由Black Forest Labs开发的一款开源AI图像生成模型。这个模型继承了Stable Diffusion...
-
Datawhale AI夏令营第四期魔搭- AIGC文生图方向 task01笔记
目录 分任务1:跑通baseline 第一步——搭建代码环境 第二步——报名赛事 第三步——在魔搭社区创建PAI实例 分任务2:相关知识学习以及赛题理解 赛题理解: 文生图基本认识: 1. Diffusion Model(扩散模型 2...