-
Stable Diffusion初体验——基于机器学习通过神经网络的强大AI平台
文章目录 前言 最新热门活动!! 平台介绍 一.创建应用 Stable Diffusion WebUI 初始化 上传模型,VAE,lora 介绍sd模型,vae,lora模型 进入应用 文生图 工作区 调参区 图生图 结语 小程序活...
-
Stable diffusion prompts 使用语法、参数讲解、插件安装教程
Stable diffusion prompts 使用语法、参数讲解、插件安装教程 本文基于 Stable diffusion WebUI 进行讲解(安装在 AutoDL 上,安装在本地电脑上的也同样适用本教程)。 初始界面: 文件目录结构:...
-
stable-diffusion 3 体验部署流程(ComfyUI)
环境准备 下载及简介 git clone https://huggingface.co/stabilityai/stable-diffusion-3-medium SD3 checkpoints: sd3_medium_incl_clips.s...
-
保姆级教程:一个伪代码prompt让ChatGPT自动生成多张绘本图片
相信不少朋友都在小红书之类的平台上看到过不少绘本类的作品。想要利用AI产品生成这类优质的作品,往往需要根据脚本,一句一句地去生成插画作品,费时费力。 虽然市面上已经有不少AI绘本生成产品,但据小编体验的几个来看,...
-
Midjourney 控图王炸:局部重绘
你是不是也遇到过,明明想要一个白色的兔耳朵偏偏给我红色的兔耳朵,在尝试了修改权重后还是无果。 你是不是也遇到过,终于经过 28 次刷新发送生成了一张老板满意的图片,老板突然说能不能把这个沙发换个颜色? 恭喜你,这个时候不用打开 PS,直接继续 midj...
-
llama-factory-0.7.0微调llama3-8B-Instruct-262k
1.摘要 用llama-factory-0.7.0微调Llama-3-8B-Instruct-262k,微调数据是1.5k的论文审稿。 GPU配置是A40. 用llama-factory的0.7.1版本微调Llama-3-8B-Instruct-26...
-
Midjourney基础使用技巧
1.1 常用技巧 本篇主要讲述MJ的常用技巧,围绕相关的常用指令来拓展一些使用方法。 2.1 版本切换 最常用的是版本切换,其实也可以通过在prompt后添加--v加数字 一般我都默认MJ 4,偶尔用 3 或Niji。V4对生物、地方、物体等有更多...
-
探索国内主要大模型AIGC产品以及未来的发展
随着近日腾讯元宝APP的正式上线,国内大模型产品又添一员。除此之外,还有大家已经耳熟能详的几个大模型产品,比如:CSDN官方推出的C知道、百度出品的文心一言、阿里达摩院出品的通义千问、360出品的360智脑、字节跳动出品的豆包、科大讯飞出品的讯飞星火。本文...
-
AI初识--LLM、ollama、llama都是些个啥?
LLM全称(large language model)也就是大语言模型 什么是Ollama,它与Llama是什么关系? Ollama是一个开源的 LLM(大型语言模型)服务工具,用于简化在本地运行大语言模型,降低使用大语言模型的门槛,使得大模型的开发者...
-
手把手教你微调Stable Diffusion
温馨提示 关于本文: 本文你可以学习到完整的不使用webui借助lora和dreambooth微调Stable Diffusion的全过程。 手把手教你微调Stable Diffusion生成优弧,但是半失败版😂 关于训练: 单卡32GV...
-
Midjourney绘画参数设置详解
在数字艺术和设计领域,Midjourney是一款强大的绘画工具,它允许艺术家和设计师以数字方式创作出精美的图像。为了充分发挥Midjourney的潜力,正确设置其绘画参数至关重要。本文将深入探讨Midjourney的绘画参数设置,帮助用户更好地掌握这一工具...
-
【LLM第二篇】stable diffusion扩散模型、名词解释
最近在整理大模型的相关资料,发现了几个名词,不是很懂,这里整理一下: stable diffusion(SD 模型: 扩散模型(Diffusion model)的一种,主要用于生成高质量的图像,GAN的替代者,扩散模型通过一些列学习步骤生成数据,逐渐从...
-
whisper使用
whisper使用 1. 直接调用 语音识别 2. 语种识别 whisper.detect_language( 和whisper.decode( 3. 指定要识别的语种做语音识别 **whisper 源码的transcribe函数** 函数解...
-
Midjourney NIJI5制作动漫风格作品保姆级教程
大家好!最近我尝试了好几个与动漫艺术相关的AI绘画平台,发现Midjourney(AIGF)的 Niji 模式绝对是目前最好用的动漫风格生成式 AI 之一! 最让我震惊的是,我们甚至不需要会画画,就能创造出高质量的图像!AI 绘画和Midjourne...
-
区分stable diffusion中的通道数与张量维度
区分stable diffusion中的通道数与张量形状 1.通道数: 1.1 channel = 3 1.2 channel = 4 2.张量形状 2.1 3D 张量 2.2 4D 张量 2.2.1 通常 2.2.2 stable d...
-
midjourney绘画,midjourney api接口国内如何对接
项目背景 众所周知,Midjourney并没有提供任何的Api服务,但是基于Midjourney目前的行业龙头位置,很多企业以及个人会有相关的需求。TTApi平台基于Midjourney现有功能整理出一套完整的可集成性高的服务,如果你有类似的需求,那么恭...
-
SD-Trainer和Stable diffusion一线牵
SD-Trainer和Stable diffusion一线牵 感谢秋叶大神提供的SD-Trainer和Stable diffusion绘世启动器,让一众爱美的小伙伴能以最快的速度入门AI绘画。 但真正训练LORA和测试的时候,小伙...
-
五一超级课堂---Llama3-Tutorial(Llama 3 超级课堂)---第三节llama 3图片理解能力微调(xtuner+llava版)
课程文档: https://github.com/SmartFlowAI/Llama3-Tutorial 课程视频: https://space.bilibili.com/3546636263360696/channel/collectiondetail?...
-
百度文心一言API4.0 Python调用ERNIE-4.0-8K详细教程
ERNIE 4.0是百度自研的旗舰级超大规模⼤语⾔模型,相较ERNIE 3.5实现了模型能力全面升级,广泛适用于各领域复杂任务场景;支持自动对接百度搜索插件,保障问答信息时效,支持5K tokens输入+2K tokens输出。ERNIE-4.0-8K是模...
-
Midjourney Imagine API 申请及使用
Midjourney Imagine API 申请及使用 申请流程 要使用 Midjourney Imagine API,首先可以到 Midjourney Imagine API 页面点击「Acquire」按钮,获取请求所需要的凭证: 如果你尚未...
-
大象AI写作 我是如何编写一套属于自己的Prompt提示词的
本文背景 我们在写提示词的时候,AI对COT少量样本的学习能力很重要。 要编写出一套出色的内容创作提示(prompt ,关键在于如何教GPT进行自我创作,这就是一门“know how”的艺术。 比如当你要AI写一个视频标题,初学者只是简单地...
-
最强AI软件教程来了!教你如何使用stable diffusion快速出景观建筑效果图
<Stable Diffusion效果图教程> 要说哪款AI软件最适合建筑设计类?那必然是midjourney和Stable Diffusion!之前我们也看到了他们生成的图虽然很漂亮,但现有阶段md生成图对我们建筑景观类把控不是很友好,而且...
-
AI视频新霸主诞生!Dream Machine官宣免费用,电影级大片全网玩疯
【新智元导读】继Pika宣布上新2.0版本后,视频生成领域又有新模型加入。成立于2021年的Luma AI今天刚刚官宣了文生视频/图生视频模型Dream Machine,而且提供免费使用API,高质量的生成效果获得了很多网友的好评。 视频生成领域,又添一员...
-
Stable diffusion的SDXL模型,针不错!(含实操)
与之前的SD1.5大模型不同,这次的SDXL在架构上采用了“两步走”的生图方式: 以往SD1.5大模型,生成步骤为 Prompt → Base → Image,比较简单直接;而这次的SDXL大模型则是在中间加了一步 Refiner。Refin...
-
使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion_sagemaker ai绘图
目前人工智能模型可以分为两大类别,包括判别模型 (Discriminative Model 与生成模型 (Generative Model 。判别模型根据一组输入数据,例如文本、X 射线图像或者游戏画面,经过一系列计算得到相应目标输出结果,例如单词翻译结...
-
AIGC-风格迁移-style Injection in Diffusion-CVPR2024HighLight-论文精度
Style Injection in Diffusion: A Training-free Approach for Adapting Large-scale Diffusion Models for Style Transfer-CVPR2024High...
-
大型语言模型(LLMs)在AIGC中的核心地位
本文收录于专栏:精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践...
-
Stable Diffusion及Fooocus图片放大方法(超分辨率)体会与比较
简单地聊一下图像超分辨率的几种手段与优劣。 由SD或Fooocus等AIGC应用生成的图片一般分辨率(大小)都受到限制,基本是1024左右。 为了将小图放大到4k,或8k,出现了很多图片放大的手段(这里强调以图像超分辨率为目的,要放大,也要合理地增加细节,...
-
Llama 3 CPU推理优化指南
备受期待的 Meta 第三代 Llama 现已发布,我想确保你知道如何以最佳方式部署这种最先进的 (SoTA LLM。在本教程中,我们将重点介绍如何执行仅权重量化 (WOQ 来压缩 8B 参数模型并改善推理延迟,但首先,让我们讨论一下 Meta Lla...
-
AI绘画Stable Diffusion【真人模型】:更符合东方女性美的亚洲人像大模型ArienMixXL
大家好,我是画画的小强。 今天和大家分享的是一个国产的真人大模型ArienMixXL,该模型基于ArienRealWordV1大模型定向微调,改变底层对亚洲人的刻板印象。非常适合制作符合东方女性的各种不同类型的美女图片。 经过不断迭代更新,ArienM...
-
基于Llama 2家族的提示词工程:Llama 2 Chat, Code Llama, Llama Guard
Prompt Engineering with Llama 2 本文是学习 https://www.deeplearning.ai/short-courses/prompt-engineering-with-llama-2/ 的学习笔记。...
-
用 Unsloth 微调 LLaMA 3 8B
用 Unsloth 微调 LLaMA 3 8B 今年4月份,Meta 公司发布了功能强大的大型语言模型(LLM)Llama-3,为从事各种 NLP 任务的开发人员提供了功能强大可以在普通机器上运行的开源LLM。然而,传统的 LLM 微调过程既耗时又耗费资...
-
Stable Diffusion AI绘画:绘画参数与原理全攻略参上!千万别错过!
一、基础模型和外挂VAE模型 Ⅰ. 基本术语讲解 基础模型(大模型/底模型):属于预调模型,它决定了AI图片的主要风格。 VAE模型:全称Variational auto enconder变分自编码器,它类似于图片生成后的滤镜。 “基础模型”和...
-
Midjourney 中文文档
快速使用 学习如何在Discord上使用Midjourney Bot从简单的文本提示中创建自定义图像。 行为准则 不要表现出不良行为。不要使用我们的工具制作可能引起煽动,不安或引起争议的图像。这包括血腥和成人内容。尊重其他人和团队。 1:加入Disc...
-
Stable Diffusion【写实模型】:逼真,逼真,超级逼真的国产超写实摄影大模型万享XL
今天和大家分享的是一个国产万享系列中使用量最高的大模型:万享XL_超写实摄影,顾名思义,该大模型主要是面向写实摄影,一方面生成的图片人物皮肤纹理细节超级逼真,另一方面对于光影效果的处理也非常到位。 对于万享XL超写实摄影大模型,不同的版本参数设置是不一样...
-
【机器学习】使用Stable Diffusion实现潜在空间搜索
1、引言 1.1 潜在空间的概念 潜在空间(Latent Space)是在机器学习和深度学习中一个重要的概念,它指的是用于表示数据的一种低维空间。这个空间编码了数据中包含的所有有用信息的压缩表示,通常比原始数据空间的维数更低,从而使其更容易进行分析...
-
stable diffusion官方版本复现
踩了一些坑,来记录下 环境 CentOS Linux release 7.5.1804 (Core 服务器 RTX 3090 复现流程 按照Stable Diffusion的readme下载模型权重、我下载的是stable-diffusio...
-
移动开发最新Midjourney从入门到实战:图像生成命令及参数详解(1),2024年最新h5面试问题
学习路线+知识梳理 花了很长时间,就为了整理这张详细的知识路线脑图。当然由于时间有限、能力也都有限,毕竟嵌入式全体系实在太庞大了,包括我那做嵌入式的同学,也不可能什么都懂,有些东西可能没覆盖到,不足之处,还希望小伙伴们一起交流补充,一起完善进步。 这...
-
Stable Diffusion | Gradio界面设计及ComfyUI API调用
本文基于ComfyUI API编写了类似于webUI的Gradio交互式界面,支持文生图/图生图(SD1.x,SD2.x,SDXL,Stable Cascade),Lora,ControlNet,图生视频(SVD_xt_1_1),图像修复(FaceDeta...
-
AI绘画Stable Diffusion提示词(Prompt)原理详解,扫盲级教程还请收藏!
阅读本文大概需要 7.88 分钟。 点击上方👆名片后,送你 AI 资料 本文主要分为五部分: 1. 提示词概念详解 2. 提示词分类 & 提示词书写 提示词权重原理 & 负面提示词介绍 4. SD 出图参数详解...
-
使用Unity 接入 Stable-Diffusion-WebUI的 文生图api 并生成图像
使用Unity 接入 Stable-Diffusion-WebUI 文生图生成图像 文章目录 使用Unity 接入 Stable-Diffusion-WebUI 文生图生成图像 一、前言 二、具体步骤 1、启动SD的api设置 2、...
-
LLM 评估汇总:真的吊打 LLaMA-3,媲美 GPT-4 吗?
一、背景 在过去的一年多里,国内在大模型领域的发展异常迅速,涌现出上百个大模型,许多模型已经迭代了多个版本,并且各种指标不断刷新。与此同时,我们也经常在国内的一些文章中看到声称“吊打 LLaMA 3”或“媲美 GPT-4”的说法。那么,国内的大模型真的已...
-
02:从文生图初窥Stable Diffusion,一键玩转AI绘画
前言 Stable Diffusion是一个什么架构呢,或者说是由哪些部分构成,各自发挥着怎么样的作用。我们就先从文生图开始探索 文生图 我们打开Stable Diffusion的webui,然后选择Stable Diffusion模型,然后选择...
-
AIGC领域又有大动作了!AI视频“黑马”Morph Studio 来袭,1080P高清画质视频免费生成!
起初小编也不知道 Morph Studio,也是从AIGC美少女、AI电影导演 海辛Hyacinth 口中知晓,因为她在2024年刚加入了 Morph Studio公司。 废话不多数,接下来小编则为大家介绍下 Morph Studio 这个初创公司开...
-
阅读笔记——生成式人工智能AIGC的逻辑与应用读后感
阅读笔记——生成式人工智能AIGC的逻辑与应用读后感 我们不会被人工智能所取代,但极大可能会被善于使用人工智能的人所取代 时至今日,我都忘了我是怎么与这本书结缘的了。 是见猎心喜吧,当时看出版日期挺新的 大约是23年12月的时候,我...
-
FP6精度单卡运行Llama 70B模型,性能飞跃引领大模型时代
在深度学习领域,模型的运行效率和精度一直是研究者们追求的目标。最近,微软DeepSpeed团队在这一领域取得了突破性进展,他们在没有英伟达官方支持的情况下,成功在NVIDIA A100 GPU上实现了FP6精度的运行,这一成就不仅提升了计算速度,还保持了计...
-
现在都在用AI辅助面试,当年我求职的时候也好想有。
对于大部分的打工人和即将毕业的学生而言,如果AI有一个非常实用的落地场景,那我觉得,一定就是AI辅助面试。 前阵子刷手机刷到了一些求职培训的广告,开屏就是一段记忆杀对话: 我才反应过来,现在已经盛夏了,又是一年一度毕业生朋友们的求职季。 真一下子唤起了我...
-
diffusers flask streamlit或gradio 简洁可视化AIGC文生图页面
参考: https://python-bloggers.com/2022/12/stable-diffusion-application-with-streamlit/ https://github.com/LowinLi/stable-diffusion...
-
超详细!AI 绘画神器 Stable Diffusion 基础教程_stable diffusion ai怎么用
HED 边缘检测 跟 Canny 类似,但自由发挥程度更高。HED 边界保留了输入图像中的细节,绘制的人物明暗对比明显,轮廓感更强,适合在保持原来构图的基础上对画面风格进行改变时使用。 Scribble 黑白稿提取 涂鸦成图,比 HED 和 Ca...
-
AIGC系列之:GroundingDNIO原理解读及在Stable Diffusion中使用
目录 1.前言 2.方法概括 3.算法介绍 3.1图像-文本特征提取与增强 3.2基于文本引导的目标检测 3.3跨模态解码器 3.4文本prompt特征提取 4.应用场景 4.1结合生成模型完成目标区域生成 4.2结合stable di...