-
Midjourney绘画参数设置详解
在数字艺术和设计领域,Midjourney是一款强大的绘画工具,它允许艺术家和设计师以数字方式创作出精美的图像。为了充分发挥Midjourney的潜力,正确设置其绘画参数至关重要。本文将深入探讨Midjourney的绘画参数设置,帮助用户更好地掌握这一工具...
-
【LLM第二篇】stable diffusion扩散模型、名词解释
最近在整理大模型的相关资料,发现了几个名词,不是很懂,这里整理一下: stable diffusion(SD 模型: 扩散模型(Diffusion model)的一种,主要用于生成高质量的图像,GAN的替代者,扩散模型通过一些列学习步骤生成数据,逐渐从...
-
whisper使用
whisper使用 1. 直接调用 语音识别 2. 语种识别 whisper.detect_language( 和whisper.decode( 3. 指定要识别的语种做语音识别 **whisper 源码的transcribe函数** 函数解...
-
Midjourney NIJI5制作动漫风格作品保姆级教程
大家好!最近我尝试了好几个与动漫艺术相关的AI绘画平台,发现Midjourney(AIGF)的 Niji 模式绝对是目前最好用的动漫风格生成式 AI 之一! 最让我震惊的是,我们甚至不需要会画画,就能创造出高质量的图像!AI 绘画和Midjourne...
-
区分stable diffusion中的通道数与张量维度
区分stable diffusion中的通道数与张量形状 1.通道数: 1.1 channel = 3 1.2 channel = 4 2.张量形状 2.1 3D 张量 2.2 4D 张量 2.2.1 通常 2.2.2 stable d...
-
midjourney绘画,midjourney api接口国内如何对接
项目背景 众所周知,Midjourney并没有提供任何的Api服务,但是基于Midjourney目前的行业龙头位置,很多企业以及个人会有相关的需求。TTApi平台基于Midjourney现有功能整理出一套完整的可集成性高的服务,如果你有类似的需求,那么恭...
-
SD-Trainer和Stable diffusion一线牵
SD-Trainer和Stable diffusion一线牵 感谢秋叶大神提供的SD-Trainer和Stable diffusion绘世启动器,让一众爱美的小伙伴能以最快的速度入门AI绘画。 但真正训练LORA和测试的时候,小伙...
-
五一超级课堂---Llama3-Tutorial(Llama 3 超级课堂)---第三节llama 3图片理解能力微调(xtuner+llava版)
课程文档: https://github.com/SmartFlowAI/Llama3-Tutorial 课程视频: https://space.bilibili.com/3546636263360696/channel/collectiondetail?...
-
百度文心一言API4.0 Python调用ERNIE-4.0-8K详细教程
ERNIE 4.0是百度自研的旗舰级超大规模⼤语⾔模型,相较ERNIE 3.5实现了模型能力全面升级,广泛适用于各领域复杂任务场景;支持自动对接百度搜索插件,保障问答信息时效,支持5K tokens输入+2K tokens输出。ERNIE-4.0-8K是模...
-
Midjourney Imagine API 申请及使用
Midjourney Imagine API 申请及使用 申请流程 要使用 Midjourney Imagine API,首先可以到 Midjourney Imagine API 页面点击「Acquire」按钮,获取请求所需要的凭证: 如果你尚未...
-
大象AI写作 我是如何编写一套属于自己的Prompt提示词的
本文背景 我们在写提示词的时候,AI对COT少量样本的学习能力很重要。 要编写出一套出色的内容创作提示(prompt ,关键在于如何教GPT进行自我创作,这就是一门“know how”的艺术。 比如当你要AI写一个视频标题,初学者只是简单地...
-
最强AI软件教程来了!教你如何使用stable diffusion快速出景观建筑效果图
<Stable Diffusion效果图教程> 要说哪款AI软件最适合建筑设计类?那必然是midjourney和Stable Diffusion!之前我们也看到了他们生成的图虽然很漂亮,但现有阶段md生成图对我们建筑景观类把控不是很友好,而且...
-
AI视频新霸主诞生!Dream Machine官宣免费用,电影级大片全网玩疯
【新智元导读】继Pika宣布上新2.0版本后,视频生成领域又有新模型加入。成立于2021年的Luma AI今天刚刚官宣了文生视频/图生视频模型Dream Machine,而且提供免费使用API,高质量的生成效果获得了很多网友的好评。 视频生成领域,又添一员...
-
Stable diffusion的SDXL模型,针不错!(含实操)
与之前的SD1.5大模型不同,这次的SDXL在架构上采用了“两步走”的生图方式: 以往SD1.5大模型,生成步骤为 Prompt → Base → Image,比较简单直接;而这次的SDXL大模型则是在中间加了一步 Refiner。Refin...
-
使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion_sagemaker ai绘图
目前人工智能模型可以分为两大类别,包括判别模型 (Discriminative Model 与生成模型 (Generative Model 。判别模型根据一组输入数据,例如文本、X 射线图像或者游戏画面,经过一系列计算得到相应目标输出结果,例如单词翻译结...
-
AIGC-风格迁移-style Injection in Diffusion-CVPR2024HighLight-论文精度
Style Injection in Diffusion: A Training-free Approach for Adapting Large-scale Diffusion Models for Style Transfer-CVPR2024High...
-
大型语言模型(LLMs)在AIGC中的核心地位
本文收录于专栏:精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践...
-
Stable Diffusion及Fooocus图片放大方法(超分辨率)体会与比较
简单地聊一下图像超分辨率的几种手段与优劣。 由SD或Fooocus等AIGC应用生成的图片一般分辨率(大小)都受到限制,基本是1024左右。 为了将小图放大到4k,或8k,出现了很多图片放大的手段(这里强调以图像超分辨率为目的,要放大,也要合理地增加细节,...
-
Llama 3 CPU推理优化指南
备受期待的 Meta 第三代 Llama 现已发布,我想确保你知道如何以最佳方式部署这种最先进的 (SoTA LLM。在本教程中,我们将重点介绍如何执行仅权重量化 (WOQ 来压缩 8B 参数模型并改善推理延迟,但首先,让我们讨论一下 Meta Lla...
-
AI绘画Stable Diffusion【真人模型】:更符合东方女性美的亚洲人像大模型ArienMixXL
大家好,我是画画的小强。 今天和大家分享的是一个国产的真人大模型ArienMixXL,该模型基于ArienRealWordV1大模型定向微调,改变底层对亚洲人的刻板印象。非常适合制作符合东方女性的各种不同类型的美女图片。 经过不断迭代更新,ArienM...
-
基于Llama 2家族的提示词工程:Llama 2 Chat, Code Llama, Llama Guard
Prompt Engineering with Llama 2 本文是学习 https://www.deeplearning.ai/short-courses/prompt-engineering-with-llama-2/ 的学习笔记。...
-
用 Unsloth 微调 LLaMA 3 8B
用 Unsloth 微调 LLaMA 3 8B 今年4月份,Meta 公司发布了功能强大的大型语言模型(LLM)Llama-3,为从事各种 NLP 任务的开发人员提供了功能强大可以在普通机器上运行的开源LLM。然而,传统的 LLM 微调过程既耗时又耗费资...
-
Stable Diffusion AI绘画:绘画参数与原理全攻略参上!千万别错过!
一、基础模型和外挂VAE模型 Ⅰ. 基本术语讲解 基础模型(大模型/底模型):属于预调模型,它决定了AI图片的主要风格。 VAE模型:全称Variational auto enconder变分自编码器,它类似于图片生成后的滤镜。 “基础模型”和...
-
Midjourney 中文文档
快速使用 学习如何在Discord上使用Midjourney Bot从简单的文本提示中创建自定义图像。 行为准则 不要表现出不良行为。不要使用我们的工具制作可能引起煽动,不安或引起争议的图像。这包括血腥和成人内容。尊重其他人和团队。 1:加入Disc...
-
Stable Diffusion【写实模型】:逼真,逼真,超级逼真的国产超写实摄影大模型万享XL
今天和大家分享的是一个国产万享系列中使用量最高的大模型:万享XL_超写实摄影,顾名思义,该大模型主要是面向写实摄影,一方面生成的图片人物皮肤纹理细节超级逼真,另一方面对于光影效果的处理也非常到位。 对于万享XL超写实摄影大模型,不同的版本参数设置是不一样...
-
【机器学习】使用Stable Diffusion实现潜在空间搜索
1、引言 1.1 潜在空间的概念 潜在空间(Latent Space)是在机器学习和深度学习中一个重要的概念,它指的是用于表示数据的一种低维空间。这个空间编码了数据中包含的所有有用信息的压缩表示,通常比原始数据空间的维数更低,从而使其更容易进行分析...
-
stable diffusion官方版本复现
踩了一些坑,来记录下 环境 CentOS Linux release 7.5.1804 (Core 服务器 RTX 3090 复现流程 按照Stable Diffusion的readme下载模型权重、我下载的是stable-diffusio...
-
移动开发最新Midjourney从入门到实战:图像生成命令及参数详解(1),2024年最新h5面试问题
学习路线+知识梳理 花了很长时间,就为了整理这张详细的知识路线脑图。当然由于时间有限、能力也都有限,毕竟嵌入式全体系实在太庞大了,包括我那做嵌入式的同学,也不可能什么都懂,有些东西可能没覆盖到,不足之处,还希望小伙伴们一起交流补充,一起完善进步。 这...
-
Stable Diffusion | Gradio界面设计及ComfyUI API调用
本文基于ComfyUI API编写了类似于webUI的Gradio交互式界面,支持文生图/图生图(SD1.x,SD2.x,SDXL,Stable Cascade),Lora,ControlNet,图生视频(SVD_xt_1_1),图像修复(FaceDeta...
-
AI绘画Stable Diffusion提示词(Prompt)原理详解,扫盲级教程还请收藏!
阅读本文大概需要 7.88 分钟。 点击上方?名片后,送你 AI 资料 本文主要分为五部分: 1. 提示词概念详解 2. 提示词分类 & 提示词书写 提示词权重原理 & 负面提示词介绍 4. SD 出图参数详解...
-
使用Unity 接入 Stable-Diffusion-WebUI的 文生图api 并生成图像
使用Unity 接入 Stable-Diffusion-WebUI 文生图生成图像 文章目录 使用Unity 接入 Stable-Diffusion-WebUI 文生图生成图像 一、前言 二、具体步骤 1、启动SD的api设置 2、...
-
LLM 评估汇总:真的吊打 LLaMA-3,媲美 GPT-4 吗?
一、背景 在过去的一年多里,国内在大模型领域的发展异常迅速,涌现出上百个大模型,许多模型已经迭代了多个版本,并且各种指标不断刷新。与此同时,我们也经常在国内的一些文章中看到声称“吊打 LLaMA 3”或“媲美 GPT-4”的说法。那么,国内的大模型真的已...
-
02:从文生图初窥Stable Diffusion,一键玩转AI绘画
前言 Stable Diffusion是一个什么架构呢,或者说是由哪些部分构成,各自发挥着怎么样的作用。我们就先从文生图开始探索 文生图 我们打开Stable Diffusion的webui,然后选择Stable Diffusion模型,然后选择...
-
AIGC领域又有大动作了!AI视频“黑马”Morph Studio 来袭,1080P高清画质视频免费生成!
起初小编也不知道 Morph Studio,也是从AIGC美少女、AI电影导演 海辛Hyacinth 口中知晓,因为她在2024年刚加入了 Morph Studio公司。 废话不多数,接下来小编则为大家介绍下 Morph Studio 这个初创公司开...
-
阅读笔记——生成式人工智能AIGC的逻辑与应用读后感
阅读笔记——生成式人工智能AIGC的逻辑与应用读后感 我们不会被人工智能所取代,但极大可能会被善于使用人工智能的人所取代 时至今日,我都忘了我是怎么与这本书结缘的了。 是见猎心喜吧,当时看出版日期挺新的 大约是23年12月的时候,我...
-
FP6精度单卡运行Llama 70B模型,性能飞跃引领大模型时代
在深度学习领域,模型的运行效率和精度一直是研究者们追求的目标。最近,微软DeepSpeed团队在这一领域取得了突破性进展,他们在没有英伟达官方支持的情况下,成功在NVIDIA A100 GPU上实现了FP6精度的运行,这一成就不仅提升了计算速度,还保持了计...
-
现在都在用AI辅助面试,当年我求职的时候也好想有。
对于大部分的打工人和即将毕业的学生而言,如果AI有一个非常实用的落地场景,那我觉得,一定就是AI辅助面试。 前阵子刷手机刷到了一些求职培训的广告,开屏就是一段记忆杀对话: 我才反应过来,现在已经盛夏了,又是一年一度毕业生朋友们的求职季。 真一下子唤起了我...
-
diffusers flask streamlit或gradio 简洁可视化AIGC文生图页面
参考: https://python-bloggers.com/2022/12/stable-diffusion-application-with-streamlit/ https://github.com/LowinLi/stable-diffusion...
-
超详细!AI 绘画神器 Stable Diffusion 基础教程_stable diffusion ai怎么用
HED 边缘检测 跟 Canny 类似,但自由发挥程度更高。HED 边界保留了输入图像中的细节,绘制的人物明暗对比明显,轮廓感更强,适合在保持原来构图的基础上对画面风格进行改变时使用。 Scribble 黑白稿提取 涂鸦成图,比 HED 和 Ca...
-
AIGC系列之:GroundingDNIO原理解读及在Stable Diffusion中使用
目录 1.前言 2.方法概括 3.算法介绍 3.1图像-文本特征提取与增强 3.2基于文本引导的目标检测 3.3跨模态解码器 3.4文本prompt特征提取 4.应用场景 4.1结合生成模型完成目标区域生成 4.2结合stable di...
-
引领Midjourney Logo设计新潮流:激发创意,探索无限可能 - V5版 (上)
大家好!天,我们非常高兴地为大家带来一项精彩教程——利用Midjourney来设计和制作精美的Logo。本教程将涵盖两个版本:Midjourney v5和v6,以满足不同用户的需求和创意发挥。 在v5版本中,我们将着重于激发您的无限创意。为此,我们精...
-
干货满满!Stable Diffusion 从入门到精通之提示词手册,免费分享,自学转行,零基础首选!
Stable Diffusion 技术把 AI 图像生成提高到了一个全新高度,文生图 Text to image 生成质量很大程度上取决于你的提示词 Prompt 好不好。本文从“如何写好提示词”出发,从提示词构成、调整规则和 AIGC辅助工具等角度,对文...
-
AIGC学习(SD、LoRA和ControlNet)
目录 Stable Diffusion(稳定扩散模型) 为什么叫扩散模型? 网络结构 VAE(Variational Auto-Encoder) UNet模型 CLIP Text Encoder LoRA(低秩适应矩阵 什么是LoRA?...
-
使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion_sagemaker ai绘图(1)
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。 需要这份系统化资料的朋友,可以戳这里获取 一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的...
-
五一 Llama 3 超级课堂 | XTuner 微调 Llama3 图片理解多模态 实践笔记
基于 Llama3-8B-Instruct 和 XTuner 团队预训练好的 Image Projector 微调自己的多模态图文理解模型 LLaVA。 课程文档:Llama3-Tutorial/docs/llava.md at main · Smart...
-
30岁失业的我,选择职场转型,进入AIGC工程师领域,重新开始
去年,刚满30岁的我又一次被公司辞退了,由于学历不高,简历也不出彩,尽管半个月来投了一份又一份的简历,但仍然是石沉大海,我终于不得不开始思考一个以前被我一直刻意压制的想法——职场转型。 尽管知道这条路艰难,几乎是要从零重新开始,但比耗死在之前那几乎看不到...
-
AUTOMATIC1111/stable-diffusion-webui/stable-diffusion-webui-v1.9.3
配置环境介绍 目前平台集成了 Stable Diffusion WebUI 的官方镜像,该镜像中整合如下资源: GpuMall智算云 | 省钱、好用、弹性。租GPU就上GpuMall,面向AI开发者的GPU云平台 Stable Diffusion W...
-
AIGC-Stable Diffusion进阶1(附代码)
在上篇文章中对Stable Diffusion进行了初步的认识,也给出了使用案例,这篇文章将进一步的去刨析一下SD模型。 SD模型的组成 在之前也讲过了,SD由CLIP、UNet、Schedule,VAE组成。再来回顾一下知识点: 1.CLIP Te...
-
AI怎么写作?如何利用AI写作?AI写作方式一定要学会
懂得怎么样向ChatGPT提问,会更有效率地得到更符合用户需求的答案。 也就是要懂得怎么写prompt。 今天我们尝试用一个写故事小说的案例来实践一下~ 在正式开始之前,我们先来看看以下内容。 问:发挥你的想象,帮我写⼀篇帅⽓霸道总裁喜欢上...
-
基于大语言模型的 Odoo Copilot 模块设计方案
基于大语言模型的 Odoo Copilot 模块设计方案 背景 Odoo 是一套开源的企业管理系统,专为满足从小型企业到中大型企业多元化业务需求而设计。它以其全面的功能覆盖、高度的模块化架构、用户友好的界面以及强大的可扩展性,在全球范围内受到广...