clip 第9页 - AIGC资讯

全网最全Stable Diffusion原理说明！！简单明了容易理解！！！

手把手教你入门绘图超强的AI绘画程序Stable Diffusion，用户只需要输入一段图片的文字描述，即可生成精美的绘画。下面是Stable Diffusion注册和使用的方法。给大家带来了全新Stable Diffusion保姆级教程资料包（文末可获取...

大数据 2024-04-01 人工智能

1397阅读

上海交大新框架解锁CLIP长文本能力，多模态生成细节拿捏，图像检索能力显著提升

CLIP长文本能力被解锁，图像检索任务表现显著提升！一些关键细节也能被捕捉到。上海交大联合上海AI实验室提出新框架Long-CLIP。 △棕色文本为区分两张图的关键细节 Long-CLIP在保持CLIP原始特征空间的基础上，在图像生成等下游任务中即插...

生成式AI 2024-04-01 人工智能

990阅读

Stable Diffusion WebUI 图生图（img2img）：图生图/涂鸦绘制/局部重绘/有色蒙版/上传蒙版/批量处理/反推提示词

本文收录于《AI绘画从入门到精通》专栏，专栏总目录：点这里，订阅后可阅读专栏内所有文章。大家好，我是水滴~~ 本篇文章我们介绍 Stable Diffusion WebUI 的图生图功能，主要包括：图生图、图生图（手绘修正）/涂鸦绘制、局部重绘、...

生成式AI 2024-04-01 人工智能

2656阅读

stable-diffusion.cpp 一个文件解决stable diffusion所有环境，不需要python，stable-diffusion.dll动态库C#调用Demo

stable-diffusion.cpp 一个文件解决stable-diffusion所有环境，不需要python，stable-diffusion.dll动态库C#调用Demo 目录介绍效果 Text To Image Image To...

人工智能 2024-04-01 人工智能

886阅读

全面综述！大模型到底微调个啥？或者说技术含量到底有多大？

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解大型模型代表了多个应用领域的突破性进展，能够在各种任务中取得显著成就。然而，它们前所未有的规模带来了巨大的计算成本。这些模型通常由数十亿个参数组成，需要大量的计算资源才...

AIGC 2024-04-01 人工智能

1612阅读

【Stable Diffusion初学者指南】模型指南

文章目录微调模型什么是微调？人们为什么要制作Stable Diffusion模型？模型是如何创建的？流行的Stable Diffusion模型 Stable diffusion v1.4 Stable diffusion v1....

生成式AI 2024-04-01 人工智能

2014阅读

Stable Diffusion——Animate Diff一键AI图像转视频

前言 AnimateDiff 是一个实用框架，可以对文本生成图像模型进行动画处理，无需进行特定模型调整，即可为大多数现有的个性化文本转图像模型提供动画化能力。而Animatediff 已更新至 2.0 版本和3.0两个版本，相较于 1.0 版本，2.0...

AIGC 2024-03-31 人工智能

1406阅读

Stable Diffusion之核心基础知识和网络结构解析

Stable Diffusion核心基础知识和网络结构解析一. Stable Diffusion核心基础知识 1.1 Stable Diffusion模型工作流程 1. 文生图(txt2img 2. 图生图 3. 图像优化模块 1.2...

生成式AI 2024-03-31 人工智能

1353阅读

llama.cpp部署多模态视觉模型到应用实践

一、安装cmake https://cmake.org/ 因为我使用是win10系统cmake版本是3.26.4，请根据自己系统选择版本。二、下载源码 git clone https://github.com/ggerganov/llam...

人工智能 2024-03-30 人工智能

2319阅读

AI绘画 | stable-diffusion-web-ui的基本操作

前言我们下载安装完成stable-diffusion-web-ui以后，下载对应风格的模型，就可以开始我们的绘画操作了。进行Ai绘画操作前，我们最好先弄清楚web ui界面上的参数按钮的含义。这样我们就能更轻松的绘画出我们想要stable-diffu...

AIGC 2024-03-30 人工智能

2701阅读

【AIGC】Animate Anyone阿里全民舞王背后的科技，基于图片高可控动画生成

在11月底，阿里巴巴集团智能计算研究院发布了一款AI动画项目：Animate Anyone。只需要一张人物静态图片，结合人物的骨骼动画（姿势控制），就能生成一段人物动画视频。我们先通过官网放出的动画效果直观感受一下。一. Anima...

大数据 2024-03-29 人工智能

1272阅读

AI绘画Imagen大力出奇迹生成图像

AI绘画Imagen大力出奇迹生成图像介绍 Imagen是一个文本到图像的扩散模型，由Google大脑团队研究所开发。 Imagen通过创新的设计，摈弃了需要预训练视觉-语言模型的繁琐步骤，直接采用了T5等大规模语言模型作为文...

大数据 2024-03-29 人工智能

1012阅读

两分钟1200帧的长视频生成器StreamingT2V来了，代码将开源

广阔的战场，风暴兵在奔跑…… prompt：Wide shot of battlefield, stormtroopers running... 这段长达 1200 帧的 2 分钟视频来自一个文生视频（text-to-video）模型，尽管 AI 生成...

生成式AI 2024-03-27 人工智能

827阅读

CLIP-BEVFormer：显式监督BEVFormer结构，提升长尾检测性能

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解目前，在整个自动驾驶系统当中，感知模块扮演了其中至关重要的角色，行驶在道路上的自动驾驶车辆只有通过感知模块获得到准确的感知结果后，才能让自动驾驶系统中的下游规控模块做...

大数据 2024-03-26 人工智能

1246阅读

【AI绘画】没有大显存？新人上手SD1.5模型推荐

SDXL有千般好，但是大显存却绕不开。更何况很多优秀的模型目前只有SD1.5版本的，今天就来介绍一些不同领域内好用的代表性的SD1.5模型，足够新人探索一段时间喽。(相关模型去C站搜标题找或者直接文末扫马领取目录好看到不真实的写实风：maj...

AIGC 2024-03-26 人工智能

1222阅读

stable-diffusion-webui中stability的sdv1.5和sdxl模型结构config对比

sdv1.5 v1-inference.yaml model: base_learning_rate: 1.0e-04 target: ldm.models.diffusion.ddpm.LatentDiffusion params:...

AIGC 2024-03-26 人工智能

1279阅读

提升你的 AI 绘画技能：Stable Diffusion 进阶攻略

本文主要介绍的各种模型类型：模型底模、VAE 美化模型、Lora 模型和 hypernetwork 文末扫码可咨询！使用模型两个模型分享站，自备梯子哦。 C站：https://civitai.com/ huggingface：https://...

AIGC 2024-03-25 人工智能

1365阅读

秋神SD整合包 AI绘画 Stable Diffusion 整合包 V4版解压即用 AI绘图模型LoRA + 最新

「无套路！文末提供下载方式」 2024年绘画圈最火的软件那妥妥的就Stable Diffution V4升级版无需安装，直接解压就能用（在此要感谢秋葉aaaki大佬的分享！）** 比之前版本的更加智能、高效和易操作 V4加强版小白也能轻...

大数据 2024-03-24 人工智能

1166阅读

Stable Diffusion AI绘画商业应用教程

BIGD Stable Diffusion商业化，AI绘画入门到精通，主要分为创意内容运营设计、品牌策划与视觉传达、三维视觉视效、电商活动节日宣传等。 Stable Diffusion 是⼀种基于扩散过程的图像生成模型，可以生成高质量、高分辨...

大数据 2024-03-23 人工智能

1336阅读

探索stable diffusion的奇妙世界--01

目录 1. 理解prompt提示词： 2. Prompt中的技术参数： 3. Prompt中的Negative提示词： 4. Prompt中的特殊元素： 5. Prompt在stable diffusion中的应用： 6. 作品展示：...

人工智能 2024-03-23 人工智能

828阅读

文生图的基石CLIP模型的发展综述

CLIP的英文全称是Contrastive Language-Image Pre-training，即一种基于对比文本-图像对的预训练方法或者模型。CLIP是一种基于对比学习的多模态模型，CLIP的训练数据是文本-图像对：一张图像和它对应的文本描述，这里...

AIGC 2024-03-22 人工智能

1042阅读

一个开源免费的实时AI绘画软件Krita

Krita是由Krita插件+ComfyUI+LCM插件结合的一个实时可预览的AI绘画工具，是一款自由开源、免费的专业级绘画软件，Krita采用的是GNU GPL许可证确保它将一直保持自由开源的本色。一：搭建Krita创作平台 1、Krita客户...

人工智能 2024-03-21 人工智能

2730阅读

chatGPT的耳朵！OpenAI的开源语音识别AI：Whisper ！

语音识别是通用人工智能的重要一环！可以说是AI的耳朵！它可以让机器理解人类的语音，并将其转换为文本或其他形式的输出。语音识别的应用场景非常广泛，比如智能助理、语音搜索、语音翻译、语音输入等等。然而，语音识别也面临着很多挑战，比如不同的语言、口音...

人工智能 2024-03-21 人工智能

1056阅读

【本地化部署Stable Diffusion WebUI（MACOS安装）】

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Stable Diffusion WebUI适配三类芯片二、安装 1.安装git、conda等 2.选定目录及下载Github远程仓库文件 3....

大数据 2024-03-20 人工智能

874阅读

Stable Diffusion 3 震撼发布，采用Sora同源技术，文字终于不乱码了

Stable Diffusion 3 和 Sora 一样采用了 diffusion transformer 架构。继 OpenAI 的 Sora 连续一周霸屏后，昨晚，生成式 AI 顶级技术公司 Stability AI 也放了一个大招 ——Sta...

人工智能 2024-03-20 人工智能

968阅读

【AI绘画】2024最新Stable Diffusion 超详细讲解！！必收藏！！！！

手把手教你入门绘图超强的AI绘画，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取） Stable Diffusion 超详细讲解这篇文章是《Stable Diffusion原理详解》的后续，在...

人工智能 2024-03-20 人工智能

1362阅读

Stability AI开源上新：3D生成引入视频扩散模型，质量一致性up，4090可玩

Stable Diffusion背后公司Stability AI又上新了。这次带来的是图生3D方面的新进展：基于Stable Video Diffusion的Stable Video 3D（SV3D），只用一张图片就能生成高质量3D网格。 Stab...

人工智能 2024-03-20 人工智能

830阅读

AI绘画专栏之提升40% 4步搞定StableCascadeComfyui工作流不再报错

上一期我们提到了Stability更新的Cascade模型，这个模型在图像质量上对比SDXL提升了40%的性能，现已官方版本支持了Comfyui的工作流，让我们4步搞定它吧 StableCascade 链接：https://pan.quark.cn...

大数据 2024-03-19 人工智能

1139阅读

Python AI 之Stable-Diffusion-WebUI

Stable-Diffusion-WebUI简介通过Gradio库，实现Stable Diffusion web 管理接口 Windows 11 安装Stable-Diffusion-WebUI 个人认为Stable-Diffusion-We...

AIGC 2024-03-19 人工智能

1116阅读

huggingface的diffusers训练stable diffusion记录

代码：https://github.com/huggingface/diffusers/tree/main/examples/text_to_image 2006.11239.pdf (arxiv.org 论文 2006.11239.pdf (ar...

人工智能 2024-03-19 人工智能

1455阅读

Stable Diffusion 跑通总结

记录了自己跑通Stable Diffusion的过程和踩过的坑，目前只是初步跑了一下，没有很深入的使用代码，希望能有一些参考价值。在Windows系统运行，需要提前装好Conda 一、下载代码和模型 1、下载代码：代码下载：代码地址或者...

AIGC 2024-03-17 人工智能

1235阅读

20240203在WIN10下配置stable-diffusion-webui.git

20240203在WIN10下配置stable-diffusion-webui.git 2024/2/3 11:55 【结论：在WIN10下，生成512x512分辨率的图像，大概需要9秒钟！】【结论：在Ubuntu20.04.6下，生成512x512...

AIGC 2024-03-17 人工智能

961阅读

”的示例文章。不过由于系统限制，我不能直接在这个界面上为您提供完整的2000字文章。然而，我可以为您写一个较短的文章草稿作为示范，您可以根据需要进行扩写或调整来达到所需的字数。以下是一篇简化的文章草案，演示如何构建一篇围绕“关键词文章采集系统”主题的内容：

根据您的需求，我会生成一个包含标题且标题前后都带有固定字符“《解密关键词文章采集系统：工作原理与应用场景》=====在信息爆炸的今天，如何在互联网浩瀚的信息海洋中寻找到自己需要的内容成了一大挑战。这就是为什么许多领域的专业人士开始对关键词文章采集系统投以浓...

AIGC 2024-03-17 大数据

925阅读

stable diffusion 1.5大模型炼制详细教程，几块钱即可炼制大模型

前言之前已经讲过SDXL_LORA,SD1.5_LORA训练过程，基本说的比较清楚了，有兴趣可以去看看，下面我将讲解一下SD1.5大模型的炼制。 SDXL_LORA：https://tian-feng.blog.csdn.net/article/d...

大数据 2024-03-17 人工智能

1479阅读

Stable diffusion安装以及汉化

安装参考:https://blog.csdn.net/weixin_72959097/article/details/136261658 （1）下载miniconda Miniconda是一个轻量级的包管理系统，用于管理和部署Python环境和软件包。...

人工智能 2024-03-17 人工智能

1208阅读

Stable Diffusion XL on diffusers

Stable Diffusion XL on diffusers 翻译自：https://huggingface.co/docs/diffusers/using-diffusers/sdxl v0.24.0 非逐字翻译 Stable Dif...

大数据 2024-03-17 人工智能

946阅读

Stable Diffusion WebUI安装报错解决

本人是一个AI新手，最近在研究文生图方面相关内容时看到Stable Diffusion WebUI这个项目，想在本地部署安装试用看下效果，安装过程中遇到了一些问题，此处记录一下问题1：Python 3.12.1 (tags/v3.12.1:2305ca...

生成式AI 2024-03-17 人工智能

3236阅读

LLaMA-Factory 8卡4090 deepspeed zero3 微调Qwen14B-chat

环境安装推荐使用docker，Ubuntu20.04https://www.modelscope.cn/docs/%E7%8E%AF%E5%A2%83%E5%AE%89%E8%A3%85 docker pull registry.cn-beijin...

人工智能 2024-03-17 人工智能

1622阅读

上热榜了！抖音博主被曝用AI作品欺骗观众；看看Sora炸出来多少好东西；我帮你踩遍了AIGC创业的各种坑；图解 Stable Diffusion | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 抖音知名绘画博主被曝作品是AI制作的，然后道歉也是 ChatGPT 生成的？ 2月21日，抖音知名绘画博主 @曾bobi 发布了最新作品，是他们几...

AIGC 2024-03-16 人工智能

1004阅读

How does Stable Diffusion work?

Stable Diffusion is a latent diffusion model that generates AI images from text. Instead of operating in the high-dimensional im...

人工智能 2024-03-16 人工智能

943阅读

MACBOOK PRO M2 MAX 安装Stable Diffusion及文生图实例

以前偶尔会使用Midjourney生成一些图片，现在使用的头像就是当时花钱在Midjourney上生成的。前段时间从某鱼上拍了一台性价比还不错的macbook，想着不如自己部署Stable Diffusion（以下简称SD）尝试一下。网上有很多教程，但...

大数据 2024-03-16 人工智能

1111阅读

AI图像平台Fotor推出一站式AI长视频平台Clipfly

近日，图像编辑平台Fotor正式拓展视频领域，推出名为Clipfly的全新一站式AI长视频平台。Clipfly集成了AI视频生成、增强和编辑等多种功能，用户可在该平台完成从构思到最终视频输出的整个流程。 Fotor创始人兼CEO段江表示，凭借公司在图像AI...

人工智能 2024-03-15 人工智能

883阅读

Stable diffusion（二）

SD colab安装 https://colab.research.google.com/github/TheLastBen/fast-stable-diffusion/blob/main/fast_stable_diffusion_AUTOMATIC...

大数据 2024-03-15 人工智能

826阅读

Clipfly官网体验入口 AI视频生成编辑软件工具免费在线使用地址

Clipfly是一个强大的在线视频编辑工具，利用AI技术，可帮助用户在浏览器中快速编辑和创建视频。它提供了众多视频编辑功能，包括剪辑、裁剪、添加文字、音乐和滤镜等。用户可使用AI视频生成器将静态图片转为动画视频，或使用AI视频增强器使模糊视频变得清晰。...

AIGC 2024-03-15 人工智能

934阅读

今日AI：苹果大模型MM1入场；Sora训练数据来源竟来自这；全球最快AI芯片WSE-3发布；阿里邀请AI参加数学竞赛

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI新鲜事苹果大模型MM1...

AIGC 2024-03-15 人工智能

826阅读

苹果大模型MM1杀入场：300亿参数、多模态、MoE架构，超半数作者是华人

今年以来，苹果显然已经加大了对生成式人工智能（GenAI）的重视和投入。此前在 2024 苹果股东大会上，苹果 CEO 蒂姆・库克表示，今年将在 GenAI 领域实现重大进展。此外，苹果宣布放弃 10 年之久的造车项目之后，一部分造车团队成员也开始转向...

大数据 2024-03-15 人工智能

927阅读

Stable Diffusion 3 技术论文解读：开源能赢得文生图竞赛吗？

在大语言模型领域，闭源模型正在赢得比赛，无论是 OpenAI 还是刚刚发布新模型的 Anthropic，都是闭源模型的代表。但在文生图领域，开源模型却表现出了足够强的竞争力。 2 周前，开源模型的代表企业 Stability AI 发布了最新...

AIGC 2024-03-15 人工智能

870阅读

Stable Diffusion——文生图界面参数讲解与提示词使用技巧

Clip终止层数什么是Clip CLIP（Contrastive Language-Image Pretraining）是由OpenAI于2021年开发的一种语言图像对比预训练模型。其独特之处在于，CLIP模型中的图像和文本嵌入共享相同的潜在...

AIGC 2024-03-15 人工智能

1722阅读

【深度学习】风格迁移，转换，Stable Diffusion，FreeStyle : Free Lunch for Text-guided Style Transfer using Diffusion

论文：https://arxiv.org/abs/2401.15636 代码：https://github.com/FreeStyleFreeLunch/FreeStyle 介绍生成扩散模型的快速发展极大地推进了风格迁移领域的发展。然而，大多数当...

AIGC 2024-03-14 人工智能

1487阅读

Stable Diffusion系列（四）：提示词规则与使用

文章目录基础规则高级规则插件使用基于相机镜头增强提示词常用提示词总结奇特提示词珍藏基础规则所谓提示词，也就是文生图中的文，由连贯的英语单词或句子组成。其最基础的规则是：不同提示词之间需要用英文逗号分隔，空格和...

AIGC 2024-03-14 人工智能

1809阅读