-
【愚公系列】《AIGC辅助软件开发》030-AI辅助解决各种疑难杂症:解决图片锯齿问题
标题 详情 作者简介 愚公搬代码 头衔 华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博...
-
AIGC浅记,什么是GAN模型,它有什么优点和缺点,以及在人脸生成领域有哪些应用
提示:以下是本篇文章正文内容,下面案例可供参考 一、GAN模型是什么? GAN模型,即生成对抗网络(Generative Adversarial Networks),是一种深度学习模型,通过生成器和判别器之间的对抗训练来学习生成数据的分布。GAN模型...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 task01笔记
赛题内容 参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格...... 基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义;基于8图故事,评估LoRA风格的美感度...
-
NVIDIA GeForce RTX标志升级了!加入AI的力量
快科技9月3日消息,NVIDIA低调升级了其GeForce RTX”的标志,增加了一行小字Powering Advanced AI”,也就是打造先进AI”的意思。 未来的RTX显卡,无论是零售包装盒,还是预装台式机、笔记本,都是打上这个标志。 GeForc...
-
LORA模型在Stable Diffusion中的注意力机制优化
LORA模型在Stable Diffusion中的注意力机制优化 引言 1.1 Stable Diffusion在生成模型领域的地位和作用 1.2 介绍LORA模型及其在微调预训练模型时的效率和灵活性 1.3 强调注意力机制在LORA模型优化...
-
stable diffusion和GAN网络的区别,优点缺点是什么
稳定扩散(stable diffusion)和生成对抗网络(GAN)是两种不同的深度学习方法。 稳定扩散是一种无监督学习方法,用于图像超分辨率重建。它基于扩散过程模型,通过在不同的时间步骤中对图像进行重建来增加分辨率。该方法能够有效地增加图像的细节,并产...
-
ControlNetPlusProMax来袭:SDXL可控性灵魂CN组件再升级,多合一组件再添新功能
大家好我是安琪!!! 在数字图像生成领域,ControlNetPlusProMax的推出无疑是一次重大突破。作为SDXL的可控性灵魂CN组件的升级版,ControlNetPlusProMax在多合一组件的基础上,增添了更多实用新功能,为你的创意绘画之旅带...
-
忘记 Stable Diffusion吧,⚡️闪电扩散Flash Diffusion来了!
忘记 Stable Diffusion吧,⚡️闪电扩散Flash Diffusion来了! Jasper的巴黎研究实验室最近发布了一项令人振奋的新研究:闪电扩散Flash Diffusion。这种新方法不仅加快了图像生成和编辑的速度,还显著提升了...
-
AI绘画Stable Diffusion:Tile HD低显存也能进行高分辨率扩图,增强细节保持构图完整
大家好,我是程序员晓晓 今天给大家分享一下如何用AI绘画Stable Diffusion 进行高分辨率扩图使用 。 在SD中的 ControlNet Tile 模型能够在SD绘图过程中,能实现高分辨率下实现高清扩图,并且避免出现图像分身现象,以及可以调整...
-
AI绘画Stable Diffusion(SD)常用插件
常用的AI绘画Stable Diffusion(SD)软件插件有很多,可以帮助用户提升创作效率和作品质量。以下是一些常见的插件和扩展: 1. **ControlNet**:通过提供额外的控制机制,使用户能够更精确地控制生成图像的特定部分。 2....
-
燃爆!奥运8分钟AI影片火了,巴赫主席:感谢中国黑科技
前沿AI科技,现在已经被用在了奥运会上。并且背后提供支持的,是中国科技力量。 就在巴黎奥运会比赛日正式开始,逐渐点燃观众激情的同时,一支“奥运8分钟”短片也受到关注。 不仅国际奥委会主席巴赫力推:“感谢中国AI科技,让这些女性在体育运动中的成就焕发新的色彩...
-
Stable Diffusion系列(六):原理剖析——从文字到图片的神奇魔法(潜空间篇)
文章目录 LDM 概述 原理 模型架构 自编码器模型 扩散模型 条件引导模型 图像生成过程 实验结果 指标定义 IS(越大越好) FID(越小越好) 训练成本与采样质量分析 不带条件的图片生成 基于文本的图片生成 基于语义框的图片生...
-
Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personalized Stylization
香港理工大学&bytedance&alibaba https://github.com/yangxy/PASD/ https://arxiv.org/pdf/2308.14469 问题引入 当前的基于SD的方法缺乏对图片结构的保持,所以本...
-
Stable Diffusion原理与代码实例讲解
Stable Diffusion原理与代码实例讲解 1. 背景介绍 1.1 问题的由来 在图像处理和生成领域,扩散模型(Diffusion Models)作为一种新型的生成模型,逐渐成为了研究热点。这类模型通过模拟真实世界的物理扩散过程,为生成高质量...
-
深入探索Stable Diffusion:从原理到应用的全面解析
目录 一 Stable Diffusion的基本概念 什么是Stable Diffusion? Stable Diffusion与传统生成模型的区别 二 Stable Diffusion的理论基础 扩散过程的数学描述 马尔可夫链蒙特卡罗方法(M...
-
AI绘画SD入门教程:后期处理图片高清放大
大家好,我是程序员晓晓 在上一篇入门教程中,我们学会了图生图的基础用法以及参数设置。这一篇我们主要讲如何利用放大算法(Super-Resolution)来显著提升图片的分辨率,同时保持甚至增强图像的细节和清晰度。这些功能可以快速帮助你提高图片分辨率和修复...
-
AIGC生成论文汇总
1.1 无特定身份人物生成(Non-identity Generation) (1 变分自动编码器(Variational Auto-Encoder) 2022, CVPR,Shunyu Yao, RuiZhe Zhong, Yichao Ya...
-
AIGC:生成式模型简介
AIGC:生成式模型简介 变分自编码器(VAE) 生成对抗网络(GAN) 自回归模型(Autoregressive Model) 流模型(Flow Model) 扩散模型(Diffusion Model) 此博客将从原理、优点和缺点几...
-
Stable Diffusion及Fooocus图片放大方法(超分辨率)体会与比较
简单地聊一下图像超分辨率的几种手段与优劣。 由SD或Fooocus等AIGC应用生成的图片一般分辨率(大小)都受到限制,基本是1024左右。 为了将小图放大到4k,或8k,出现了很多图片放大的手段(这里强调以图像超分辨率为目的,要放大,也要合理地增加细节,...
-
Stable Diffusion教程:额外功能/后期处理/高清化
"额外功能"对应的英文单词是Extras,算是直译。但是部分版本中的翻译是“后期处理”或者“高清化”,这都是意译,因为它的主要功能是放大图片、去噪、修脸等对图片的后期处理。注意这里边对图片的处理不是 Stable Diffusion 本身的能力,都是额外扩...
-
AI日报:AMD向英伟达亮剑推出最强AI芯片;斯坦福AI团队承认抄袭国产大模型;suno将推“哼歌”功能;昆仑万维开源2千亿稀疏大模型天工MoE
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、挑战英伟达!AMD亮出旗下最强...
-
每日AIGC最新进展(7):频域引导的超分扩散模型、同时生成自然的说话面孔和语音输出Text-to-Speaking Face、4D全景场景图生成、语义感知的协同语音手势合成
Diffusion Models专栏文章汇总:入门与实战 Frequency-Domain Refinement with Multiscale Diffusion for Super Resolution http://arxiv.org/abs...
-
CVPR 2024 | 图像超分、图像恢复汇总!用AIGC扩散模型diffusion来解决图像low-level任务的思路...
1、Arbitrary-Scale Image Generation and Upsampling using Latent Diffusion Model and Implicit Neural Decoder 超分辨率(SR)和图像生成是计算...
-
定制自己的 AI 角色CustomChar;AI知识点和面试题;提高llama 3 的微调速度Unsloth
✨ 1: CustomChar 允许你创建和定制自己的 AI 角色 CustomChar 是一个开源项目,它允许你创建和定制自己的 AI 角色。无论是游戏中的角色,还是个人的虚拟助手(比如电脑上的 JARVIS),甚至是在线教育体验中的虚拟...
-
微软重新定义AI PC:与GPT-4o共享屏幕,看过的一切再也不会忘
今天,微软重新定义了个人电脑。 刚刚发布新一代Copilot+PC,让上市还没几天的第一批AI PC直接过时了。 在新一代PC里,打游戏时可与AI实时对话,提供吐槽陪玩或攻略指导,由GPT-4o提供支持。 任何文件或网页浏览记录都可以用自然语言搜索,轻...
-
Adobe推出全新AI技术VideoGigaGAN:视频清晰度提升8倍
快科技4月26日消息,Adobe公司宣布了一项革命性的新技术VideoGigaGAN,这是一项基于人工智能的视频超分辨率技术,能够将视频清晰度提高8倍。 VideoGigaGAN技术的发布,标志着视频放大技术的又一重要进步,为视频编辑、增强和修复等领域带来...
-
华人持续炸场!8倍于SOTA模型发布,超分辨率细节还原度逆天,终于可以看清楚蜘蛛网丝了!网友:质量真不错!电影时长9秒才够用!
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) Sora带火了“视频一致性”的研究,但单纯在时间一致性已经不能满足业内对于高逼真视频的渴望。这不,华人又出来炸场了! 近日,一个名为VideoGigaGAN的视频模型在业界走红。...
-
Stable Diffusion 推荐硬件配置和本地化布署
Stable Diffusion简介 Stable Diffusion是由Stability AI开发的一种强大的文本到图像(Text-to-Image 生成模型,它能够根据用户提供的文本描述,生成与之相关的高质量、高分辨率图像。下面我从原理、特点、应用...
-
stable diffusion学习笔记——高清修复
ai画图中通常存在以下痛点: 受限于本地设备的性能(主要是显卡显存),无法跑出分辨率较高的图片。生图的时候分辨率一调大就爆显存。 即便显存足够。目前主流的模型大多基于SD1.0和SD1.5,这些模型在训练的时候通常使用小分辨率图片训练,在生成高分辨率图...
-
AI绘画Imagen大力出奇迹生成图像
AI绘画Imagen大力出奇迹生成图像 介绍 Imagen是一个文本到图像的扩散模型,由Google大脑团队研究所开发。 Imagen通过创新的设计,摈弃了需要预训练视觉-语言模型的繁琐步骤,直接采用了T5等大规模语言模型作为文...
-
小米SU7正式火了,雷军一夜没睡好觉!试驾者纷纷实测:自动驾驶准确,稍微有点“怂”!米粉回应:我们只是长大了,不是发财了!
撰稿 | 言征、诺亚、小伊 出品 | 51CTO技术栈(微信号:blog51cto) 21.59万起,昨晚,雷教主终于结束了“价格猜猜看”的游戏,揭开小米SU7最后谜底。 3月28日,极少并排亮相的“蔚小理”三位掌门人同台出席SU7的正式发布会,可谓半...
-
16款Stable Diffusion插件推荐,让SD小白快速上手
随着 Stable Diffusion 的不断进化,越来越多的开发者加入到插件开发的行列中。大家都知道网上虽然教程多,但非常碎片,一个个学习和查阅真的非常耗时,感觉每天都在烧脑。如果你是SD小白或者是小懒猫,又想快速上手使用 Stable Diffusio...
-
游戏NPC“活”了,英伟达AI立大功
智能NPC,已经承担起推动游戏主线的任务了! 育碧的一个DEMO中,两名个性鲜明的智能NPC带着玩家,在游戏世界中畅游了十五分钟。 不仅对话过程流畅、表情动作自然,而且还最新支持了多轮对话。 最关键的是,与NPC的对话不再只是闲聊,而是时时刻刻在推进主...
-
OMG官网体验入口 图像超分辨率AI图像处理工具下载地址
OMG是一个开源的图像超分辨率工具,利用深度学习技术来提高图像的分辨率。该工具旨在通过AI模型增强图像质量,使其在放大后仍然保持清晰和细腻。 点击前往OMG官网体验入口 谁可以从OMG中受益? OMG适用于摄影师、设计师、图像处理爱好者等需要提升图像分辨...
-
Stable Diffusion——常用插件安装与测试(一)
前言 随着Stable Diffusion不断演进,越来越多的开发者开始涉足插件开发。尽管网络上存在大量教程,但它们通常零散分布,逐个学习和查找非常耗时,使人感觉每天都在劳累思考。这里总结了Stable Diffusion常用的插件安装与测试方法。 感...
-
Stable Diffusion简介
Stable Diffusion是2022年发布的深度学习文本到图像生成模型,它主要用于根据文本的描述产生详细图像,尽管它也可以应用于其他任务,如内补绘制、外补绘制,以及在提示词(英语)指导下产生图生图的翻译。 根据维基百科的描述可以得知,Sta...
-
AMD显卡继续学习NVIDIA:终于补上AI缩放
快科技3月5日消息,众所周知,AMD显卡经常跟在NVIDIA后边学习先进技术,现在看起来,FSR超分辨率缩放技术经过三代的进化之后,终于要借鉴NVIDIA的方式,也引入AI。 DLSS、FSR、XeSS是当今三大显卡厂商各自提出的超分方案,但实现方式各有不...
-
【AIGC】基于深度学习的图像生成与增强技术
摘要: 本论文探讨基于深度学习的图像生成与增强技术在图像处理和计算机视觉领域的应用。我们综合分析了主流的深度学习模型,特别是生成对抗网络(GAN)和变分自编码器(VAE)等,并就它们在实际应用中的效果和局限性展开讨论。通过比较实验和案例研究,我们评估了不...
-
政安晨:演绎在KerasCV中使用Stable Diffusion进行高性能图像生成
小伙伴们好,咱们今天演绎一个使用KerasCV的StableDiffusion模型生成新的图像的示例。 考虑计算机性能的因素,这次咱们在Colab上进行,Colab您可以理解为在线版的Jupyter Notebook,还不熟悉Jupyter的的小伙伴可以...
-
引领AI创意教育新浪潮,瑞云AIGC实训平台解决方案来了
过去的2023年,AI(人工智能)成为了年度科技圈关键词,各行各业都在AI化,据统计,AIGC市场规模预计到2030年将达到万亿级别,这不仅是市场的趋势,更是创新的机遇。 教育行业更是如此,许多高校和职校引入了AIGC的课程,一些艺术和设计学院开始将AI...
-
【AI绘画】Stable Diffusion扩散模型 + Consistency一致性模型 小白必看!!!!!
手把手教你入门绘图超强的AI绘画,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包 (文末可获取) 1 GAN到Stable Diffusion的改朝换代 2 从DDPM到Stable Diffusion发展史...
-
【读点论文】A Survey on Generative Diffusion Model,AIGC时代的新宠儿,从原理推导到工程应用,在视觉,自然语言,语音等领域大展拳脚
A Survey on Generative Diffusion Model Abstract 由于深度潜在表示,深度学习在生成任务中显示出良好的潜力。生成模型是一类可以根据某些隐含参数随机生成观测值的模型。近年来,扩散模型以其强大的生成能力成...
-
首个环视世界模型DrivingDiffusion: BEV数据和仿真新思路!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 笔者的一些个人思考 在自动驾驶领域,随着BEV-based子任务/端到端方案的发展,高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点,“高质量”可以解耦成三个方面: 不同维度...
-
谷歌发布AI视频生成器Lumiere,在生成可爱动物视频方面表现出色
1月26日消息,据外媒报道,谷歌公布了一款名为Lumiere的人工智能视频生成器,并在相关的预印本论文中称其为“逼真视频生成的时空扩散模型”。Lumiere在制作可爱动物在荒谬场景中的视频方面做得很好,比如穿旱冰鞋、开车或弹钢琴。 根据谷歌的说法,Lu...
-
AI绘画指南 stable diffusion webui (SD webui)如何设置与使用
根据自己最近的理解与实践,只能说是给后来的AI绘画作画者一点快速上手入门的参考吧。 主要是涉及 SD webui 界面介绍 参数含义及调整,txt2img 怎么设置特征点,img2img 怎么完善原始图像等内容。 stable diffusion w...
-
【思路合集】talking head generation+stable diffusion
1 以DiffusionVideoEditing为baseline: 改进方向 针对于自回归训练方式可能导致的漂移问题: 训练时,在前一帧上引入小量的面部扭曲,模拟在生成过程中自然发生的扭曲。促使模型查看身份帧以进行修正。 在像VoxCeleb或L...
-
【AIGC-文本/图片生成视频系列-9】MagicVideo-V2: 多阶段高美感视频生成
目录 一. 项目概述与贡献 二. 方法详解编辑 三. 文本生成视频相关结果 四. 与其他方法对比结果 五. 个人感悟 最近得益于扩散模型的快速发展,文本到视频(T2V)模型的激增。 今天要介绍的是字节的MagicVideo-V2,一个新颖...
-
探索【Stable-Diffusion WEBUI】的图片超分辨插件:StableSR
文章目录 (零)前言 (一)图片放大 (二)图片超分辨率放大脚本插件(StableSR) (2.1)下载组件 (2.2)使用 (2.3)实例对比(放大) (2.4)实例对比(修复) (三)总结 (零)前言 本篇主要介绍W...
-
一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码
谷歌一出手,又把AI视频生成卷上了新高度。 一句话生成视频,现在在名为Lumiere的AI操刀下,可以是酱婶的: △“阳光明媚,帆船在湖中航行” 如此一致性和质量,再次点燃了网友们对AI视频生成的热情:谷歌加入战局,又有好戏可看了。 不止是文生视频,...
-
拳打Gen-2脚踢Pika,谷歌爆肝7个月祭出AI视频大模型,首提时空架构,时长史诗级延长
爆肝7个月,谷歌祭出了AI视频大模型Lumiere,直接改变了游戏规则!全新架构让视频时长和一致性全面飞升,时长直接碾压Gen-2和Pika。 AI视频赛道上,谷歌又再次放出王炸级更新! 这个名为Google Lumiere的模型,是个大规模视频扩散模...