-
CVPR 2023 | 去雨去噪去模糊,图像low-level任务,视觉AIGC系列
Learning A Sparse Transformer Network for Effective Image Deraining 基于Transformer的方法在图像去雨任务中取得了显著的性能,因为它们可以对重要的非局部信息进行建模,这对...
-
AIGC周报|让AI来画《海贼王》;苹果限制员工使用ChatGPT;李彦宏:不担心大模型会让工作消失
AIGC(AI Generated Content)即人工智能生成内容。近期爆火的 AI 聊天机器人 ChatGPT,以及 Dall·E 2、Stable Diffusion 等文生图模型,都属于 AIGC 的典型案例,它们通过借鉴现有的、人类创造的内容来...
-
实时文生图速度提升5-10倍,清华LCM/LCM-LoRA爆火,浏览超百万
文生图、图生图已经不是什么新鲜事。但在使用这些工具的过程中,我们发现它们通常运行缓慢,导致我们要等一段时间才能拿到生成结果。 但最近,一种名叫「LCM」的模型改变了这种情况,它甚至能做到实时的连续生图。 图源:https://twitter.com/...
-
代码实现stable-diffusion模型,你也用AI生成获得一等奖的艺术图
Midjourney工具获奖图片 好吗,人工智能虽然已经涉及到人类的方方面面,但没有想到,AI 还能抢艺术家的饭碗,这不,一位小哥使用AI工具生成的艺术照片竟然获奖了,而且还是一等奖,且最近刚刚火起来的stable diffusion 更是让艺术家与AI...
-
北大全新「机械手」算法:辅助花式抓杯子,GTX 1650实现150fps推断
手是人类与世界交互的重要部分,手的缺失(如上肢残障)会大大影响人类的正常生活。 北京大学董豪团队通过将扩散模型和强化学习结合,使机械手能根据人手腕部的移动轨迹,自适应的抓取物体的不同部位,满足人类多样化的抓取需求,目前该工作已被NeurIPS 2023接...
-
探索【Stable-Diffusion WEBUI】的附加功能:图片缩放&抠图
文章目录 (零)前言 (一)附加功能(图片处理) (1.1)处理对象(Source) (1.2)缩放(Scale) (1.2.1)缩放设置 (1.2.2)缩放模型(Upscaler) (1.2.3)GFPGAN和CodeFormer (1...
-
AIGC书籍推荐:《生成式深度学习的数学原理》
生成式 AI 使用各种机器学习算法,从数据中学习要素,使机器能够创建全新的数字视频、图像、文本、音频或代码等内容。生成式 AI 技术在近两年取得了重大突破,产生了全球性的影响。它的发展离不开近年来生成式深度学习大模型的突破。与一般意义上可视为“黑盒”的深度...
-
Stable Diffusion 本地部署教程,懒人一键安装包!!!
首页 AI Stable Diffusion 本地部署教程,懒人一键安装包,有手就会安装! Stable Diffusion 是一款开源的 AI 文生图扩散模型! 目前他和Midjourney 都被称为最好用的AI绘 画工具。关注AI绘画的小伙伴在网上看...
-
Stable Diffusion - SDXL 1.0 全部样式设计与艺术家风格的配置与提示词
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/132072482 来源于 Anna Dittmann 安娜·...
-
谷歌DeepMind爆火动画18秒解释LLM原理,网友蒙圈!组团求GPT-4下场分析
Google DeepMind最近在自己的视频博客上上传了一段视频,「简单明了地」演示了大语言模型的工作原理,引发了网友的激烈讨论。 网友看了之后纷纷表示: 「终于,他们发了点普通人能看懂的东西了」。 「哦豁,这下懂了」 「对,就是这么简单!」 「太...
-
ICLR 2024论文审稿结果出炉!7000+高产论文创新纪录,扩散模型占比最高
ICLR 2024审稿结果公布了! ICLR是机器学习领域重要的学术会议之一,每年举办一次。2024年是第十二届,将在奥地利维也纳5月7日-11日召开。 根据OpenReview官方放出的结果显示,今年共有7135篇投稿论文。 此外,另有国内开发者魏国...
-
Stable Diffusion 原理介绍与源码分析(二、DDPM、DDIM、PLMS算法分析)
Stable Diffusion 原理介绍与源码分析(二、DDPM、DDIM、PLMS) 文章目录 Stable Diffusion 原理介绍与源码分析(二、DDPM、DDIM、PLMS) 系列文章 前言(与正文无关,可忽略) 总览...
-
Stable Diffusion - 扩展插件 (Extensions) 功能的配置与使用
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/131576762 Prompt: (masterpiece,...
-
stable diffusion webui中的sampler
Stable Diffusion-采样器篇 - 知乎采样器:Stable Diffusion的webUI中,提供了大量的采样器供我们选择,例如Eular a, Heum,DDIM等,不同的采样器之间究竟有什么区别,在操作时又该如何进行选择,本文将会详细讲解...
-
Stable Diffusion超详细教程!从0-1入门到进阶
一、本地部署 Stable Diffusion 前言 目前市面上比较权威,并能用于工作中的AI绘画软件其实就两款。一个叫Midjourney(简称MJ),另一个叫Stable-Diffusion(简称SD)。MJ需要付费使用,而SD开源免费,但是上...
-
Stable Diffusion使用入门教程
本文参考bilibili的链接:B站第一套系统的AI绘画课!零基础学会Stable Diffusion,这绝对是你看过的最容易上手的AI绘画教程 | SD WebUI 保姆级攻略_哔哩哔哩_bilibili 目录 一、prompt提示词 1、概...
-
Stable Diffusion之Scheduler模块比对生成结果
项目场景: 替换Stable Diffusion的Scheduler模块并对结果进行分析 diffusers包含多个用于扩散过程的预置scheduler function,用于接收经过训练的模型的输出,扩散过程正在迭代的样本,以及返回去噪样本的...
-
Mac安装Stable Diffusion教程【超详细教程】附带安装包
Mac安装Stable Diffusion教程 本机配置 Mac安装Stable Diffusion教程 配带官方说明 重要注意事项 安装所需文件已整理安装地址 自动安装 新安装: 自动安装 现有安装: 下载稳定扩散模型 故障排除 Web...
-
AIGC图像分辨率太低?快来试试像素感知扩散超分模型,你想要的细节都在这里
FaceChain写真开源项目插播: 最新 FaceChain支持多人合照写真、上百种单人写真风格,项目信息汇总:ModelScope 魔搭社区 。 github开源直达(觉得有趣的点个star哈。):GitHub - mo...
-
Altman亲手复刻「Grok」,背刺马斯克!定制GPT正式开放,最全第三方市场已出
经过ChatGPT大范围宕机后,Altman今天突然宣布,开发者大会上的所有产品更新,所有PLUS用户都上手用了。 图片 对此,有人已经花了整个下午的时间去玩了。 图片 GPTs全面上线,Altman嘲讽马斯克Grok 搞笑的是,Altman自己发了一个...
-
Stable Diffusion复现——基于 Amazon SageMaker 搭建文本生成图像模型
众所周知,Stable Diffusion扩散模型的训练和推理非常消耗显卡资源,我之前也是因为资源原因一直没有复现成功。 而最近我在网上搜索发现,亚马逊云科技最近推出了一个【云上探索实验室】刚好有复现Stable Diffusion的活动,其使用...
-
AIGC实战——生成模型简介
AIGC实战——生成模型简介 0. 前言 1. 生成模型 2. 生成模型与判别模型的区别 2.1 模型对比 2.2 条件生成模型 2.3 生成模型的发展 2.4 生成模型与人工智能 3. 生成模型示例 3.1 简单示例 3.2 生成模型框...
-
《生而为舔狗,我幸福似了捏》之stable diffusion傻瓜式教学
相信大家最近都已经被AI绘画刷屏了,但是看着大家都在搞这个东西,自己也想玩,又没有编程基础咋办,没关系,本篇博客将带大家无痛制作一个属于自己的“AI女友”,在教学开始之前,首先要告诉大家的是,这个扩散模型本身其实还是挺大的,不至于什么军工级主板都能玩的,对...
-
AI 绘画Stable Diffusion 研究(八)sd采样方法详解
大家好,我是风雨无阻。 本期内容: 什么是采样方法 ? 采样方法的分类有哪些? 怎么选择合适的采样方法? 在 Stable Diffusion中目前已经有很多采样方法 ,不同的采样方法,出图效果不同。这里将详细介绍这些采样方法,以及在使用 Stab...
-
这二维码也太美了吧!利用AI绘画[Stable Diffusion的 ControlNet]生成爆火的艺术风格二维码
文章目录 引子 爆火的艺术二维码 这种艺术二维码是如何制作出来的 ControlNet 介绍 ControlNet的限制条件 边缘检测示例 人体姿态检测示例 使用Canny边缘检测和Openpose有什么区别? 安装稳定扩散控制网C...
-
LoRa模型训练教程(炼丹,Stable Diffusion)
1. lora介绍(Low Rank Adaption) 何为LoRA?LoRA并不是扩散模型专有的技术,而是从隔壁语言模型(LLM)迁移过来的,旨在解决避免将整个模型参数拷贝下来才能对模型进行调校的问题。因为大型语言模型的参数量过于恐怖,比如最近新出...
-
【文生图系列】 Stable Diffusion v1复现教程
文章目录 Stable Diffusion v1 环境配置 权重下载 txt2img bug 超参数 Diffusers 参考 Stable Diffusion v1 stable diffusion是一个潜在的文本到图像...
-
各种文字生成图片的AIGC模型(openAI、谷歌、stable、Midjourney等)
1 前言 AIGC,全名“AI generated content”,又称生成式AI,意为人工智能生成内容。例如AI文本续写,文字转图像的AI图、视频等。 本文主要描述文字生成图片的模型。而且目前扩散模型(Diffusion Models)流行,所以下...
-
超强满血不收费的AI绘图教程来了(在线Stable Diffusion一键即用)
超强满血不收费的AI绘图教程来了(在线Stable Diffusion一键即用) 一、简介 1.1 AI绘图 1.2 Stable Diffusion 1.2.1 原理简述 1.2.2 应用流程 二、AI绘图工具 2.1 吐司Tusi...
-
万字长文解读Stable Diffusion的核心插件—ControlNet
目录 一、介绍 二、使用方法 三、ControlNet结构 1.整体结构 2.ControlLDM 3.Timestep Embedding 4.HintBlock 5.ResBlock 6.SpatialTransformer 7.S...
-
AI「脑补」画面太强了!李飞飞团队新作ZeroNVS,单个视图360度全场景生成
近来,利用3D感知扩散模型训练模型,然后对单个物体进行SDS蒸馏的研究数不胜数。 但是,能够真正做到「场景级」的画面生成,从未实现。 现如今,斯坦福李飞飞和谷歌团队打破了这个记录! 比如,输入一张从某个角度拍摄的客厅图片,整个客厅的样貌就出来了。 再来...
-
Gen-2颠覆AI生成视频!一句话秒出4K高清大片,网友:彻底改变游戏规则
这,绝对称得上是生成式AI进程中的里程碑。 就在深夜,Runway家标志性的AI视频生成工具Gen-2,迎来了“iPhone时刻”般的史诗级更新—— 依旧是简单一句话输入,不过这一次,视频效果一口气拉到了4K超逼真的高度! 话不多说,我们直接来看炸裂的效...
-
独家 | GPT-4、Midjourney之外,谭平创业团队要造一个3D基础模型
前段时间,OpenAI 发布了文生图模型 DALL・E3,生成效果非常惊艳。比如,你可以让它一次画出几十个物体,然后再要求它把这些物体全部放到一个冲浪者的背上: 可以看到,DALL・E3不仅画出了足量的物体,就连冲浪者面对重压时的神情都刻画了出来。 但细心...
-
AI圈巨震!微软论文曝光GPT-3.5参数量仅有200亿
最近,微软的一篇论文引发了广泛讨论,揭示了GPT-3.5的真实参数量可能只有20B,远远小于之前官方宣布的1750亿。这一曝料在AI圈内引起了巨大的震动,让人们开始重新评估这一庞大模型的性能和潜力。此论文还介绍了一个小型扩散模型CodeFusion,它只有...
-
GPT-4、Midjourney之外,谭平创业团队要造一个3D基础模型
前段时间,OpenAI 发布了文生图模型 DALL・E 3,生成效果非常惊艳。比如,你可以让它一次画出几十个物体,然后再要求它把这些物体全部放到一个冲浪者的背上: 可以看到,DALL・E 3 不仅画出了足量的物体,就连冲浪者面对重压时的神情都刻画了...
-
苹果文生图大模型亮相:俄罗斯套娃式扩散,支持1024x1024分辨率
在生成式 AI 时代,扩散模型已经成为图像、视频、3D、音频和文本生成等生成式 AI 应用的流行工具。然而将扩散模型拓展到高分辨率领域仍然面临巨大挑战,这是因为模型必须在每个步骤重新编码所有的高分辨率输入。解决这些挑战需要使用带有注意力块的深层架构,这使...
-
更高清写实的人体生成模型HyperHuman来了,基于隐式结构扩散,刷新多项SOTA
论文地址: https://arxiv.org/pdf/2310.08579.pdf Github 地址: https://github.com/snap-research/HyperHuman 1. 研究背景与动机 随着扩散模型的兴起,一些典型...
-
生成的分子几乎 100% 有效,用于逆向分子设计的引导扩散模型
「从头分子设计」是材料科学的「圣杯」。生成深度学习的引入极大地推进了这一方向,但分子发现仍然具有挑战性,而且往往效率低下。 以色列理工学院(Technion-Israel Institute of Technology)和意大利威尼斯大学(Univers...
-
实测腾讯AI文生图!王者荣耀画风一键直出,小程序就能玩
鹅厂大模型,又有新玩法! 发布不到两个月,腾讯混元大模型就速通了一个新版本,除了语言模型升级以外,还悄悄上线了AIGC最火热?的功能—— 文生图。 和语言模型一样,文生图同样可以通过微信小程序直接体验。 不过与Midjourney独立出图不同,混元的文生...
-
生成式人工智能如何重新定义图像搜索
译者 | 李睿 审校 | 重楼 近几个月来,生成式人工智能凭借其创造独特的文本、声音和图像的能力引起了人们的极大兴趣。但生成式人工智能的力量并不局限于创造新的数据。 生成式人工智能的底层技术(例如Transformer和扩散模型)可以为许多其他应用提供...
-
AI视野:高通发布骁龙X Elite芯片;AutoGPT获1200万美元融资;AI社交产品Airchat火了;百度Comate智能代码助手上线SaaS版本
???AI新鲜事 高通发布骁龙X Elite芯片 电脑可运行130亿参数大模型 高通发布骁龙X Elite芯片,成为全球性能最强的CPU,能在PC上运行130亿参数的大模型,实现离线AI应用。 爆火智能体项目AutoGPT获1200万美元融资 Auto...
-
苹果“套娃”式扩散模型,训练步数减少七成!
苹果的一项最新研究,大幅提高了扩散模型在高分辨率图像上性能。 利用这种方法,同样分辨率的图像,训练步数减少了超过七成。 在1024×1024的分辨率下,图片画质直接拉满,细节都清晰可见。 苹果把这项成果命名为MDM,DM就是扩散模型(Diffusion...
-
首个多视角自动驾驶场景视频生成世界模型 | DrivingDiffusion: BEV数据和仿真新思路
笔者的一些个人思考 在自动驾驶领域,随着BEV-based子任务/端到端方案的发展,高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点,“高质量”可以解耦成三个方面: 不同维度上的长尾场景:如障碍物数据中近距离的车辆以及切车过程中...
-
AIGC时代的视频扩散模型,复旦等团队发布领域首篇综述
AI 生成内容已经成为当前人工智能领域的最热门话题之一,也代表着该领域的前沿技术。近年来,随着 Stable Diffusion、DALL-E3、ControlNet 等新技术的发布,AI 图像生成和编辑领域实现了令人惊艳的视觉效果,并且在学术界和工业界...
-
免费开源AI视频工具VideoCrafter:输入文本轻松生成高质量视频
VideoCrafter是一款全新的开源视频创建和编辑套件,采用了扩散模型,能够从文本描述生成照片和视频逼真的输出。 尽管尚未正式发布,但VideoCrafter有望显著改变视频制作流程。使用VideoCrafter,即使没有视频编辑或动画经验的人也可以轻...