-
stable diffusion学习笔记——高清修复
ai画图中通常存在以下痛点: 受限于本地设备的性能(主要是显卡显存),无法跑出分辨率较高的图片。生图的时候分辨率一调大就爆显存。 即便显存足够。目前主流的模型大多基于SD1.0和SD1.5,这些模型在训练的时候通常使用小分辨率图片训练,在生成高分辨率图...
-
恐怖谷!哥大华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真
此前,人形机器人Ameca「大梦初醒」的神情,已让许多人感受到了真正的「恐惧」。 随着ChatGPT横空出世,得到加持的人形机器人虽擅长语言交流,但是在非语言交流,特别是面部表情,还差得很远。 未来,如果人类真的要生活在一个充满机器人的世界之中,机器...
-
Stable Diffusion WebUI 生成参数:高清修复/高分辨率修复(Hires.fix)
本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里。 大家好,我是水滴~~ 在本篇文章中,我们将深入探讨 Stable Diffusion WebUI 的一个引人注目的生成参数——高分辨率修复(Hires.fix)。我们将逐一解析这一功能的...
-
微软亚研院新作:让大模型一口气调用数百万个API!
近年来,人工智能发展迅速,尤其是像ChatGPT这样的基础大模型,在对话、上下文理解和代码生成等方面表现出色,能够为多种任务提供解决方案。 但在特定领域任务上,由于专业数据的缺乏和可能的计算错误,它们的表现并不理想。同时,虽然已有一些专门针对特定任务的AI...
-
两分钟1200帧的长视频生成器StreamingT2V来了,代码将开源
广阔的战场,风暴兵在奔跑…… prompt:Wide shot of battlefield, stormtroopers running... 这段长达 1200 帧的 2 分钟视频来自一个文生视频(text-to-video)模型,尽管 AI 生成...
-
DifFlow3D:场景流估计新SOTA,扩散模型又下一城!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:DifFlow3D: Toward Robust Uncertainty-Aware Scene Flow Estimation with Iterative Diffusion-Based...
-
CNN、Transformer、Uniformer之外,我们终于有了更高效的视频理解技术
视频理解的核心目标在于对时空表示的把握,这存在两个巨大挑战:短视频片段存在大量时空冗余和复杂的时空依赖关系。尽管曾经占主导地位的三维卷积神经网络 (CNN 和视频 Transformer 通过利用局部卷积或长距离注意力有效地应对其中之一的挑战,但它们在...
-
stable diffusion webui升级bug问题解决思路(纯干货)
个人网站:https://tianfeng.space/ 文章目录 一、前言 二、个人方案 1.扼杀在萌芽中 A.解压后点击启动器运行依赖,然后点击A启动器 B.更新本体和扩展(全部到最新版本) C.把controlnet1.1放入sta...
-
秋神SD整合包 AI绘画 Stable Diffusion 整合包 V4版 解压即用 AI绘图模型LoRA + 最新
「 无套路!文末提供下载方式 」 2024年绘画圈最火的软件 那妥妥的就Stable Diffution V4升级版无需安装,直接解压就能用 (在此要感谢秋葉aaaki大佬的分享!)** 比之前版本的更加智能、高效和易操作 V4加强版小白也能轻...
-
Stable Diffusion AI绘画商业应用教程
BIGD Stable Diffusion商业化,AI绘画入门到精通,主要分为创意内容运营设计、品牌策划与视觉传达、三维视觉视效、电商活动节日宣传等。 Stable Diffusion 是⼀种基于扩散过程的图像生成模型,可以生成高质量、高分辨...
-
深圳3公里精准预报!华为发布首个区域天气预报AI模型“智霁”1.0
快科技3月23日消息,在今天世界气象日的气候行动最前线”主题活动上,华为云与深圳市气象局共同发布了首个人工智能区域预报模型智霁”1.0,标志着气象预报迎来了新的里程碑。 这一区域模型以华为云盘古气象大模型为基础,融合了区域高质量气象数据集,能够迅速地为未来...
-
Sora不开源,微软给你开源!全球最接近Sora视频模型诞生,12秒生成效果逼真炸裂
微软版Sora诞生了! Sora虽爆火但闭源,给学术界带来了不小的挑战。学者们只能尝试使用逆向工程来对Sora复现或扩展。 尽管提出了Diffusion Transformer和空间patch策略,但想要达到Sora的性能还是很难,何况还缺乏算力和数据集...
-
Stable Diffusion 3 震撼发布,采用Sora同源技术,文字终于不乱码了
Stable Diffusion 3 和 Sora 一样采用了 diffusion transformer 架构。 继 OpenAI 的 Sora 连续一周霸屏后,昨晚,生成式 AI 顶级技术公司 Stability AI 也放了一个大招 ——Sta...
-
不只是高清放大!Magnific AI照片风格化功能上线
Magnific AI的照片风格化功能已经正式上线。这项全新的功能可以将你的任何照片转换成你所期望的任何风格。无论你想变换任何图像,都可以控制传输的样式数量和结构完整性,这为3D、视频游戏、室内设计、娱乐等领域提供了无限的用例。 产品入口:https:/...
-
Stable Diffusion:详细版安装教程!
Stable Diffusion是一种基于扩散过程的图像生成模型,能够创造出高质量、高分辨率的图像。它通过模拟扩散过程逐渐将噪声图像转化为目标图像,具有稳定性和可控性。 这一技术不仅能够生成多样化、精美的图像,还能修复损坏的图像,提高图像的清晰度,甚至应...
-
ComfyUI-SUPIR官网体验入口 图像放大AI处理工具下载地址
ComfyUI-SUPIR是一个为ComfyUI设计的SUPIR图像放大封装器,它使用先进的AI技术来提升图像质量。该工具目前还在开发中,支持从原始链接下载SUPIR模型,并需要SDXL模型。它适用于非商业用途,并且对系统内存有较高要求。 点击前往Com...
-
stable diffusion采样详解
采样:模型会在Latent Space中生成一个完全随机的图像,然后噪声预测器会从图像中减去预测的噪声。随着这个步骤的不断重复,最终得到一个清晰的图像。 Stable Diffusion在每个步骤中都会生成一张新的采样后的图像,整个去噪...
-
Stable Diffusion XL on diffusers
Stable Diffusion XL on diffusers 翻译自:https://huggingface.co/docs/diffusers/using-diffusers/sdxl v0.24.0 非逐字翻译 Stable Dif...
-
高清视频采集卡:技术革新与多媒体应用的交汇点
随着科技的飞速发展,高清视频已经成为我们日常生活中不可或缺的一部分。无论是在家庭娱乐、教育领域,还是在专业的广播电视、安防监控等领域,高清视频都扮演着至关重要的角色。而在这场视觉盛宴的背后,高清视频采集卡作为关键技术支撑,正发挥着越来越重要的作用。本文将深...
-
零一万物大模型开放平台体验入口 01-ai API接口使用地址
零一万物大模型开放平台是一个通过API调用获取高品质Yi系列大模型的平台。Yi系列模型基于零一万物的前沿科研成果和高品质数据训练而成,曾在多个权威榜单中获得SOTA表现。 主要产品包括yi-34b-chat-0205、yi-34b-chat-200k和y...
-
Stable Diffusion 3 震撼发布,采用Sora同源技术,生成图像、视频真假难辨!
ChatGPT狂飙160天,世界已经不是之前的样子。 新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 ============== Stable Diffusion 3...
-
【Stable Diffusion初学者指南】如何为Stable Diffusion提出良好的提示
文章目录 初学者资源 剖析一个好的提示 主题 风格 艺术家 网站 分辨率 额外细节 灯光 颜色 良好提示的提示 一些适合您的关键词 风格 艺术家 网站 分辨率 灯光 额外细节 颜色 概括 快速构建是任何Stable Diffus...
-
Hotshot - ACT 1官网体验入口 文生视频AI系统使用方法教程指南
Hotshot - ACT 1是一个由Hotshot Research开发的直接文本到视频合成系统,它能够生成高清晰度的视频,具有多种宽高比且无水印,提供引人入胜的用户体验。该系统通过使用大规模高分辨率文本视频语料库进行训练,以实现高保真度的空间对齐、时间...
-
CRM官网体验入口 AI图像处理3D建模神器免费在线使用地址
CRM是一个高保真的单图像到3D纹理网格的生成模型,它通过整合几何先验到网络设计中,能够从单个输入图像生成六个正交视图图像,然后利用卷积U-Net创建高分辨率的三平面(triplane)。CRM进一步使用Flexicubes作为几何表示,便于在纹理网格上进...
-
关于AI和ChatGPT的使用,AI编程(AIGC),AI绘画(2)
AI绘画技术是指利用人工智能技术来创作、生成或修改图像、照片、插图、漫画等艺术品以及各种视觉效果。常见的AI绘画技术包括机器学习、深度学习和计算机视觉等领域的技术,通过训练神经网络模型来实现自动化地生成图像,其应用范围相当广泛,包括数字媒体...
-
无线通信的AI和6G技术
随着技术的变化,人工智能(AI 和6G技术的结合——无线通信的下一件大事,可能会改变我们连接、交谈和生活的方式。根据一些专家的说法,未来6G网络的潜力可能使互联网设备的最高速度达到每秒1太比特(Tbps 。这一速度将比目前最快的1 Gbps速度快100...
-
AI绘画普及课【二】文生图入门
文章目录 二、文生图入门与提示词基础 1、提示词基本概念 2、提示词分类和书写方式 (1 人物及主题特征 (2 场景特征 (3 环境光照 (4 补充:画幅视角 (5 画质提示词 (6 画风提示词 (7 提示词模板 3、权重与...
-
UnlimitedBG官网体验入口 AI图像处理去背景抠图工具使用方法教程指南
UnlimitedBG是一款 AI 驱动的工具,可在几秒钟内自动删除图像背景,实现专业品质的效果。无限照片,一次固定费用!无需互联网连接!适用于商业和个人用途。 点击前往UnlimitedBG官网体验入口 谁可以从UnlimitedBG中受益? Unli...
-
视频采集卡软件:数字化影像捕获的核心利器
在数字化时代,视频采集卡软件已经成为许多专业领域,如广播电视、多媒体教学、视频会议、安防监控等不可或缺的技术工具。视频采集卡软件作为连接模拟信号与数字世界的桥梁,其实时性、稳定性和兼容性等特点直接影响着数字影像的质量和传输效率。本文将详细探讨视频采集卡软件...
-
图片采集工具的发展与应用前景
在数字化时代,图片作为一种直观、生动的信息载体,在各个领域都发挥着重要作用。无论是新闻报道、广告设计、社交媒体,还是科学研究、教育培训,都离不开图片的支持。而图片采集工具,作为获取和管理图片资源的关键技术,其发展与应用也日益受到人们的关注。一、图片采集工具...
-
星光影视系统采集插件:数字时代的影视制作利器
在数字技术和网络技术迅猛发展的今天,影视制作行业正经历着前所未有的变革。传统的影视制作流程繁琐、效率低下,已经难以满足现代观众对于多元化、高质量内容的需求。而“星光影视系统采集插件”的出现,正是为了应对这一挑战,为影视制作人员提供了一款高效、便捷、强大的工...
-
Stable Diffusion 插件AnimateDiff
AnimateDiff简介 该插件主要用来制作动图,并不能用来生成比较长的视频,我体验着和pika差不多,效果上照着商用还有不小的距离。在githup的网址中有论文地址和许多示例。 githup:GitHub - guoyww/AnimateDiff:...
-
【AI绘画】Stablediffusion图片高清放大的最好方法(1)
在接触AI绘画不久后,不知道很多小伙伴们在浏览别的朋友跑出来的图,有没有这样的感想,为什么别人跑出来的图是这样的??? 或者这样的: 而我们辛辛苦苦跑出来的图是这样的: 那么到底是哪里出了问题呢? 本期内容,我将会以三点来讲解如何出一副...
-
AI图像合成技术的新浪潮:Stable Diffusion 3与Sora构架的突破
在人工智能的黄金时代,图像合成技术正以前所未有的速度发展。从简单的图像编辑到复杂的场景生成,AI的能力已经超越了传统软件的限制,开启了创意和视觉表达的新纪元。近期,Stable Diffusion 3技术报告的流出引起了业界的广泛关注,其背后的Sora构...
-
【AIGC】AI作图最全提示词prompt集合(收藏级)
目录 一、正向和负向提示词 二、作图参数 你好,我是giszz. AI做图真是太爽了,解放生产力,发展生产力。 但是,你是不是也总疑惑,为什么别人的图,表现力那么丰富呢,而且指哪打哪,要什么有什么,而你只能等着AI“智能推荐”?从多次重复中...
-
基于视频采集模块的现代监控技术探析
在当今数字化时代,视频监控系统以其高效性、便捷性及安全性的特点,已经成为城市安全管理和社会治安管理不可或缺的一环。而作为监控系统的“眼睛”和“耳朵”,视频采集模块发挥着举足轻重的作用。本文将围绕视频采集模块的功能原理、技术特性以及在现代社会的多元化应用等层...
-
探讨外置视频采集卡的原理、应用与未来发展趋势
在数字化和信息化高度发展的时代,视频处理技术显得尤为重要。特别是在视频录制、编辑、传输等方面,随着技术的不断创新和完善,外置视频采集卡应运而生,它作为视频处理的一个重要环节,扮演着不可或缺的角色。本文将对外置视频采集卡的原理、应用领域及未来发展趋势进行深入...
-
ResAdapter官网体验入口 Stable Diffusion AI图片生成风格一致性工具免费使用地址
ResAdapter是一个为扩散模型(如Stable Diffusion)设计的分辨率适配器,它能够在保持风格域一致性的同时,生成任意分辨率和宽高比的图像。与处理静态分辨率图像的多分辨率生成方法不同,ResAdapter直接生成动态分辨率的图像,提高了推理...
-
【AI绘画】Stable Diffusion使用入门教程!!!!
手把手教你入门绘图超强的AI绘画,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包 (文末可获取) 首先提几个好玩的名词: 炼丹:训练AI学习图片生成模型 咒语:prompt提示词 一、prompt提示词 1...
-
北大发起复现Sora,框架已搭!袁粒田永鸿领衔,AnimateDiff大神响应
重磅: 北大团队联合兔展发起了一项Sora复现计划——Open Sora。 框架、实现细节已出: 初始团队一共13人: 带队的是北大信息工程学院助理教授、博导袁粒和北大计算机学院教授、博导田永鸿等人。 为什么发起这项计划? 因为资源有限,团队希望集结...
-
ComfyUI-SUPIR官网体验入口 图像放大AI处理软件下载地址
ComfyUI-SUPIR是一个为ComfyUI设计的SUPIR图像放大封装器,它使用先进的AI技术来提升图像质量。该工具目前还在开发中,支持从原始链接下载SUPIR模型,并需要SDXL模型。它适用于非商业用途,并且对系统内存有较高要求。 点击前往Com...
-
首批类Sora模型出现,色拉布上线Snap Video,效果优于Pika、不输Gen-2
最近,OpenAI 视频生成模型 Sora 的爆火,给基于 Transformer 的扩散模型重新带来了一波热度,比如 Sora 研发负责人之一 William Peebles 与纽约大学助理教授谢赛宁去年提出的 DiT(Diffusion Transf...
-
Midjourney 超详细使用教程(一)
参考文章:Midjourney 使用基础教程https://kaiho.cc/how-to-use-midjourney/ Midjourney是一个基于人工智能的图像生成工具,它允许用户通过简单的文本提示创建高度详细和创意的图像。这个工具使用了先进的深...
-
【AIGC】Stable Diffusion 的提示词入门
一、正向提示词和反向提示词 Stable Diffusion 中的提示词通常用于指导用户对生成的图像进行控制。这些提示词可以分为正向提示词(Positive Prompts)和反向提示词(Negative Prompts)两类,它们分别影响图像生成过程...
-
Stability AI推图像高清放大工具Creative Upscaler
Stability AI 推出了图像提升增强工具:Creative Upscaler,能够将图像升级到4K分辨率,并创造出以前未有的新细节,为图像注入新的生命。 产品入口:https://top.aibase.com/tool/creative-upsc...
-
【AIGC】Stable Diffusion的生成参数入门
Stable Diffusion 的生成参数是用来控制图像生成过程的重要设置,下面是一些常见的生成参数及其详解 1、采样器,关于采样器的选择参照作者的上一篇文章 2、采样步数(Sampling Steps)是指在生成图像时模型执行的总步数,每一步都包含了...
-
一步步带你解锁Stable Diffusion:Stable Diffusion文生图保姆级入门介绍
首先呢,小伙伴们打开 Stable Diffusion 「后续还是简称SD」的界面大概是这样子的,因为我们加了一下插件的原因呢,我的界面可能和小伙伴的初始界面有点区别,这个不重要啊!多的那些个功能呢,今天也不讲啊!小伙伴们也不要着急,后续会给大家一一介绍的...
-
stable-diffusion 学习笔记
必看文档: 万字长篇!超全Stable Diffusion AI绘画参数及原理详解 - 知乎 (提示词)语法控制 常用语法: 加权:( 或 {} 降权:[] (word //将括号内的提示词权重提高 1.1 倍 ((word ...
-
Stable Diffusion 3震撼发布,采用Sora同源技术,文字终于不乱码了
继 OpenAI 的 Sora 连续一周霸屏后,昨晚,生成式 AI 顶级技术公司 Stability AI 也放了一个大招 ——Stable Diffusion 3。该公司表示,这是他们最强大的文生图模型。 与之前的版本相比,Stable Diffus...
-
利用stable diffusion制作2D转3D
第一步,将图片拖入Tagger界面。用反推命令推出图片的大致提示词,然后卸载模型(避免占用过多显存),最后复制提示词粘贴到文生图界面。 第二步,来到文生图界面。选择Rev Animated模型,首先粘贴上2D转3D起手式,然后粘贴Tagger反推...