-
如何从头开始编写LoRA代码,这有一份教程
LoRA(Low-Rank Adaptation)作为一种用于微调 LLM(大语言模型)的流行技术,最初由来自微软的研究人员在论文《 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 》中提出。不同于其...
-
Stable Diffusion V3测评
1.引言 3月5号,Stability AI发布了介绍Stable Diffusion V3的研究论文,链接地址:戳我 这是目前他们发布的最先进、功能最强大的图像生成器,与一年多前发布的令人印象深刻的 Stable Diffusion V2.1...
-
Stability AI开源上新:3D生成引入视频扩散模型,质量一致性up,4090可玩
Stable Diffusion背后公司Stability AI又上新了。 这次带来的是图生3D方面的新进展: 基于Stable Video Diffusion的Stable Video 3D(SV3D),只用一张图片就能生成高质量3D网格。 Stab...
-
Diffusion Transformer Family:关于Sora和Stable Diffusion 3你需要知道的一切
转自知乎:叫我Alonzo就好了 前言 背景——Sora和Stable Diffusion 3 近期,OpenAI和Stability两大AI巨头公司在同期分别发布了它们的新作品——Sora和Stable Diffusion 3。神奇的是,这...
-
AIGC元年大模型发展现状手册
零、AIGC大模型概览 AIGC大模型在人工智能领域取得了重大突破,涵盖了LLM大模型、多模态大模型、图像生成大模型以及视频生成大模型等四种类型。这些模型不仅拓宽了人工智能的应用范围,也提升了其处理复杂任务的能力。a. LLM大模型通过深度学习和自然语...
-
可控图像生成最新综述!北邮开源20页249篇文献,包揽Text-to-Image Diffusion领域各种「条件」
在视觉生成领域迅速发展的过程中,扩散模型已经彻底改变了这一领域的格局,通过其令人印象深刻的文本引导生成功能标志着能力方面的重大转变。 然而,仅依赖文本来调节这些模型并不能完全满足不同应用和场景的多样化和复杂需求。 鉴于这种不足,许多研究旨在控制预训练文本...
-
从直观物理学谈到认知科学,Sora不是传统物理模拟器盖棺定论了?
本文篇幅很长,主题很多,但循序渐进,对「Sora 究竟是不是世界模拟器」这一说法给出了非常详实的解读。 最近,OpenAI 的文生视频模型 Sora 爆火。除了能够输出高质量的视频之外,OpenAI 更是将 Sora 定义为一个「世界模拟器」(world...
-
Stable Diffusion 3报告
报告链接:https://stability.ai/news/stable-diffusion-3-research-paper 文章目录 要点 表现 架构细节 通过重新加权改善整流流量 Scaling Rectified Flow Tr...
-
最新版本,Midjourney保姆级教程!
一、认识Midjourney 1.1、MidJourney是什么? 随着ChatGPT的横空出世,人类正式迈入AI元年,其中MidJourney便是AI绘图工具,它能根据用户输入的文字描述(提示词)生成绘画作品,不管是灵动的人物,可爱的动物,亦或是美丽...
-
大模型能自己优化Prompt了,曾经那么火的提示工程要死了吗?
2022 年底,ChatGPT 上线,同时引爆了一个新的名词:提示工程(Prompt Engineering)。 简而言之,提示工程就是寻找一种编辑查询(query)的方式,使得大型语言模型(LLM)或 AI 绘画或视频生成器能得到最佳结果或者让用户能绕...
-
淘宝人生2的AIGC技术应用——虚拟人写真算法技术方案
近几个月,随着基于Stable Diffusion的相关技术发展,基于参考图的角色定制化技术[1,2, 3, 4, 7]受到相关行业以及学者的广泛关注。其中,人像定制化是指:给定任务角色(参考图),通过提示词控制生成多样新的图像,并且图像...
-
stable diffusion采样详解
采样:模型会在Latent Space中生成一个完全随机的图像,然后噪声预测器会从图像中减去预测的噪声。随着这个步骤的不断重复,最终得到一个清晰的图像。 Stable Diffusion在每个步骤中都会生成一张新的采样后的图像,整个去噪...
-
【一看就会】五分钟完成MidJourney订阅
1. Midjourney介绍 Midjourney 是一款备受欢迎的人工智能生成图像工具,它可以通过输入文字描述,自动生成精美的图像。与许多其他图像生成工具不同,Midjourney 不需要安装任何软件,也不受个人电脑性能的限制,因为它运行在云端服务器...
-
与Sora同架构的Stable Diffusion 3.0 震撼发布
Stability AI 发布了 Stable Diffusion 3,这款图像生成 AI 模型再次刷新了人们的认知。 这款由 Stability AI 倾力打造的文本变图模型,可是迄今为止最强大的“黑科技”!无论你想生成多主题的奇幻场景,还是高精度的风...
-
Stable Diffusion XL on diffusers
Stable Diffusion XL on diffusers 翻译自:https://huggingface.co/docs/diffusers/using-diffusers/sdxl v0.24.0 非逐字翻译 Stable Dif...
-
Glyph-ByT5:确保AI绘画图片中文字渲染的准确性并自动排版
在当今的数字时代,图像生成任务的重要性日益凸显。然而,一个长期存在的问题是文本渲染的准确性。幸运的是,一个新的文本编码器——Glyph-ByT5,已经将这个问题解决了。 Glyph-ByT5是一个强大的工具,它可以显著提高图像生成中文本渲染的准确性。在实际...
-
AI实时绘画系统StreamMultiDiffusion 支持局部涂抹+提示生成图片
近期,一篇名为"StreamMultiDiffusion"的论文提出了一种新颖的实时、交互式的文本到图像生成系统。这种系统能够根据用户提供的手绘区域和相应的语义文本提示来生成图像,为专业图像创作者提供了一个强大的工具,可以用于快速原型设计和创意探索。 项...
-
生数科技「多模态大模型」正式通过备案
近日,生数科技「多模态大模型」正式通过国家《生成式人工智能服务管理暂行办法》备案。 成立于2023年3月,生数科技是一家全球领先的自主研发多模态通用大模型的人工智能企业 ,布局MaaS(模型即服务)与应用级产品,面向艺术设计、游戏制作、影视动画、社交娱乐等...
-
30天涨粉100万,AI猫猫“卖惨”成新晋流量密码
AI猫猫剧情号,火了。 当魔性洗脑的“喵喵”音乐响起,一张张以猫猫为故事主角的画面,会像设定了自动播放的PPT一样呈现在你的眼前。这样的一条视频,目前在YouTube Shorts(以下简称油管)上获得了超5000万次观看和300多万点赞。 发布视频的油管...
-
Glyph-ByT5官网体验入口 AI文本编码器与图像生成工具在线使用地址
Glyph-ByT5是一种定制的文本编码器,旨在提高文本到图像生成模型中的视觉文本渲染准确性。它通过微调字符感知的ByT5 编码器并使用精心策划的成对字形文本数据集来实现。将Glyph-ByT5 与SDXL集成后,形成了Glyph-SDXL模型,使设计图像...
-
Stable Diffusion 3 技术论文解读:开源能赢得文生图竞赛吗?
在大语言模型领域,闭源模型正在赢得比赛,无论是 OpenAI 还是刚刚发布新模型的 Anthropic,都是闭源模型的代表。 但在文生图领域,开源模型却表现出了足够强的竞争力。 2 周前,开源模型的代表企业 Stability AI 发布了最新...
-
直接干到未来!DriveDreamer-2:世界首个自定义驾驶场景流生成,提升50%!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 世界车型在自动驾驶方面表现出了优势,尤其是在多视图驾驶视频的生成方面。然而,在生成自定义驾驶视频方面仍然存在重大挑战。在本文中,我们提出了DriveDreamer-2...
-
Stable Diffusion——文生图界面参数讲解与提示词使用技巧
Clip终止层数 什么是Clip CLIP(Contrastive Language-Image Pretraining)是由OpenAI于2021年开发的一种语言图像对比预训练模型。其独特之处在于,CLIP模型中的图像和文本嵌入共享相同的潜在...
-
一文搞懂Stable Diffusion中的提示词
欢迎来到Stable Diffusion的世界,这里是AI和创意的交汇点。在这里,我们将一起探索如何通过精心设计的提示词,指引这一强大的AI工具创造出令人叹为观止的图像。无论你是技术爱好者,还是对AI艺术充满好奇的初学者,这里都有你需要的秘籍。从基础语法到...
-
【深度学习】风格迁移,转换,Stable Diffusion,FreeStyle : Free Lunch for Text-guided Style Transfer using Diffusion
论文:https://arxiv.org/abs/2401.15636 代码:https://github.com/FreeStyleFreeLunch/FreeStyle 介绍 生成扩散模型的快速发展极大地推进了风格迁移领域的发展。然而,大多数当...
-
VLOGGER官网体验入口 AI视频生成工具在线使用地址
VLOGGER是一种从单张人物输入图像生成文本和音频驱动的讲话人类视频的方法,它建立在最近生成扩散模型的成功基础上。我们的方法包括1 一个随机的人类到3D运动扩散模型,以及2 一个新颖的基于扩散的架构,通过时间和空间控制增强文本到图像模型。这种方法能够生成...
-
Stable Diffusion:深度学习中的创新图像生成模型
Stable Diffusion,作为一种前沿的深度学习图像生成技术,正逐步改变我们对图像生成和处理的认知。其基于扩散模型的原理,通过模拟图像数据的分布,实现了从噪声中生成高质量图像的能力。这种技术的出现,不仅为我们提供了全新的艺术创作工具,也在科学可视化...
-
ai作画在线生成!这8个AI生图工具一定要知道。
过去的2023年被称作AI元年,随之而来的2024,被业内人士称之为AI应用元年,即随着大模型和各类AI应用的涌现速度放缓,人们关注的焦点也从产品层面(有哪些好用的AI应用),转移到AI如何更好地赋能实际业务的应用场景。 就大多数人的日常工作而言,最常见...
-
颜水成/程明明新作!Sora核心组件DiT训练提速10倍,Masked Diffusion Transformer V2开源
DiT作为效果惊艳的Sora的核心技术之一,利用Difffusion Transfomer 将生成模型扩展到更大的模型规模,从而实现高质量的图像生成。 然而,更大的模型规模导致训练成本飙升。 为此,来自Sea AI Lab、南开大学、昆仑万维2050...
-
谷歌限制AI助手Gemini回答与选举相关问题
近日谷歌宣布,其新的AI对话助手Gemini在今年举行重要选举的国家,将被限制回答与选举相关的查询。该公司解释说,这是"出于对如此重要话题的高度谨慎"。 当被问及有关总统候选人、政党等选举因素的问题时,Gemini现在将推荐用户转而使用谷歌搜索。即便是一些...
-
【一看就会】 2024新 AI绘画介绍及 Midjourney 注册使用超详细教程
【一看就会】 2024最新 AI绘画介绍及 Midjourney 注册使用教程 本文将详细介绍 Midjourney 注册使用教程,如果有帮助的话请点赞转发给需要的的朋友~ (部分图片素材来自AI破局俱乐部,想要加入一起拥抱AI,可联系我) 小...
-
谷歌AI接连翻车!创始人谢尔盖·布林回归狠批:测试不彻底
快科技3月12日消息,谷歌在AI大模型产品上接连失利,已退隐江湖4年、谷歌联合创始人之一谢尔盖布林(Sergey Brin)不得不亲赴前线。 在近日的一场以谷歌旗下大模型Gemini 1.5为主题的黑客松活动上,Brin对一系列产品进行了回应。 在近40分...
-
疑似AI合成!凯特王妃行踪成谜,英王室秘辛再起疑云
整理丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 最近几个月,因为凯特王妃的行踪成谜,英国王室频陷争议。关于王妃去哪儿了的八卦、阴谋论层出不穷。 就在当地时间3月10日,肯辛顿宫发布了一张据称是王储威廉拍摄的——凯特和三个孩子的合...
-
CRM官网体验入口 AI图像处理3D建模神器免费在线使用地址
CRM是一个高保真的单图像到3D纹理网格的生成模型,它通过整合几何先验到网络设计中,能够从单个输入图像生成六个正交视图图像,然后利用卷积U-Net创建高分辨率的三平面(triplane)。CRM进一步使用Flexicubes作为几何表示,便于在纹理网格上进...
-
Stable Diffusion 3 架构细节大揭秘
在众多前沿成果都不再透露技术细节之际,Stable Diffusion 3 论文的发布显得相当珍贵。 Stable Diffusion 3 的论文终于来了! 这个模型于两周前发布,采用了与 Sora 相同的 DiT(Diffusion Transf...
-
如何本地部署Stable Diffusion:详细步骤与指南
Stable Diffusion作为一种前沿的深度学习图像生成技术,在艺术创作、设计、科学可视化等领域展现出巨大的潜力。若您希望在自己的本地环境中部署Stable Diffusion,以下是一份详细的步骤与指南,帮助您成功搭建并运行该模型。 一、准备环境...
-
Midjourney禁止Stability AI员工使用服务 涉嫌数据抓取引发争议
Midjourney在周三宣布无限期禁止竞争对手Stability AI的所有员工使用其图像合成服务,原因是检测到疑似Stability员工试图批量抓取提示和图像对的活动。这一决定是由Midjourney的倡导者Nick St. Pierre通过官方Dis...
-
Midjourney中文版到底是官方还是李鬼?
AI绘画大神Midjourney为何选择QQ频道进军中国市场? Midjourney中文版到底是官方还是李鬼?看这篇文章就知道了! 今天我想和大家聊聊一个最近很火的话题,那就是AI绘画神器Midjourney(简称MJ)来中国了,QQ频道内测火爆开...
-
Stable Diffusion中的Clip模型
基础介绍 Stable Diffusion 是一个文本到图像的生成模型,它能够根据用户输入的文本提示(prompt)生成相应的图像。在这个模型中,CLIP(Contrastive Language-Image Pre-training)模型扮演了一个关键...
-
[SD] stable diffusion webui forge 安装
参考: How to install SD Forge - Stable Diffusion Art stable diffusion webui forge 是 stable diffusion webui 的定制版,其主要面向快速图像生成。...
-
全网最全AI绘画工具汇总(二)
一.AI绘画 图像 创造人工智能艺术的方式共有多种方法,包括使用数字模式的程序“基于规则”的图像生成、模拟笔触和其他绘画效果的算法,以及人工智能或深度学习算法等。 最早的重要人工智能艺术系统之一是AARON,由哈罗德·科恩于1960年代末开始开发...
-
最新综述!扩散模型与图像编辑的爱恨情仇
本文经自动驾驶之心公众号授权转载,转载请联系出处。 针对图像编辑中的扩散模型,中科院联合Adobe和苹果公司的研究人员发布了一篇重磅综述。 全文长达26页,共1.5万余词,涵盖297篇文献,全面研究了图像编辑的各种前沿方法。 同时,作者还提出了全新的be...
-
EasyDiffusion Online:一款免费的AI绘画工具
EasyDiffusion Online是一款强大的AI图像生成工具,旨在帮助用户释放创造力。用户可以通过该平台免费使用图像生成器和提示生成器,将文字描述快速转化为视觉图像,实现他们的创意想法。 该平台提供了一个庞大的创作社区,拥有超过15000名活跃创作...
-
本地开启stable diffusion web-ui体验AIGC文生图,图生图
目录 准备工作 主机电脑配置检查 安装以下软件 Python Git 下载stable-diffusion-webui仓库 根据显卡属性安装CUDA 2.下载stable diffusion的训练模型 启动 问题处理 模型加载问题...
-
“羊驼“入侵CV,美团&浙大沈春华团队将LLaMA向CV扩展,构建全新基础模型VisionLLaMA
本文首发:AIWalker https://arxiv.org/abs/2403.00522 https://github.com/Meituan-AutoML/VisionLLaMA 本文概述 大型语言模型构建在基于Transf...
-
基于 Amazon EKS 的 Stable Diffusion ComfyUI 部署方案
01 背景介绍 Stable Diffusion 作为当下最流行的开源 AI 图像生成模型在游戏行业有着广泛的应用实践,无论是 ToC 面向玩家的游戏社区场景,还是 ToB 面向游戏工作室的美术制作场景,都可以发挥很大的价值,如何更好地...
-
AIGC图像技术在淘宝人生2的探索和应用
淘宝人生2(又名:第二人生)是淘宝的一个虚拟人装扮类应用,承担了用户在淘宝的第二个人生的作用。我们旨在通过AI为淘宝人生2的用户提供丰富有趣的可玩性内容,随着最近火热的AIGC技术的发展,我们也进行了相关尝试和落地,目前已经上线了AI拍照...
-
Adobe将生成式AI技术Firefly引入移动端 Express应用
Adobe正式将其生成式人工智能(GAI)技术Firefly引入移动设备。最新版本的Adobe Express测试版在Android和iOS上都推出了Firefly GAI功能,为用户提供了更广泛的图像创建和编辑选项。 使用Firefly,用户只需输入文本...
-
AI图像合成技术的新浪潮:Stable Diffusion 3与Sora构架的突破
在人工智能的黄金时代,图像合成技术正以前所未有的速度发展。从简单的图像编辑到复杂的场景生成,AI的能力已经超越了传统软件的限制,开启了创意和视觉表达的新纪元。近期,Stable Diffusion 3技术报告的流出引起了业界的广泛关注,其背后的Sora构...
-
Midjourney封禁Stability AI:恶意爬取数据,致服务器瘫痪24小时
Midjourney 把 Stability AI 拉入黑名单了,禁止后者所有员工使用其软件,直至另行通知。 这两家 AI 图像生成公司之间发生什么事了。虽然 AI 生图领域,看似百花齐放,但论资排辈,Midjourney、Stability AI 还是...