-
AI绘画入门指南!8个国内外主流AI绘画工具盘点
🎨 什么是AI绘画? AI绘画,就是通过人工智能技术来进行绘画创作。其主要原理是利用深度学习技术,对大量已有作品或图像进行学习和分析,再通过生成模型(如GAN-生成对抗网络),根据用户输入的指令生成全新的、独一无二的作品。 👩🎨AI...
-
AIGC笔记--特征线性调制(FiLM)层的实现
目录 1--特征线性调制层的作用 2--特征线性调制层的实现 3--论文实例 1--特征线性调制层的作用 特征线性调制(Feature-wise Linear Modulation,FiLM)层是一种神经网络模块...
-
Stable Diffusion从入门到卸载,一站式服务为你的AI绘画保驾护航!
大家好,目前正在学习研究Stable Diffusion,致力于用最为朴素直白的语言为你介绍AI绘画的相关知识。 花了很长的时间,终于整理好这份Stable Diffusion的教程,从入门的安装、本地部署到觉得疲惫,安装失败,想要卸载,里面的内容应有尽...
-
图像生成模型浅析(Stable Diffusion、DALL-E、Imagen)
目录 前言 1. 速览图像生成模型 1.1 VAE 1.2 Flow-based Model 1.3 Diffusion Model 1.4 GAN 1.5 对比速览 2. Diffusion Model 3. Stable Diffusi...
-
【机器学习结合AI绘画工具】——开启艺术创作的新纪元
目录 一、AI绘画工具的发展历程 二、AI绘画工具的技术原理 实例说明 三、AI绘画工具在艺术创作中的应用 实例网站 四、AI绘画工具的影响与未来展望 结论 机器学习和人工智能(AI)在过去的十年里取得了显著的进展。特别是在艺术创作领...
-
AI绘画Midjourney最详细易懂的注册使用教程
前言 随着ChatGPT席卷全球,生成式AI越来越受关注,其中AI图像生成涌现很多工具。 Midjourney 是一款强大的 AI 图像生成工具,只需要简单的自然语言描述就能快速生成图像。 与其他AI图像生成相比,Midjourney学习成本更低,生...
-
免费AI出图神器:StableStudio——定义AI作画新前景
StableStudio:探索艺术与科技的无限交界,StableStudio引领AI智能创作新浪潮! - 精选真开源,释放新价值。 概览 ChatGPT大语言模型AI的诞生引爆了对AIGC的讨论。AIGC 又称生成式 AI (Generat...
-
【带文字的图像生成-附开源代码】AIGC 如何在图像中准确生成文字?字体篇(上)
文字图像生成是什么? “文字图像生成(Text-image generation)”即生成带有指定文字的图像。如下图所示,市面常见的通用文生图很难准确地生成带有指定文字的图像。文字图像生成也被称为文本渲染(Text rendering)。 为什么重要?...
-
又又又又翻车!谷歌新AI功能再遭公众批评,称前总统奥巴马是穆斯林,“承认谷歌违反反垄断法”
编辑 |星璇 出品 | 51CTO技术栈(微信号:blog51cto) 谷歌近日在谷歌搜索中首次推出了“AI Overview”,上线还不到两周,就被爆料由于该 AI 功能中的查询返回了毫无意义或不准确的结果(并且没有任何选择退出的方式),公众的批评日益...
-
最低9美元/月!Stability AI推Stable Assistant 可用SD3生成图片
Stability AI 推出了一款名为 Stable Assistant 的友善聊天机器人,它搭载了Stability AI 最新的文本和图像生成技术,包括 Stable Diffusion3和 Stable LM212B。这款聊天机器人目前处于测试...
-
DiffMap:首个利用LDM来增强高精地图构建的网络
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文标题: DiffMap: Enhancing Map Segmentation with Map Prior Using Diffusion Model 论文作者: Peijin Jia, Tuo...
-
谷歌AI搜索惨败,竟教唆网友自杀!
【新智元导读】隔壁OpenAI都杀疯了,谷歌还在收集badcase?搜索引擎AI Overview上线之后,没想到谷歌AI的邪恶程度远超想象:教唆网友自杀/谋杀、吃毒蘑菇,甚至无法识别混淆信息,犯常识错误...... 这几天,谷歌AI搜索给出的奇葩结果,可...
-
Stable Diffusion WebUI 中调度器(Schedule type)简单研究
💎内容概要 在近期,stable diffusion webui更新了1.9版本,其中包含的一项变化就是,把采样器和调度器(Schedule type)分开了,之前是合并在一起来选择的,所以这篇文章主要分两个部分,第一个部分是作者为什么把他们给分开了,第...
-
AI绘画SD 教程 - 采样器详解及对比,建议收藏!
主业写代码,副业做 AI 大家好,我是程序员晓晓 采样器详解及对比 在图像生成领域,采样器是一种关键的算法组件,用于从模型学习到的概率分布中生成图像。简单来说,采样器的作用是根据模型的预测,决定如何步步细化最终图像的每一个像素,从而确保生成的图像既...
-
最简单的Stable Diffusion 本地部署教程
为了在本地成功部署Stable Diffusion,你需要遵循一系列详细的步骤,确保所有必要的硬件和软件环境都被正确配置。以下是一个全面的教程,帮助你从零开始搭建Stable Diffusion的运行环境。 1. 硬件和软件环境准备【1】【5】 在开...
-
AI绘画:利用ComfyUI进行文生图操作的完整指南
前言 ComfyUI作为一款基于Stable Diffusion的节点式操作界面,为用户提供了一个更加灵活和高效的文生图(文本生成图像)创作环境。本篇博客将详细介绍如何使用ComfyUI进行文生图操作,无论你是初学者还是有一定基础的用户,都能够通过本指南...
-
AI绘图Stable Diffusion中关键技术:U-Net的应用
你好,我是郭震 引言 在人工智能和深度学习的迅猛发展下,图像生成技术已经取得了令人瞩目的进展。特别是,Stable Diffusion模型以其文本到图像的生成能力吸引了广泛关注。本文将深入探讨Stable Diffusion中一个关键技术——...
-
CVPR 2024 | 图像超分、图像恢复汇总!用AIGC扩散模型diffusion来解决图像low-level任务的思路...
1、Arbitrary-Scale Image Generation and Upsampling using Latent Diffusion Model and Implicit Neural Decoder 超分辨率(SR)和图像生成是计算...
-
CVPR 2024 | 图像检测类(目标、deepfake、异常)!AIGC扩散模型diffusion解决detection任务...
目标跟踪 1、Delving into the Trajectory Long-tail Distribution for Muti-object Tracking 多目标跟踪(Multiple Object Tracking,MOT)是计算...
-
AIGC的崛起:定义未来内容创作的新纪元
🌟文章目录 🌟AIGC简介 🌟 AIGC的相关技术与特点 🌟AIGC有哪些应用场景? 🌟AIGC对其他行业影响 🌟面临的挑战与问题 🌟AIGC未来发展 🌟AIGC十大热门网站推荐: 文心一言:https://aigc.izzi.c...
-
Stable Diffusion介绍
Stable Diffusion是一种前沿的开源深度学习模型框架,专门设计用于从文本描述生成高质量的图像。这种称为文本到图像生成的技术,利用了大规模变换器(transformers)和生成对抗网络(GANs)的力量,以创建与给定文本提示相一致的图像。...
-
Midjourney国际版教程(保姆级教程)
1.登录Discord Midjourney国际版架设在Discord上,因此使用Midjourney前需要先创建并验证Discord帐户,然后通过浏览器Discord访问Midjourney Bot。 2.订阅Midjourney Midjou...
-
AI绘画Stable diffusion 4.7最新版终于来了!一键安装,本地部署!
如果这个世界有上帝,那么他一定是程序员。 国内SD绘画启动器第一人是我认为是B站的秋葉aaaki 因为制作了这款Stable Diffusion启动器,降低了国内使用SD的门槛,秋叶被粉丝戏称赛博菩萨。 1、背景信息 ▍Stable Di...
-
AI绘图:Controlnet在ComfyUI中的使用教程:提升Stable Diffusion可控性
前言 Controlnet是Stable Diffusion中一个至关重要的功能,它极大地增强了图像生成的可控性。通过引入额外的条件,Controlnet使我们能够更精确地控制生成的图像内容。本教程将详细介绍如何在ComfyUI中使用Controlnet...
-
全网最全stable diffusion webui API调用示例,包含controlneth和segment anything的API(附json示例)
全网最全stable diffusion webui API调用示例,包含controlneth和segment anything的API(附json示例) 交流群 100419879 欢迎合作👏🏻 V : 864399407 GitHub:https...
-
AIGC实战——VQ-GAN(Vector Quantized Generative Adversarial Network)
AIGC实战——VQ-GAN 0. 前言 1. VQ-GAN 2. ViT VQ-GAN 小结 系列链接 0. 前言 本节中,我们将介绍 VQ-GAN (Vector Quan...
-
AI图案生成器Ideogram Tile:文本生成无缝重复的图案
人工智能初创公司 Ideogram 以其先进的文本转图像生成功能而闻名,如今宣布其平台迎来重大升级:Ideogram Tile。这一新功能允许用户从单个文本提示中创建无缝重复的图案,为设计师、艺术家和企业开辟了无限可能。 使用 Ideogram Til...
-
一篇文章详细介绍Stable Diffusion模型原理及实现过程(附常用模型网站、下载方式)
目录 前言 何为Stable Diffusion模型? Stable Diffusion工作原理: Stable Diffusion模型的应用场景 Stable Diffusion免费使用网站 stability.ai: 本地部...
-
AIGC实战——MuseGAN详解与实现
AIGC实战——MuseGAN详解与实现 0. 前言 1. MuseGAN 1.1 Bach Chorale 数据集 1.2 MuseGAN 生成器 1.3 MuseGAN 判别器 2. MuseGAN 分析 小结 系列链接 0...
-
世界模型也扩散!训练出的智能体竟然不错
世界模型提供了一种以安全且样本高效的方式训练强化学习智能体的方法。近期,世界模型主要对离散潜在变量序列进行操作来模拟环境动态。 然而,这种压缩为紧凑离散表征的方式可能会忽略对强化学习很重要的视觉细节。另一方面,扩散模型已成为图像生成的主要方法,对离散潜在...
-
前沿科技应用:AIGC技术的广泛渗透
✨✨ 欢迎大家来访Srlua的博文(づ ̄3 ̄)づ╭❤~✨✨ 🌟🌟 欢迎各位亲爱的读者,感谢你们抽出宝贵的时间来阅读我的文章。 我是Srlua小谢,在这里我会分享我的知识和经验。🎥 希望在这里,我们能一起探索IT世界的奥妙,提升我们的...
-
【活动】AIGC 技术的发展现状与未来趋势
🌈个人主页: 鑫宝Code🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 💫个人格言: "如无必要,勿增实体" 文章目录 AIGC 技术的发展现状与未来趋势 引言 AIGC技术的发展现状 文本生成...
-
前Reddit CEO称科技巨头AI竞赛过度导致产品质量下降
前 Reddit CEO Yishan Wong 指出,科技巨头对人工智能(AI)的过度迷恋已经开始影响他们推出的产品质量。在周三的一篇文章中,Wong 表示:“大型互联网巨头正陷入 AI 的模因竞争中,而 Google 对 OpenAI 的生存恐惧则处于...
-
AI 如何颠覆社交互动?两位 Snap 工程师做了这款表情包产品
“生成式 AI 技术正引领一场社交媒体自我表达的革命。从Remini的黏土滤镜到 Easel 的表情包,图像生成领域的创新产品不断涌现。生成式技术、社交媒体与自拍照的结合,为用户提供了前所未有的个性化和创意表达空间。“ Sense 思考 我们尝试基于文章内...
-
为了教会你如何写AI绘画提示词 谷歌推出了这款游戏
“Say What You See”,是谷歌推出的一款游戏,旨在帮助玩家提高他们的图像阅读技能和AI提示写作能力。这款游戏要求玩家观察Google AI生成的图像,并描述他们所看到的内容,以尽可能准确地生成相似的图像。玩家需要在规定的字符限制内编写提示,并...
-
使用Python探究OpenAI API
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 不妨了解可以从OpenAI享用的所有实用服务。 谁没听说过OpenAI?这家人工智能研究实验室因其著名的产品ChatGPT而改变了世界...
-
Meta发布类GPT-4o多模态模型Chameleon
Meta最近发布了一个名为Chameleon的多模态模型,它在多模态模型发展中设立了新的标杆。Chameleon是一个早期融合的基于token的混合模态模型家族,能够理解并生成任意顺序的图像和文本。它通过一个统一的Transformer架构,使用文本、图像...
-
微软一夜干翻苹果Mac!GPT-4o装进全家桶,微软把全世界PC都AI了
GPT-4o诞生刚过去一周,微软线下发布会再次给全世界亿点点震撼! 一大早,纳德拉向全世界公布了首款Copilot+ PC,采用了全新NPU,并重新设计了Windows 11系统。 最最重要的是,GPT-4o已经装进了新时代的AI PC,以及40+款模...
-
Stability AI与Facebook前总裁等投资人进行筹款谈判
一位直接参与交易谈判的人士透露,包括 Facebook 前总裁 Sean Parker 在内的一组投资者正与 Stability AI 进行筹款谈判。Stability AI 是一家开发基于开源图像生成器 Stable Diffusion 的产品的初创公司...
-
报道称:Stability AI 面临资金危机,考虑出售
根据知情人士透露,作为投资者追捧未经验证的人工智能初创公司的典型代表,Stability AI 最近几周已与至少一家潜在买家讨论出售事宜,因为该公司面临资金危机。 这家成立四年的初创公司从包括 Coatue Management 和 Lightspeed...
-
GPT-4o再秀神操作,“复现”OpenAI总裁讲课,网友当真了
OpenAI总裁兼联合创始人Greg再次大秀GPT-4o操作,结果网友直接缅怀DALL-E。 图片 直接看效果。 图片 文本拼写达到惊人的一致!手部细节、光照全都有,甚至后背上的Logo也完全正确。 有网友表示:恍惚间还以为真的是本人在讲课。 图片 也有...
-
AI日报:谷歌终极杀器硬刚GPT-4o、Sora;字节推出豆包大模型“全家桶”;阿里再推AI虚拟试衣神器;腾讯开源混元文生图大模型
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 1、谷歌急了,终极杀器对打GPT-4o 视频模型Veo硬刚Sora 谷歌近日发布了一系列强大的AI工具,...
-
Stylar:一站式AI图像和设计工具,提升创作效率
Stylar是一款集多功能于一体的人工智能图像和设计工具,以其全面的功能和简单易操作的特点,受到了创作者和设计师的广泛欢迎。该工具将生成式AI与编辑工具融合在一个平台上,极大地提高了从图像生成到编辑的工作效率。 产品入口:https://top.aiba...
-
专家表示OpenAI和亚马逊正在保持人工智能的真实性
在当前充斥着大量人工智能生成内容的世界中,科技巨头正陷入一场激烈的竞争,开发尖端工具以区分真实和虚假内容。 OpenAI 推出了一项新系统,用于识别其 DALL-E 3 文本到图像生成器生成的内容,旨在防范虚假内容。OpenAI 表示,该工具准确地检测到了...
-
硅谷AI工程师内卷崩溃记:996写代码项目被砍,连续熬夜只为讨好投资人!
AI爆火之后,硅谷的工程师们已经被「内卷」搞得精疲力竭,苦不堪言! 放弃整个周末休息辛苦写出的代码,因为项目降低优先级全部白费。 大家你追我赶,争取比竞家更快发布产品,一切都向速度看齐。领导疯狂发号施令,但对项目的实际影响漠不关心。 为了赶工AI项目,毫...
-
硅谷AI工程师内卷崩溃记:996写代码项目被砍,连续熬夜只为讨好投资人
【新智元导读】亚马逊工程师一个周末辛苦写出的代码,因为项目最终被降级而白白浪费了。AI爆火的背面,是一众硅谷大厂员工的疯狂内耗。越来越密集的活动日程表,越来越不可思议的deadline,为董事会准备毫无用途的AI产品展示……被迫「内卷」的大厂AI工程师们,...
-
谷歌DeepMind新方法Gecko,为测试AI图像生成器引入严格新标准
谷歌 DeepMind 最近的研究示了当前我们对文本到图像 AI 模型性能评估的隐藏局限性。在其发布在预印本服务器 ariv 上的研究中,他们引入了一种全新的方法称为 “Gecko”,承诺提供一个更全和可靠的基准,以评估这一蓬勃发展的技术。 研究团队在其...
-
InstantMesh:新AI框架可在10秒内从2D图像生成高质量3D网格
根据研究团队发表的预印本文章,InstantMesh是由腾讯PCG ARC实验室和上海科技大学的研究人员开发的人工智能框架,能够在仅需10秒的时间内,从单个2D图像生成高质量的3D网格。 该开源框架由多视图扩散模型和3D网格重建模型组成,通过使用不同角度...
-
无界AI算法总监邹国平:Midjourney领跑,没有标准答案的文生图,下半场还能怎么卷?
撰稿 | 李美涵 采访 | 云昭 嘉宾 | 邹国平 出品 | 51CTO技术栈(微信号:blog51cto) 进入2024,AI应用落地的步伐悄然加速。 AI文生图产品——连接着千行百业的设计需求,极大地压缩了创意实现的周期——正成为快速掘金的AI领域之...
-
探讨自回归模型和扩散模型的发展应用
在当前大模型驱动的内容创新浪潮中,人工智能产业正以前所未有的力度拥抱一场由大模型技术策动的科技革新运动。这场革命不仅重塑了人机交互的边界,使其跃升至更高层次的认知协作,而且正在颠覆传统的计算思维与执行模式,催生出全新的计算范式,从而深刻地渗透并革新各行各...