-
AI 绘图:MidJourney 的提示语句(Prompt)怎么写?
这篇文章主要总结了在 AI 绘画中,使用 MidJourney 时提示语句 Prompt 的写法。 1、基本 Prompt 写法 完整的 Prompt 可以分为三个部分:[Image Prompts][Text Prompt][Parameters]...
-
Stable Diffusion的结构要被淘汰了吗?详细解读谷歌最新大杀器VideoPoet
Diffusion Models视频生成-博客汇总 前言:视频生成领域长期被Stable Diffusion统治,大部分的方式都是在预训练的图片Stable Diffusion的基础上加入时间层,学习动态信息。虽然有CoDi《【NeurIPS...
-
AIGC笔记总结(二):扩散模型原理
?个人主页: GoAI |? 公众号: GoAI的学习小屋 | ?交流群: 704932595 |?个人简介 : 掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计算机视觉方向导师等,专注大数...
-
CVPR 2023 | 图像超分,结合扩散模型/GAN/部署优化,low-level任务,视觉AIGC系列
1、Activating More Pixels in Image Super-Resolution Transformer 基于Transformer的方法在低级别视觉任务中,如图像超分辨率,表现出了令人印象深刻的性能。Transformer的...
-
webotAI网页版上线啦!
国内终于也能玩ChatGPT啦!更智能的聊天,超清有趣的绘画,智能写作辅助办公。随着人工智能技术的快速发展,AI产品逐渐成为我们生活和工作中的得力助手。今天,我们为您推荐一款强大的AI产品—webotAI,它集AI聊天、AI写作和AI绘画于一身,为您提供全...
-
【扩散模型Diffusion Model系列】0-从VAE开始(隐变量模型、KL散度、最大化似然与AIGC的关系)
VAE VAE(Variational AutoEncoder ,变分自编码器,是一种无监督学习算法,被用于压缩、特征提取和生成式任务。相比于GAN(Generative Adversarial Network ,VAE在数学上有着更加良好的性质,有利...
-
大模型+机器人,详尽的综述报告来了,多位华人学者参与
大模型的出色能力有目共睹,而如果将它们整合进机器人,则有望让机器人拥有一个更加智能的大脑,为机器人领域带来新的可能性,比如自动驾驶、家用机器人、工业机器人、辅助机器人、医疗机器人、现场机器人和多机器人系统。 预训练的大型语言模型(LLM)、大型视觉 -...
-
[一周AI简讯]OpenAI宫斗;微软Bing Chat更名Copilot;Youtube测试音乐AI
OpenAI宫斗,奥特曼被解雇,董事会内讧 Sam Altman被解雇,不再担任CEO,董事会的理由是奥特曼在与董事会的沟通中始终不坦诚,阻碍了董事会履行职责的能力。原首席技术官Mira Murati担任新CEO。OpenAI宫斗剧远未结束,各方还在讨...
-
在 Apple Silicon Mac 上部署 StableDiffusion 的分步指南,释放 Apple Silicon 芯片及其神经引擎的全部潜力
任何使用AI模型生成图像的服务都在涌现。这些服务中的大多数都提供基于积分的定价系统,您可以在其中购买积分以用于服务,并且每项服务都有自己的每张图片积分等级。另一种选择是直接在您自己的机器上部署文本到图像模型,这样可以避免任何使用成本,除了操作机器的成本。事...
-
AIGC - 入门向量空间模型
文章目录 向量和向量空间 向量的运算 什么是向量空间? 向量空间的几个重要概念 向量之间的距离 曼哈顿距离(Manhattan Distance) 欧氏距离(Euclidean Distance) 切比雪夫距离(Chebyshev Dist...
-
AI绘画:SDXL1.0正式版+2款软件+多种在线体验方式!
万众期待的最强开源AI模型SDXL1.0终于开源了! SDXL1.0 是什么? 简单来说,它是目前最强大的开源AI绘画模型,开源当然也意味着免费。单纯从模型的角度来看,肯定比SD1.5,SD2.x这种强很多。 如果你要寻找...
-
一文读懂常用的 “生成式 AI 库”
Hello folks,我是 Luga,今天我们继续来聊一下人工智能(AI)生态领域相关的技术 - GenerativeAI Library(生成式 AI 库) ,本文将继续聚焦在针对 Gen AI Library 的技术进行解析,使得大家能够了解 G...
-
图像生成工具LeonardoAI视频生成功能正式向所有用户推出
图像生成工具LeonardoAI的视频生成功能现已向所有用户推出,并且可以免费试用。这项功能基于SVD技术,效果非常出色。某些风格比 Runway效果还要好。但是不能用外部图片生成只能用他们自己的工具生成的图片生成视频。 官网地址:https://top...
-
挑战Transformer的Mamba是什么来头?作者博士论文理清SSM进化路径
在大模型领域,Transformer 凭一己之力撑起了整个江山。但随着模型规模的扩展和需要处理的序列不断变长,Transformer 的局限性也逐渐凸显,比如其自注意力机制的计算量会随着上下文长度的增加呈平方级增长。为了克服这些缺陷,研究者们开发出了很多...
-
阿里团队推新AI模型I2VGen-XL:单张静止图像就能生成高质量视频
视频合成最近取得了显著的进步,这得益于扩散模型的快速发展。然而,它在语义准确性、清晰度和时空连续性方面仍然存在挑战。它们主要源于文本-视频数据的稀缺性和视频的复杂固有结构,使得模型难以同时确保语义和定性的卓越性。 阿里巴巴、浙江大学和华中科技大学的研究人员...
-
stable-diffusion安装和简单测试
参考:https://github.com/CompVis/stable-diffusion理解DALL·E 2, Stable Diffusion和 Midjourney的工作原理Latent Diffusion Models论文解读【生成式AI】淺談圖...
-
window安装Stable-Diffusion-WebUI详细教程
直接上效果图,这是通过stable diffusion webui 利用古风模型生成的图片,实在是太好看了!!! 看了这些图,有没有心痒痒的?今天就来带大家入个门!先把软件搞起来 ! 【前言】 Stable Diffusion是2022年发布的深度学...
-
AI向百万薪资 高级原画师开刀?!爆Midjourney入局3D模型生成
来源 SoulofArt | ID Soul_Art 现在AI向高级原画师和3D开刀了? 网传爆料AI已入局3D模型生成... 这进化速度放在整个行业都十分炸裂 4月,Midjourney进一步宣布推出Niji-journey V5...
-
14秒就能重建视频,还能变换角色,Meta让视频合成提速44倍
就今天的人工智能发展水平来说,文生图、图生视频、图像/视频风格迁移都已经不算什么难事。 生成式 AI 天赋异禀,能够毫不费力地创建或修改内容。尤其是图像编辑,在以十亿规模数据集为基础预训练的文本到图像扩散模型的推动下,经历了重大发展。这股浪潮催生了大量图...
-
击败扩散模型,清华朱军团队基于薛定谔桥的新语音合成系统来了
近日,由清华大学计算机系朱军教授课题组发布的基于薛定谔桥的语音合成系统 [1],凭借其 「数据到数据」的生成范式,在样本质量和采样速度两方面,均击败了扩散模型的 「噪声到数据」范式。 论文链接:https://arxiv.org/abs/2312.03...
-
Llama 2免费托管及API提供
Llama 2 是 Meta 最新的文本生成模型,目前其性能优于所有开源替代方案。 推荐:用 NSDT编辑器 快速搭建可编程3D场景 1、强大的Llama 2 它击败了 Falcon-40B(之前最好的开源基础模型),与 GPT-3....
-
利用Stable diffusion Ai 制作艺术二维码超详细参数和教程
大家有没有发现最近这段时间网上出现了各种各样的AI艺术二维码,这种二维码的出现,简直是对二维码的“颠覆式创新”,直接把传统的二维码提升了一个维度!作为设计师的我们怎么可以不会呢? 今天就教大家怎么制作这种超有艺术的二维码,硬是把二维码上升到了艺术层面,比如...
-
[Stable Diffusion进阶篇]LCM提示SD文生图效率,Lcm_lora使用体验
LCM 官方以此训练了一个新的模型 Dreamshaper-V7,仅通过 2-4 步就能生成一张 768*768 分辨率的清晰图像。 以往我们用 SD 生成图片起码需要20步的步数,现在使用 LCM 只需要4步就行,实现所见即所得。 1....
-
一分钟叫你怎样AI绘画 Vega Ai
先看效果图: 是不是也想自己去创造这样的图片呢,注意已经不需要自己画了!! Vega AI 简介 Vega AI是一款能够 文字生成图片、根据图片+文字进行生成图片、条件生成图片 、根据多张图片训练出自己的风格,在风格广场选择他人制作的...
-
只需一张图片、一句动作指令,Animate124轻松生成3D视频
近一年来,DreamFusion 引领了一个新潮流,即 3D 静态物体与场景的生成,这在生成技术领域引发了广泛关注。回顾过去一年,我们见证了 3D 静态生成技术在质量和控制性方面的显著进步。技术发展从基于文本的生成起步,逐渐融入单视角图像,进而发展到整合...
-
我的大模型观:我眼中的LLM
文章目录 大模型是有智能的。 也许,大模型是一场骗局? 从头训练or微调 我想象中的大模型架构 大厂的大模型 中小厂和个人开发该何去何从? 今年,大模型火的一塌糊涂。最近几个月paper with code上,前几名的论文几乎都是生成模...
-
AI视野:Midjourney V6史诗级升级;ChatGPT新增存档聊天记录功能;阿里DreaMoving开源;百度千帆AppBuilder开放
???AI新鲜事 Midjourney V6史诗级升级,网友惊呼太逼真! 网友在Midjourney V6第二次社区评价中惊叹其逼真神图,光影效果出众,上线倒计时,可能在今明两天内发布。 ChatGPT新增存档聊天记录功能 12月21日,OpenAI在...
-
开创全新通用3D大模型,VAST将3D生成带入「秒级」时代
生成式 AI 在3D 领域在很长一段时间内都在等待自己的「ChatGPT」时刻。 传统3D 建模涉及游戏、影视、建筑等多个行业,普遍依赖专业人员手动操作,生产周期短则几天,多则以月为单位,单个3D 模型的创建成本至少需要几千元。生成式 AI 技术在2D 图...
-
被称为下一代风口的AIGC到底是什么?
近期,短视频平台上“AI绘画”的概念爆火,ChatGPT这一词条也刷爆了科技圈,而这些概念同属于一个领域——AIGC。2022年12月,Science杂志发布的2022年度科学十大突破中,AIGC入选。 那么,被称之为是AI下一代风口的AIGC到底是什么...
-
【AI进阶】Stable Diffusion安装部署
目录 1.Stable Diffusion简述 2.sd下载安装 3.sd运行使用 低于3G显存 4G显存 低于5G显存 6G显存 生成图片 4.C站-安装模型 1.Stable Diffusion简述 Stable Diff...
-
CVPR 2023 | 可控文生图/定制化文生图领域论文详解 AI作画增强版
可控文生图/定制化文生图 1、DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation DreamBooth是一种新的文本到图像扩散模型...
-
斯坦福大学研究生开发名为PIGEON的AI模型 仅通过几张照片找到你的位置
斯坦福大学的研究生们开发了一款名为 PIGEON 的应用程序,可以仅仅通过查看 Google 街景图像或其他图像来确定具体位置,其准确率令人印象深刻。 根据预印本论文的数据,PIGEON 可以以92%的准确率预测所拍摄国家,并且在40%的猜测中可以将位置定...
-
AIGC实战——条件生成对抗网络(Conditional Generative Adversarial Net, CGAN)
AIGC实战——条件生成对抗网络 0. 前言 1. CGAN架构 2. 模型训练 3. CGAN 分析 小结 系列链接 0. 前言 我们已经学习了如何构建生成对抗网络 (Generative Adversarial Net, GA...
-
用生物脑机制启发持续学习,让智能系统适者生存,清华朱军等团队研究登Nature子刊封面
在开放、高动态和演化环境中的学习能力是生物智能的核心要素之一,也是人类以及大多数动物在「适者生存」的自然选择过程中形成的重要优势。目前传统机器学习范式是在静态和封闭的数据集上学习到一个模型,并假设其应用环境和之前训练数据的属性相同,因而无法适应动态开放环...
-
Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)
本篇是《Diffusion Model (扩散生成模型 的基本原理详解(一)Denoising Diffusion Probabilistic Models(DDPM 》的续写,继续介绍有关diffusion的另一个相关模型,同理,参考文献和详细内容与上一...
-
StableVideo:使用Stable Diffusion生成连续无闪烁的视频
使用Stable Diffusion生成视频一直是人们的研究目标,但是我们遇到的最大问题是视频帧和帧之间的闪烁,但是最新的论文则着力解决这个问题。 本文总结了Chai等人的论文《StableVideo: Text-driven consistency -...
-
UIUC清华联手发布全新代码大模型Magicoder 不到7B参数
在代码生成领域,UIUC和清华合作发布了Magicoder,这一全新的大型语言模型仅使用了7B参数,却能与顶级模型媲美,并以全面开源的方式分享了其代码、权重和数据。Magicoder的关键在于采用了OSS-INSTRUCT方法,该方法通过从开源代码中获取灵...
-
word2vec作者曝与Ilya等十年积怨:seq2seq也是我的想法
里程碑式论文word2vec获得NeurIPS时间检验奖,可谓实至名归。 但一作Tomas Mikolov在Facebook上发表的长篇获奖感言,却充满了失望和不满。 图片 论文最初被ICLR拒稿都算小事了,他还暗讽了OpenAI首席科学家Ilya Su...
-
速度暴涨1000倍!扩散模型预测材料“炼金”过程,体系越复杂加速度越大
用扩散模型预测化学反应,速度直接暴涨1000倍! 原本需要用计算机硬算几小时甚至一天,现在单个GPU用6秒钟就能搞定。 这是MIT和康奈尔大学联合搞出来的一项新研究,用扩散模型来预测化学反应中最关键的过渡态结构,不仅计算速度提升1000倍,结果也竟然意想...
-
Mistral携微软引爆「小语言模型」潮!Mistral中杯代码能力完胜GPT-4,成本暴降2/3
最近,「小语言模型」忽然成为热点。 本周一,刚刚完成4.15亿美元融资的法国AI初创公司Mistral,发布了Mixtral 8x7B模型。 这个开源模型尽管尺寸不大,小到足以在一台内存100GB以上的电脑上运行,然而在某些基准测试中却能和GPT-3....
-
3个问题!验明GPT-4真身;基于GPT科研加速技巧汇总;Midjourney神仙教程;印象笔记有AI功能啦 | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 『GPT-4 验明真身的三个经典问题』快速区分 GPT-3.5 与 GPT-4,快来对答案 这里收集了几个免费使用 GPT-4 的工具,社区小伙...
-
UC伯克利DeepMind等联合发布真实世界模拟器,打破虚实边界
真实世界模拟器来啦! 还在发愁训练出的大模型无法适应真实的物理世界吗? AI Agent想要进入我们的生活还有多远的距离? ——UC伯克利、谷歌DeepMind、MIT和阿尔伯塔大学的研究人员告诉你答案。 在NeurlPS 2023上,研究人员将展示他们...
-
【小沐学NLP】在线AI绘画网站(网易云课堂:AI绘画工坊)
文章目录 1、简介 1.1 参与方式 1.2 模型简介 2、使用费用 3、操作步骤 3.1 选择模型 3.2 输入提示词 3.3 调整参数 3.4 图片生成 4、测试例子 4.1 小狗 4.2 蜘蛛侠 4.3 人物 4.4 龙猫 结...
-
AI绘画软件DALL-E3上线,功能强大且免费使用
AI绘画软件DALL-E3上线,功能强大且免费使用 Bing 与 OpenAI 的 DALL-E 3 的合作证明了搜索引擎和人工智能的创造力之间不断发展的协同作用。DALL-E 3 的功能不再局限于技术爱好者和专业人士的领域,现在所有人都可以通过...
-
Stable Diffusion加chilloutmixni真人图片生成模型,AI绘图杀疯了
上期图文教程,我们分享过AI绘图大模型Stable Diffusion以及中文版本文心AI绘画大模型的基础知识以及代码实现,截至到目前为止。Stable Diffusion模型已经更新到了V2.1版本,其文生图大模型也越来越火,其在2022年底,由AI绘制...
-
Beezy 实测:Bard Google vs ChatGPT,你该怎么选?
随着人工智能技术的不断发展,越来越多的创新型公司开始加入这场“智能化”竞赛。在众多的AI企业中,Bard Google和ChatGPT无疑是两大巨头。两家公司都拥有自己独特的技术,同时也面临着自己的挑战。 在本文中,我们将通过交互功能、文本生成、逻辑推理...
-
扩散模型训练太难?来看看Meta AI最新提出的KNN-Diffusion
原文链接:https://www.techbeat.net/article-info?id=4323 作者:seven_ 最近AIGC社区中有趣的工作可谓是层出不穷,这都得益于扩散模型(Diffusion Models)的成功,扩散模型作为生成式AI...
-
AI视野:谷歌Gemini Pro开放;文心一言插件商城上线;谷歌图像生成模型Imagen2发布;阿里推虚拟试穿技术Outfit Anyone
???AI新鲜事 谷歌Gemini Pro开放 谷歌Gemini Pro大模型在研究基准测试中表现优异,支持32K上下文窗口的文本输入和生成功能,向Vertex AI云计算客户和AI Studio开发人员开放,提供多种功能和SDK,为构建AI应用程序提供更...
-
AI-多模态-文本->图像-2021:Stable Diffusion【开源】【目前开源模型中最强】
最近大火的Stable Diffusion也开源了(20220823 ; 我也本地化测试了一下效果确实比Dall-E mini强太多了,对于我们这些玩不上Dall-E2的这个简直就是就是捡钱的感觉,当然后期跑起来,稍微不注意显存就炸了。 这里我写一下安...
-
Stable Diffusion webui 基础参数学习
哈喽,各位小伙伴们大家好,最近一直再研究人工智能类的生产力,不得不说随着时代科技的进步让人工智能也得到了突破性的发展。而小编前段时间玩画画也是玩的不可自拔,你能想想得到,一个完全不会画画的有一天也能创作出绘画作品。 熟知小编教学的小伙伴都知道,一般都是图...