-
巅峰画师Midjourney:新时代的独角兽
介绍 AI绘画领域中,Midjourney处于绝对地位,并且一年时间就登顶。 Midjourney是一家独立的AI研究实验室,探索新的思维媒介,拓展人类的想象力。 它由一个小型的自筹资金团队组成,专注于设计、人类基础设施和AI。 在AI绘...
-
用扩散模型监督NeRF,清华文生3D新方法成新SOTA
用文字合成3D图形的AI模型,又有了新的SOTA! 近日,清华大学刘永进教授课题组提出了一种基于扩散模型的文生3D新方式。 无论是不同视角间的一致性,还是与提示词的匹配度,都比此前大幅提升。 图片 文生3D是3D AIGC的热点研究内容,得到了学术界和工...
-
堪比Midjourney!上百种风格AI写真丝滑生成,这个开源项目能颠覆照相馆吗?
概览简介 FaceChain 是一个可以用来打造个人数字形象的深度学习模型工具平台。用户仅需要提供最低一张照片即可获得属于自己的个人形象数字替身。结合不同的风格模型和写真模版,可以生成超乎想象空间的个人写真作品。 更有意思的...
-
Midjourney V6 引爆社交媒体,AI图像与照片的差别消失;LangChain的2023AI发展状况总结
? AI新闻 ? Midjourney V6 引爆社交媒体,AI图像与照片的差别消失 摘要:Midjourney V6 第二次社区评价震惊网友,神图细节逼真,光影效果逆天,皮肤质感细腻,已超越昨日版本。V6即将上线,预计在圣诞节前发布。其出图质量让...
-
Stable-diffusion-webui本地部署和简要介绍
Stable Diffusion 是一款基于人工智能技术开发的绘画软件,它可以帮助艺术家和设计师快速创建高品质的数字艺术作品。是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像,同时也可以应用于其他任务,如内补绘制、外补...
-
Python+AI实现AI绘画
? 运行环境:Python ? 撰写作者:左手の明天 ? 精选专栏:《python》 ? 推荐专栏:《算法研究》 ?#### 防伪水印——左手の明天 ####? ? 大家好???,我是左手の明天!好久不见? ?今天分享py...
-
视频一键动漫化AI工具DomoAI火了,武打戏各种招式丝滑转换,免费在线可玩
文字、图片、视频,万物皆可动漫化! 看,两位老兄上一秒还在武馆激烈打斗: 下一秒就转到了二次元世界,出拳、格挡各种招式丝滑转换: 小帅和小美正在拼凑“爱的华尔兹”,二次元这边梦幻联动,唯美氛围拉满~ 短视频平台火爆的小姐姐跳舞,打造动漫版也是没难度:...
-
视频一键动漫化AI工具火了,武打戏各种招式丝滑转换,免费在线可玩
文字、图片、视频,万物皆可动漫化! 看,两位老兄上一秒还在武馆激烈打斗: 下一秒就转到了二次元世界,出拳、格挡各种招式丝滑转换: 小帅和小美正在拼凑“爱的华尔兹”,二次元这边梦幻联动,唯美氛围拉满~ 短视频平台火爆的小姐姐跳舞,打造动漫版也是没难度: 这...
-
Midjourney 学习与应用心得(关键词、参数篇)
为了让大家更好的学习和掌握 Midjourney 描述词(Prompt)和参数(Parameter),我们先将Midjourney对话框进行解构 从图中可见,Midjourney对话框可以被划分为三个组成部分,最前面的就是命令(commands)部分...
-
14秒就能重建视频,还能变换角色,Meta让视频合成提速44倍
就今天的人工智能发展水平来说,文生图、图生视频、图像/视频风格迁移都已经不算什么难事。 生成式 AI 天赋异禀,能够毫不费力地创建或修改内容。尤其是图像编辑,在以十亿规模数据集为基础预训练的文本到图像扩散模型的推动下,经历了重大发展。这股浪潮催生了大量图...
-
击败扩散模型,清华朱军团队基于薛定谔桥的新语音合成系统来了
近日,由清华大学计算机系朱军教授课题组发布的基于薛定谔桥的语音合成系统 [1],凭借其 「数据到数据」的生成范式,在样本质量和采样速度两方面,均击败了扩散模型的 「噪声到数据」范式。 论文链接:https://arxiv.org/abs/2312.03...
-
AI视野:OpenAI灰度测试GPT4.5;Midjourney V6模型下周发布;Gemini自曝中文用文心一言训练;LeCun提出AGI七阶段路线图
???AI新鲜事 openAI灰度测试GPT4.5 近日,OpenAI正在对最新的GPT4.5turbo模型进行灰度测试,该模型在文本生成质量、效率、上下文理解、多模态能力、编程和代码生成、安全性、个性化定制等七个方面都取得显著进展。 Gemini自曝...
-
openAI灰度测试GPT4.5 实现六大能力增强
近日,有消息称OpenAI 正在灰度测试最新模型GPT4.5turbo,而宝玉、歸藏等博主也纷纷表示自己的版本已经更新到GPT4.5。 据GPT4.5turbo问答结果显示,相较于之前的GPT-4-turbo,新模型在多个方面实现了六大能力的增强。 首先,...
-
文心一言的优缺点分析及改进思路
随着人工智能技术的不断发展,越来越多的人们开始关注如何利用人工智能技术提高写作效率和质量。而文心一言作为一款基于深度学习算法的智能写作工具,已经成为日常写作中广泛使用的一种工具。但是,任何一种工具都有其优点和缺点,在使用文心一言时也需要认真考虑它的优缺点,...
-
Mistral携微软引爆「小语言模型」潮!Mistral中杯代码能力完胜GPT-4,成本暴降2/3
最近,「小语言模型」忽然成为热点。 本周一,刚刚完成4.15亿美元融资的法国AI初创公司Mistral,发布了Mixtral 8x7B模型。 这个开源模型尽管尺寸不大,小到足以在一台内存100GB以上的电脑上运行,然而在某些基准测试中却能和GPT-3....
-
AIGC的发展与挑战:距离完全取代人类劳动还有多远?
随着科技的飞速发展,人工智能生成内容(AIGC)逐渐成为我们生活中的一部分。然而,尽管AIGC的发展潜力巨大,但它是否能完全取代人的劳动,以及将面临哪些挑战,仍是人们热议的话题。 一、AIGC的发展现状 目前,AIGC的发展已经取得了显著的成果。...
-
What the DAAM: Interpreting Stable Diffusion Using Cross Attention
What the DAAM: Interpreting Stable Diffusion Using Cross Attention (Paper reading Raphael Tang, Comcast Applied AI, ACL2023 b...
-
六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革
两千年前的古人穿越到一千年前后,需要适应的东西可能不多。而一千前的古人穿越到一百年前,变化也不至于大到难以适应。但如果一百年前的古人穿越到现在,甚至只是有人“冬眠”10年、20年,面对的现实世界的变化,恐怕会是天翻地覆。日新月异的技术进步,正不断带来颠覆...
-
一张照片、一段声音秒生超逼真视频!南大等提出全新框架,口型动作精准还原
一段音频+一张照片,瞬间照片里的人就能开始讲话了。 生成的讲话动画不但口型和音频能够无缝对齐,面部表情和头部姿势都非常自然而且有表现力。 而且支持的图像风格也非常的多样,除了一般的照片,卡通图片,证件照等生成的效果都非常自然。 再加上多语言的支持,瞬间照...
-
467亿参数MoE追平GPT-3.5!爆火开源Mixtral模型细节首公开,中杯逼近GPT-4
今天,Mistral AI正式放出了Mixtral 8x7B的技术细节—— 在大多数基准测试中,Mixtral的表现不仅优于Llama 2 70B,而且推理速度提高了整整6倍! 尤其是,它在大多数标准基准测试上与GPT-3.5打平,甚至略胜一筹。 新开源...
-
Stability AI推出Stable Diffusion XL 1.0,文本到图像模型
Stability AI宣布推出Stable Diffusion XL 1.0,这是一个文本到图像的模型,该公司将其描述为迄今为止“最先进的”版本。 Stability AI表示,SDXL 1.0能生成更加鲜明准确的色彩,在对比度、光线和阴影方面做了增强...
-
FaceChain V2,Human AIGC开源应用平台
一、概览简介: facechain是一个可以用来打造个人数字形象的深度学习模型工具平台。用户仅需要提供最低一张照片即可获得属于自己的个人形象数字替身。结合不同的风格模型和写真模版,可以生成超乎想象空间的个人写真作品。更有意思的是,facecha...
-
Learn Prompt-Midjourney 图片生成
简介 随着 ChatGPT 的爆火,越来越多的人开始关注并尝试 AI 相关的应用。而图片生成就是其中一个备受瞩目的领域。目前已经有许多图像生成工具,如 Midjourney,Stable Diffusion,DALL-E,Firefly等。本课程主要是以...
-
Pika 1.0首测秒杀Gen-2!网友抢先体验电影级炸裂效果,背后技术细节首公开
Pika 1.0正式上线后,拿到内测资格的网友们已经玩疯了! 有人用它生成了一个姜黄色头发女孩和她的姜黄色猫的短片。 以往,因为一致性的难题,用AI视频很难做出优秀的动漫作品。但是Pika 1.0,实在是太给人惊喜了! 更令人震惊的是,作者表示,这是10...
-
在 Mac M1 上运行 Llama 2 并进行训练
在 Mac M1 上运行 Llama 2 并进行训练 Llama 2 是由领先的人工智能研究公司 Meta (前Facebook)开发并发布的下一代大型语言模型 (LLM 。 它基于 2 万亿个公共数据 token 进行了预训练,旨在帮助开发人员和...
-
强大到离谱!硬核解读Stable Diffusion(完整版)
原文链接: 硬核解读Stable Diffusion(完整版) 2022年可谓是AIGC(AI Generated Content)元年,上半年有文生图大模型DALL-E2和Stable Diffusion,下半年有OpenAI的文本对话大模型Ch...
-
数据资产入表在即,企业如何把握机遇,进行数据资产管理?
数据作为新时代重要的生产要素之一,数据资产化的相关工作正在提速。自今年10月1日起,中国资产评估协会制定的《数据资产评估指导意见》正式施行。同时,《企业数据资源相关会计处理暂行规定》近期转为正式稿,也将于明年1月1日起施行。 《暂行规定》规定:企业使用的...
-
AI绘画后面的论文——ControlNet:Adding Conditional Control to Text-to-Image Diffusion Models
AI绘画后面的论文——ControlNet:Adding Conditional Control to Text-to-Image Diffusion Models 代码:lllyasviel/ControlNet: Let us control di...
-
文本生成图像工作简述4--扩散模型、自回归模型、生成对抗网络的对比调研
基于近年来图像处理和语言理解方面的技术突破,融合图像和文本处理的多模态任务获得了广泛的关注并取得了显著成功。 文本生成图像(text-to-image)是图像和文本处理的多模态任务的一项子任务,其根据给定文本生成符合描述的真实图像,具有巨大的应用潜力,如...
-
探索AIGC人工智能(Midjourney篇)(四)
文章目录 Midjourney模特换装 Midjourney制作APP图标 Midjourney网页设计 Midjourney如何生成IP盲盒 Midjourney设计儿童节海报 Midjourney制作商用矢量插画 Midjou...
-
AI 绘画Stable Diffusion 研究(九)sd图生图功能详解-老照片高清修复放大
大家好,我是风雨无阻。 通过前面几篇文章的介绍,相信各位小伙伴,对 Stable Diffusion 这款强大的AI 绘图系统有了全新的认知。我们见识到了借助 Stable Diffusion的文生图功能,利用简单的几个单词,就可以生成完美的图片。本期我...
-
一夜爆火!4人公司半年打造估值2亿的AI视频工具,撼动Runway地位
谁能想到,短短一周内AI视频生成工具一连炸场两次。 上周二,Stability AI刚发布首个开源AI视频模型Stable Video Diffusion(SVD),后脚Pika本周二发布了第一个正式产品:Pika1.0。 这次Pika1.0比SVD还炸裂...
-
LCM:大大加快生成高质量图像的新方法
作者丨Mike Young 译者 | 布加迪 审校 | 重楼 出品 | 51CTO技术栈(微信号:blog51cto) 图片 得益于一种名为潜在一致性模型(LCM)的新技术,文本转换成图像的AI即将迎来重大飞跃。潜在扩散模型(LDM)等传统方法在使用...
-
Midjourney 参数合集
探索Midjourney之旅,学习绘画与AI,一同成长。加入「阿杰与AI」公众号,参与内容社群建设。 1.Midjourney 新手快速起步指南 2.Prompts-提示指令 3.Explore Prompting-提示指令的探索 4.Blend-叠加...
-
AI生成视频入局新卷王,上线不到48小时,网友“大片”刷屏X
AI视频生成工具卷起来了! 本周二,Stability AI低调发布了首个开源AI视频模型Stable Video Diffusion(以下简称SVD),同时还晒出测试数据称,SVD的模型性能碾压RunwayML、Pika Labs等领先的闭源商业模型。...
-
【送书福利-第二十八期】《AIGC:让生成式AI成为自己的外脑》
? 作者介绍:我是程序员洲洲,一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主、前后端开发、人工智能研究生。公粽号:程序员洲洲。 ? 本文专栏:本文收录于洲洲的《送书福利》系列专栏,该专栏福利多多,只需...
-
Stable Diffusion教程
什么是Stable Diffusion Stable Diffusion是一种潜在扩散模型(Latent Diffusion Model),能够从文本描述中生成详细的图像。它还可以用于图像修复、图像绘制、文本到图像和图像到图像等任务。简单地说,我们只要...
-
图片变视频只需一“指”!Gen-2运动笔刷免费上线,网友:史上最强更新
“指”哪动哪,Gen-2全新“神笔马良”功能宣布正式上线: 所有用户包含免费账户(划重点)都能体验。 它的正式名叫“运动笔刷”(Motion Brush),十天前预告的时候就爆火。 只需对着图像任意位置一刷,就能让静止的一切物体动起来。 如Runwa...
-
算法面试-深度学习基础面试题整理-AIGC相关(2023.9.01)
1、stable diffusion和GAN哪个好?为什么 ? Stable diffusion是一种基于随机微分方程的生成方法,它通过逐步增加噪声来扰动原始图像,直到完全随机化。然后,它通过逐步减少噪声来恢复图像,同时使用一个神经网络来预测下一步的噪...
-
Stable Diffusion系列(一):古早显卡上最新版 WebUI 安装及简单操作
文章目录 Stable Diffusion安装 AnimateDiff插件适配 sdxl模型适配 Stable Diffusion使用 插件安装 界面设置 基础文生图 加入lora的文生图 Stable Diffusion安...
-
OpenAI安全系统负责人长文梳理:大模型的对抗攻击与防御
随着 ChatGPT 的发布,大型语言模型应用正在加速大范围铺开。OpenAI 的安全系统团队已经投入了大量资源,研究如何在对齐过程中为模型构建默认的安全行为。但是,对抗攻击或 prompt 越狱依然有可能让模型输出我们不期望看到的内容。 目前在对抗攻击...
-
真正实现一步文生图,谷歌UFOGen极速采样,生成高质量图像
最近一年来,以 Stable Diffusion 为代表的一系列文生图扩散模型彻底改变了视觉创作领域。数不清的用户通过扩散模型产生的图片提升生产力。但是,扩散模型的生成速度是一个老生常谈的问题。因为降噪模型依赖于多步降噪来逐渐将初始的高斯噪音变为图片,因...
-
SDXL-Stable Diffusion改进版
文章目录 1. 摘要 2. 算法: 2.1 结构: 2.2 微小的条件机制 2.3 多宽高比训练 2.4 改进自编码器 2.5 所有组合放到一起 2.6 主流方案比较 3. 未来工作 4. 限制 论文: 《SDXL: Improv...
-
文心一言发布我怎么看?
文心一言发布我怎么看? 文心一言发布会 我只简短的回答两个问题: 补充: 文心一言发布会 有想看发布会视频的朋友,关注爱书不爱输的程序猿,私信找我拿 我只简短的回答两个问题: 1.文心一言能否为百度止颓?...
-
编程新时代:Amazon CodeWhisperer 助您轻松驾驭代码世界
文章目录 一、什么是 Amazon CodeWhisperer? 二、个人无限免费使用 三、安装配置 3.1 手把手教你在pycharm配置 3.2 同理在VSCODE安装 三、Pycharm上测试 3.1 根据注释写代码 3.2 检查修...
-
重磅!清华最新报告:文心一言超越ChatGPT 3.5
点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 今年国内厂商已发布很多大语言模型,其中最具代表性的产品有:百度的文心一言、阿里巴巴的通义千问、科大讯飞的星火等,最具代表性的开源工作有:ChatGLM、MOSS、Ba...
-
Meta生成式AI连放大招:视频生成超越Gen-2,动图表情包随心定制
提到视频生成,很多人首先想到的可能是 Gen-2、Pika Labs。但刚刚,Meta 宣布,他们的视频生成效果超过了这两家,而且编辑起来还更加灵活。 这个「吹小号、跳舞的兔子」是 Meta 发布的最新 demo。从中可以看出,Meta 的技术既支...
-
Stable Diffusion 原理介绍与源码分析(一)
Stable Diffusion 原理介绍与源码分析(一) 文章目录 Stable Diffusion 原理介绍与源码分析(一) 前言(与正文无关,可以忽略) 总览 说明 Stable Diffusion 整体框架 重要论文 重要组成...
-
实时文生图速度提升5-10倍,清华LCM/LCM-LoRA爆火,浏览超百万
文生图、图生图已经不是什么新鲜事。但在使用这些工具的过程中,我们发现它们通常运行缓慢,导致我们要等一段时间才能拿到生成结果。 但最近,一种名叫「LCM」的模型改变了这种情况,它甚至能做到实时的连续生图。 图源:https://twitter.com/...
-
手把手教你如何使用AI绘画:Stable-Diffusion本地化部署及使用教程
文章目录 前言 一、安装AI模型软件stable-diffusion-webui 1.环境安装 2.配置中文包 二、配置算法模型 1.配置底模型 2.LoRA的使用 3.配置精准控图模型 三、Prompt的魔法 1.定向提升图画质量 总...