-
谷歌DeepMind新方法Gecko,为测试AI图像生成器引入严格新标准
谷歌 DeepMind 最近的研究示了当前我们对文本到图像 AI 模型性能评估的隐藏局限性。在其发布在预印本服务器 ariv 上的研究中,他们引入了一种全新的方法称为 “Gecko”,承诺提供一个更全和可靠的基准,以评估这一蓬勃发展的技术。 研究团队在其...
-
“地表最强”文生视频模型?Sora 背后有何秘密?
自 2022 年底 ChatGPT 的横空出世,人工智能再度成为全世界的焦点,基于大语言模型(LLM)的 AI 更是人工智能领域的“当红炸子鸡”。此后的一年,我们见证了 AI 在文生文、文生图领域的飞速进展,但在文生视频领域发展相对较慢。而在 2024 年...
-
中国首个Sora级大模型Vidu:文本生成16秒,1080p高清视频
4月27日,在2024中关村论坛-未来人工智能先锋论坛上,清华大学联合生数科技正式发布了,中国首个长时间、高一致性、高动态性视频大模型——Vidu。 据悉,Vidu采用了原创的Diffusion与Transformer融合的架构U-ViT,支持文本生成长达...
-
无界AI算法总监邹国平:Midjourney领跑,没有标准答案的文生图,下半场还能怎么卷?
撰稿 | 李美涵 采访 | 云昭 嘉宾 | 邹国平 出品 | 51CTO技术栈(微信号:blog51cto) 进入2024,AI应用落地的步伐悄然加速。 AI文生图产品——连接着千行百业的设计需求,极大地压缩了创意实现的周期——正成为快速掘金的AI领域之...
-
关于面向机器人操作的世界模型的一点思考
最近世界模型的火热似乎能在机器人操作中起到一些至关重要的作用。而对于具身智能来说,现阶段manipulation是最需要突破的点。特别是针对以下long horizon的任务,如何构建机器人“小脑”,来实现各种复杂的操作要求,是当下最需要解决的问题。 是...
-
国际顶尖水平!首个Sora级国产自研视频大模型Vidu发布
快科技4月28日消息,在2024中关村论坛年会未来人工智能先锋论坛上,生数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型Vidu。 这也是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,还在加速迭代提升中。...
-
清华团队发布视频大模型Vidu 可生成16 秒、1080P 视频
生数科技与清华大学在中关村论坛未来人工智能先锋论坛上共同发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。这款模型是国内首个达到Sora级别的视频大模型,标志着中国在视频生成技术领域的重要进展。 Vidu的主要特点和技术创新包括: 模型结构...
-
终局之战!OpenAI Sora大佬专访:AI视频模型仍处在GPT-1时代
【新智元导读】Sora一出,谁与争锋!近日,Sora团队的三位负责人Aditya Ramesh、Tim Brooks和Bill Peebles接受了采访,解读了Sora在模拟现实、预测结果和丰富人类体验等方面带来的变革。 对于视频生成领域,大家一致的看法就...
-
清华团队国产“Sora”火了:生数科技发布视频大模型「Vidu」
在中关村论坛的未来人工智能先锋论坛中,生数科技与清华大学携手,正式推出了中国首个具备长时长、高一致性及高动态性的视频大模型——“Vidu”。 这款引领时代的视频大模型,其核心在于团队原创的Diffusion与Transformer融合的U-ViT架构。它不...
-
探讨自回归模型和扩散模型的发展应用
在当前大模型驱动的内容创新浪潮中,人工智能产业正以前所未有的力度拥抱一场由大模型技术策动的科技革新运动。这场革命不仅重塑了人机交互的边界,使其跃升至更高层次的认知协作,而且正在颠覆传统的计算思维与执行模式,催生出全新的计算范式,从而深刻地渗透并革新各行各...
-
AI日报:阿里对口型视频项目EMO开启内测;苹果官宣端侧小模型OpenELM;Open-Sora偷偷升级;微信发布AI工具小微助手
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、阿里对口型项目EMO开启内测...
-
融汇14个AI工具构建完美应用
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 上篇:融汇11款AI工具构建完美应用 如您所见,人工智能(AI)应用在近年来得到了长足的发展。从语音助手到软件开发,人工智能已在我们...
-
CVPR 2024 | 面向真实感场景生成的激光雷达扩散模型
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:Towards Realistic Scene Generation with LiDAR Diffusion Models 论文链接:https://hancyran.github.io/a...
-
这个AI赛道,一个月内融资4笔,一大半的创始人是华人
声明:本文来自微信公众号“白鲸出海”(ID:baijingapp),作者:张凯然,授权站长之家转载发布。 仅在2024年3月一个月,就有三个华人创立的 AI 视频生成创企获得了融资,而且融资额都过了千万美金。 1、3月7日,总部位于英国伦敦的Haiper宣...
-
PR+AI重新定义视频剪辑,Sora、Pika全接入,AI视频创企还有的玩吗?
还记得网友们用PS的Generative Fill花式整活的盛况吗? 接下来,被网友玩坏的可能要轮到PR了。 无论你是专业的视频剪辑师,还是业余爱好者,对Premiere Pro(简称PR)这款软件都一定不陌生。 前几天,Adobe官方发布了一条视频,快...
-
90后二次元北大校友做出AI漫画创作工具,融资千万
AI绘画已经火了两年,但仍有一群人并不满意。 对于他们,仅仅是一张极尽精致的图片还不够,他们希望为画中的人物赋予更完善的性格、好恶、身世、人际关系、世界观,让Ta有血有肉,仿佛真实存在。 “这就是为什么我们的产品叫做‘AI驱动的角色幻想创作平台’,而非AI...
-
药物分子设计新策略,微软条件扩散模型DiffLinker登Nature子刊
药理学领域的化学空间高达 10^60,在广阔的化学空间中进行搜索,给药物设计带来了巨大的挑战。 基于片段的药物发现一直是早期药物开发的有效范例。然而,该领域面临的一个挑战是,如何设计断开的感兴趣分子片段之间的连接子(linker),生成化学上合理的候选药...
-
Stability AI宣布裁员20人,约占员工总数的10%
英国 AI 公司Stability AI 宣布裁员20人,占其员工总数的约10%。此前一天,该公司刚刚宣布扩大其旗舰模型的使用范围。 这一裁员决定是在其创始 CEO 离职后的动荡几周之后做出的。据 CNBC 报道,这家总部位于英国的 AI 公司运行着稳定扩...
-
自回归超越扩散!北大、字节 VAR 范式解锁视觉生成 Scaling Law
新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了!使 GPT 风格的自回归模型在图像生成首次超越扩散模型,并观察到与大语言模型相似的 Scaling Laws 缩放定律、Zero-shot Task General...
-
LiDAR仿真新思路 | LidarDM:助力4D世界生成,仿真杀器~
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:LidarDM: Generative LiDAR Simulation in a Generated World 论文链接:https://arxiv.org/pdf/2404.02903....
-
扩散模型如何帮助创建更好的强化学习系统
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 扩散模型以其令人印象深刻的生成高质量图像的能力而闻名,它们是流行的文本到图像模型(例如DALL-E、Stable Diffusion和...
-
ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验
一、ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验 ROCm:一个可移植、高性能的GPU计算平台 随着AI时代的来临,显卡的作用不再仅仅只局限于游戏,特别是在Stable Diffusion火爆全网之后,越来越多的玩家...
-
雨云GPU云服务器搭建SD(Stable Diffusion)的教程,搭建自己的AI绘画网站,AIGC
Stable Diffusion是什么 Stable Diffusion是一种基于潜在扩散模型(Latent Diffusion Models)的文本到图像生成模型,由CompVis、Stability AI和LAION的研究人员和工程师共同创建。...
-
巧用Stable Diffusion,实现不同风格的LOGO设计|实战篇幅,建议收藏!
大家好,我是程序员晓晓 Logo,作为品牌的视觉核心,其重要性不言而喻。它不仅是品牌的标识,更是品牌精神和文化的体现。一个成功的Logo能够简洁而有力地传达品牌的信息和特质,使消费者在短时间内就能对品牌产生深刻的印象。 在Logo的设计过程中,极简与象...
-
Ai绘画工具,Stable Diffusion插件使用攻略
今天给大家分享一下Stable Diffusion的插件使用攻略。 一、什么是插件 Stable Diffusion的插件主要是用来丰富SD的一些功能,例如C站助手,提示词助手,图片信息助手等插件都是为了增强SD的实用性。 二、安装插件 我...
-
耗时半个月!超详细的保姆级Stable Diffusion使用教程,终于整理出来了!
大家好,我花了很长时间终于整理好了这份SD的使用教程! 从手把手安装部署Stable Diffusion,到SD的界面功能讲解,再到如何运用Stable Diffusion进行实战案例的制作,每一步都手把手教你!希望大家看完也能立刻做出一样效果的AI作品...
-
AI绘图哪家强?50款AI绘图软件大盘点【内附Midjourney保姆级上手教程】
2023年是AI爆炸发展的一年。在ChatGPT、Midjourney推出后,各路AI产品如同雨后春笋一般争先发布。 今天就为大家盘点一下,目前世面上比较火的24款AI绘图软件,并附上Midjourney最新注册教程以及使用方法! Midjourn...
-
Stable Diffusion生成诗词背景图
文章目录 安装Stable Diffusion 使用整合包 功能讲解 生成诗词背景图 API调用 安装Stable Diffusion 网上有许多大神整合的 Stable Diffusion 整合包,这里可以到B站下载秋叶的整合包...
-
得物 AIGC 算法岗(日常实习生) 面经分享
节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 最大的感受就是,今年的算法面试...
-
文生图——stable diffusion生成有趣的动漫图像
Stable Diffusion是一个文本转图像的模型,由CompVis、Stability AI和LAION共同开发。它能够从一段简单的文本输入中快速生成相应的图像。此外,它还可以导入图像并配合文本对其进行处理。从技术角度来看,Stable Diffus...
-
英特尔突袭英伟达H100,新AI芯片训练快40%,推理快50%,CEO蹦迪庆祝
英特尔,开始正面硬刚英伟达了。 就在深夜,英特尔CEO帕特·基辛格手舞足蹈地亮出了最新AI芯片——Gaudi 3: 他为什么开心到现场直接蹦迪? 看下Gaudi 3的性能结果,就一目了然了: 训练大模型:比英伟达H100快40% 推理大模型:比英伟...
-
如何写好Stable Diffusion的prompt
Stable Diffusion是一种强大的文本到图像生成模型,其效果在很大程度上取决于输入的提示词(Prompt)。以下是一些关于如何编写有效的Stable Diffusion Prompt的秘诀: 明确描述:尽量清晰地描述你想要的图像内容。使...
-
神仙掐架!24届视觉算法岗(AIGC方向)秋招经验分享!
节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 今天我来介绍我们星球社群一位很...
-
宝藏AI绘画工具,国内能打开使用Midjourney接口,无限制数量,新手免费体验!
前言 自从AI火了之后,各式各样的 AI 网站和工具层出不穷,像是比较出名的 ChatGPT、Midjourney、Stable Diffusion 等,全网几乎都在聊。 网上超级多的博主打着免费的幌子推荐各种杂七杂八的AI网站,结果都是收费的而且有...
-
Diffusion-RWKV官网体验入口 AI生成高质量图像工具使用地址
Diffusion-RWKV是一种基于RWKV架构的扩散模型,旨在提高扩散模型的可扩展性。它针对图像生成任务进行了相应的优化和改进,可以生成高质量的图像。该模型支持无条件和类条件训练,具有较好的性能和可扩展性。 点击前往Diffusion-RWKV官网体...
-
AI绘图:Stable Diffusion ComfyUI局部重绘与智能扩图全面教程
前言 在数字艺术创作中,局部重绘和智能扩图是两个非常重要的功能。局部重绘允许我们在保留原有图像的基础上,对特定区域进行修改或创新。而智能扩图则能够帮助我们在图像的边缘添加新的元素,从而扩展图像的内容。本文将详细介绍如何在Stable Diffusion...
-
零基础搭建Stable Diffusion绘图环境
本节将介绍如何部署Stable Diffusion 绘图环境。部署Stable Diffusion绘图环境有两种方式: 云端部署:云端部署不需要特殊的网络设置,对电脑配置也没有要求。平均花费是1~2块钱/小时。 本地部署:本地部署在自己的电脑上安装...
-
AIGC-Stable Diffusion发展及原理总结
目录 一. AIGC介绍 1. 介绍 2. AIGC商业化方向 3. AIGC是技术集合 4. AIGC发展三要素 4.1 数据 4.2 算力 4.3 算法 4.3.1 多模态模型CLIP 4.3.2 图像生成模型 二. Stable...
-
AI绘图cuda与stable diffusion安装部署始末与避坑
stable diffusion的安装说起来很讽刺,最难的不是stable diffusion,而是下载安装cuda。下来我就来分享一下我的安装过程,失败了好几次,几近放弃。 一、安装cuda 我们都知道cuda是显卡CPU工作的驱动(或者安装官网的...
-
【从零开始AI绘画2】StableDiffusionWebUI的基础使用
StableDiffusionWebUI的基础使用 第一章中已经完成了SDwebui的部署已经初始化,接下来我们开始基础使用,涉及更细节高级的功能本文暂时不写 文章目录 StableDiffusionWebUI的基础使用 界面简介...
-
基于Stable Diffusion的智能绘画大模型
随着人工智能技术的不断发展,AI艺术也在逐渐崭露头角。其中,基于Stable Diffusion的智能绘画大模型更是成为了AI艺术领域的一大亮点。那么,什么是Stable Diffusion?它又是如何应用于智能绘画大模型中的呢?本文将为您一一解答。 首...
-
尝试着在Stable Diffusion里边使用SadTalker进行数字人制作
首先需要标明的是,我这里是图片说话类型,而且是看了知识星球AI破局俱乐部大航海数字人手册进行操作的。写下这篇文章是防止我以后遗忘。 我使用的基础软件是Stable Diffusion,SadTalker是作为插件放进来的,需要注意的是这对自己的电脑GPU要...
-
完整指南:如何使用 Stable Diffusion API
Stable Diffusion 是一个先进的深度学习模型,用于创造和修改图像。这个模型能够基于文本描述来生成图像,让机器理解和实现用户的创意。使用这项技术的关键在于掌握其 API,通过编程来操控图像生成的过程。 在探索 Stable Diffusion...
-
Stability AI发布CosXL模型 图像处理能力更精细
Stability AI 最近推出了CosXL模型,这是一项包括基础版CoXL和增强版Edit CosXL的创新技术。这些模型的发布,标志着图像生成和编辑技术的新里程碑,为用户提供了更加强大和精细的图像处理能力。 Cos Stable Diffusion...
-
Nightshade:使AI模型在未经许可的情况下无法训练图片
据报道,芝加哥大学的研究人员开发了一种名为Nightshade的工具,旨在防止未经许可的AI图像生成。该工具可以使AI图像生成器无法使用未经许可的图像进行训练,从而保护了艺术家和版权所有者的作品。 Nightshade的工作原理是在图像中添加隐藏信息,这...
-
【阿里云PAI】基于阿里云使用Stable Diffusion XL Turbo模型和DiffSynth UI实现AI作画
文章目录 @[toc] 教程简述 答疑交流群 使用PAI-DSW快速启动SD WebUI 1. 准备环境和资源 1.1. 领取交互式建模PAI-DSW免费试用权益 1.2. 创建PAI-DSW实例 1.3. 在DSW中打开教程文...
-
Stable Diffusion WebUI 生成参数:宽度/高度/生成批次/每批数量/提示词相关性/随机种子
本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里。 大家好,我是水滴~~ 本文将继续了解 Stable Diffusion WebUI 的生成参数,主要内容有:宽度、高度、生成批次、每批数量、提示词相关性、随机种子。希望能对你有所帮助。...
-
你在小红书上关注的美女博主,可能是AI
在近年来,虚拟偶像、虚拟主播(VTuber)似乎已经不是什么新鲜事,人们就算没有成为虚拟偶像的粉丝,也一定都曾听说过初音未来的名字。只不过,一提及“初音未来们”,人们脑海里首先出现的标签或许还是“二次元”。但如今,在小红书等社交平台,一大批AI博主正凭借足...
-
6个强大且好看的AI绘画网站,各种美女随便生成
1、AI绘画 https://www.gaituya.com/aiimg/ 一个比较专业的文字生成图片网站,支持输入各种文字生成好看的图片,包括漫画、二次元、3D科幻、风景等类型的图片都能一键生成,并且还支持自定义选择文本匹配度。 生成的方法很简单...
-
AI绘画工具Stable Diffusion神级插件:提示词
大家好,我是程序员晓晓 很多同学之所以做不出高质量的图片,很大程度上是由于不知道怎么写提示词,常常面对词穷的窘境,要么不知道该写点啥,要么翻译出来的英文不是很贴切。今天我就给大家分享几个Stable Diffusion WebUI的提示词插件。 sd...