图像任务 - AIGC资讯

【学习笔记】文生图模型——Stable diffusion3.0

2.0原理才看到VAE，sd3.0就发布了，虽然还没看到源码和详解，但原来的那个小方向估计得弃。人已经麻了。 1.LDMs模型（stable diffusion≈LDMs+CLIP） 2.stable diffusion3.0模型架构图...

生成式AI 2024-06-19 人工智能

1398阅读

stablediffusion种的vae作用是什么? Stable Diffusion 是一种基于变分自编码器（VAE）的深度学习模型，其作用主要是用于文本生成图像。具体来说，VAE是一种生成模型，可以学习到数据的潜在表示空间，并将其用于生成...

AIGC 2024-02-01 人工智能

1309阅读

1、生成模型首先回顾一下生成模型要解决的问题：如上图所示，给定两组数据z和x，其中z服从已知的简单先验分布π(z （通常是高斯分布），x服从复杂的分布p(x （即训练数据代表的分布），现在我们想要找到一个变换函数f，它能建立一种z到x的映射f:z...

生成式AI 2024-01-23 人工智能

1505阅读

Sam Altman在整个AI领域，乃至整个科技领域都被看作是极具影响力的存在，而2023年OpenAI无限反转的宫斗事件更是让Sam Altman刷足了存在感，他甚至被《时代》杂志评为“2023年度CEO”。也正因此， Sam Altman的一条推文，...

大数据 2024-01-15 人工智能

983阅读

字节&复旦大学多模态理解大模型来了：可以精确定位到视频中特定事件的发生时间。比如在下面这个视频中：狗子转身看镜头时的时间戳是多少？什么时候用爪子推开滑板？在这里，视频中的宝宝什么时候推起眼镜、舒展了一下身体？又是什么时候翻的书？对...

生成式AI 2024-01-15 人工智能

828阅读

文章目录 Zero-Shot Text-to-Image Generation 一. 简介二. 方法 2.1. 第一阶段：Learning the visual codebook 2.1.1 回顾VQ-VAE 2.1.2...

生成式AI 2024-01-13 人工智能

941阅读

本文经自动驾驶之心公众号授权转载，转载请联系出处。腾讯AI实验室与港中文联合团队提出了一种新的CNN架构，图像识别精度和速度都超过了Transformer架构模型。切换到点云、音频、视频等其他模态，也无需改变模型结构，简单预处理即可接近甚至超越SO...

生成式AI 2023-12-28 人工智能

881阅读

在Transformer占据多模态工具半壁江山的时代，大核CNN又“杀了回来”，成为了一匹新的黑马。腾讯AI实验室与港中文联合团队提出了一种新的CNN架构，图像识别精度和速度都超过了Transformer架构模型。切换到点云、音频、视频等其他模态，也无...

生成式AI 2023-12-25 人工智能

902阅读

用计算机视觉模型生成各种各样的图片已经不是什么新鲜的事了，但是最近新出的一款AI绘画模型Stable Diffusion确实惊艳到了各位小伙伴，无论是从软件的使用难度还是绘画生成的结果，都有可圈可点的地方，下面我们就一起尝试用该AI绘画软件画出一幅精美的图...

生成式AI 2023-12-08 人工智能

913阅读

Learning A Sparse Transformer Network for Effective Image Deraining 基于Transformer的方法在图像去雨任务中取得了显著的性能，因为它们可以对重要的非局部信息进行建模，这对...

生成式AI 2023-11-16 人工智能

919阅读

在模型与人类意图对齐方面，根据人类反馈的强化学习（RLHF）已经成为一大流行范式。通常来说，RLHF 算法的工作过程分为两个阶段：一、使用人类偏好学习一个奖励函数；二、通过使用强化学习优化所学习的奖励来对齐模型。 RLHF 范式假定人类偏好的分布遵照奖励...

生成式AI 2023-11-13 人工智能

939阅读