当前位置:AIGC资讯 > AIGC > 正文

每日AIGC最新进展(28):鹏城实验室提出连贯的故事生成框架StoryImager、浙大强化学习提升扩散模型生成质量算法PXPO、谷歌提出生成中文/日文/韩文字符的扩散模型

Diffusion Models专栏文章汇总:入门与实战

StoryImager: A Unified and Efficient Framework for Coherent Story Visualization and Completion

本文介绍了一种名为StoryImager的新型统一高效框架,用于连贯的故事可视化和完成。该框架旨在基于故事情节生成一系列真实且连贯的图像。StoryImager通过双向生成能力,克服了现有模型在自回归生成方式、高计算成本和独立训练推断等方面的限制。它通过引入目标帧遮蔽策略、帧-故事交叉注意力模块和上下文特征提取器,提高了故事图像生成的质量和连贯性。

更新时间 2024-06-25