Diffusion Models专栏文章汇总:入门与实战
StoryImager: A Unified and Efficient Framework for Coherent Story Visualization and Completion
本文介绍了一种名为StoryImager的新型统一高效框架,用于连贯的故事可视化和完成。该框架旨在基于故事情节生成一系列真实且连贯的图像。StoryImager通过双向生成能力,克服了现有模型在自回归生成方式、高计算成本和独立训练推断等方面的限制。它通过引入目标帧遮蔽策略、帧-故事交叉注意力模块和上下文特征提取器,提高了故事图像生成的质量和连贯性。