Diffusion Models专栏文章汇总:入门与实战
ConCLVD: Controllable Chinese Landscape Video Generation via Diffusion Model
中国山水画是中国文化艺术传统的瑰宝,通过画家的深刻观察和想象力展示了自然的壮丽景色。受传统技术的限制,这些艺术作品在古代局限于静态图像,将风景的动态和艺术情感的微妙之处留给了观者的想象力。近年来,新兴的文本到视频(T2V)扩散方法在视频生成方面表现出了显著的潜力,为创作动态的中国山水画提供了希望。然而,诸如缺少特定数据集、艺术风格的复杂性以及创作广泛、高质量视频等挑战,让这些模型在生成中国山水画视频方面面临着困难。在本文中,我们提出了CLV-HD(Chinese Landscape Video-High Definition),这是一种用于中国山水画视频的新颖T2V数据集,以及一种利用稳定扩散的T2V模型ConCLVD(Controllable Chinese Landscape Video Diffusion)。具体而言,我们提出了一个动态模块,具有双重注意机制,以