Diffusion Models专栏文章汇总:入门与实战
Event-based Video Frame Interpolation with Edge Guided Motion Refinement
视频帧插值,即在连续视频帧之间合成中间帧的过程,随着事件摄像机的使用已经取得了显著的进展。这些传感器具有微秒级的时间分辨率,通过提供精确的运动线索来填补帧之间的信息空白。然而,当代基于事件的视频帧插值(E-VFI)技术往往忽略了这样一个事实,即在多模态特征融合过程中,事件数据主要提供场景边缘的高置信度特征,从而削弱了事件信号在光流(of)估计和翘曲细化中的作用。为了解决这个被忽视的方面,我们引入了一种端到端的E-VFI学习方法(称为EGMR),以有效地利用事件信号的边缘特征进行运动流和扭曲增强。我们的方法结合了一个边缘引导注意(EGA)模块,该模块基于多模态特征的局部相关性,采用粗到精的策略,通过注意聚合来校正估计的视频运动。此外,考虑到