来自字节跳动的团队在arXiv上发表论文,推出视频生成方法MagicVideo-V2。该方法将文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块整合到一个端到端的视频生成流程中。通过这些架构设计,MagicVideo-V2能够生成高保真度和流畅度的高分辨率视频,据称在大规模用户评估中表现超过Gen-2等领先文生视频系统。
论文地址:arxiv.org/pdf/2401.04468
项目地址:magicvideov2.github.io/
本文地址:https://www.163264.com/6087