字节跳动团队在arXiv上发布了一篇论文,介绍了他们推出的视频生成方法MagicVideo-V2。这种方法将文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块整合到一个端到端的视频生成流程中。通过这些架构设计,MagicVideo-V2能够生成高保真度和流畅度的高分辨率视频,并据称在大规模用户评估中表现超过了Gen-2等其他领先的文生视频系统。
论文地址:
https://arxiv.org/pdf/2401.04468
项目地址:
https://magicvideov2.github.io/