阿里巴巴开源视频生成与编辑模型通义万相 Wan2.1-VACE

据《科创板日报》报道,阿里巴巴正式开源通义万相 Wan2.1-VACE,这是一款支持视频生成与编辑的模型,单一模型可同时支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全系列基础生成和编辑能力。

阿里巴巴开源视频生成与编辑模型通义万相 Wan2.1-VACE

据悉,本次共开源 1.3B 和 14B 两个版本,其中 1.3B 版本可在消费级显卡运行。

据1AI了解,通义万相是阿里云通义系列 AI 绘画创作大模型,可辅助人类进行图片创作,于 2023 年 7 月 7 日正式上线。在 2024 年 9 月 19 日的阿里云栖大会上,阿里发布了通义万相视频生成大模型。该模型可以生成影视级高清视频,而且更能听懂中国话。

值得注意的是,今年 1 月初通义万相视频生成模型宣布升级至 2.1 版,模型整体性能大幅提升,尤其是在处理复杂运动、还原真实物理规律、提升电影质感及优化指令遵循方面取得了显著进展。2 月 25 日,阿里巴巴宣布全面开源旗下视频生成模型万相 2.1 模型。

声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
资讯

速度最快:Stable Audio Open Small 端侧音频模型登场,手机上 8 秒内 AI生成 11 秒音频

2025-5-15 11:14:47

资讯

OpenAI 上线安全评估中心,定期公开 AI模型评估结果以提升透明度

2025-5-15 17:58:05

搜索