Sand AI 发布开源视频生成模型 MAGI-1,清华特奖得主团队视频生成AI一夜刷屏

视频生成领域,又出现一位重量级开源选手。 2025 年 4 月 21 日,马尔奖、清华特奖得主曹越的创业公司 Sand AI 推出了自己的视频生成大模型 ——MAGI-1。这是一个通过自回归预测视频块序列来生成视频的世界模型,生成效果自然流畅,还有多个版本可以下载。

 

Sand AI 发布开源视频生成模型 MAGI-1,清华特奖得主团队视频生成AI一夜刷屏

根据官方介绍,MAGI-1 生成的视频具有以下特点:

1、流畅度高,不卡顿,可以无限续写。它可以一镜到底生成连续的长视频场景,没有尴尬的剪辑或奇怪的拼接,就像电影一样流畅自然。

2、精准时间轴控制。MAGI-1 是唯一具有秒级时间轴控制的模型 —— 你可以按自己设想的那样,精准地雕琢每一秒。

3、运动更加自然,更有生机。不少 AI 生成的视频,画面动作不是慢吞吞,就是僵硬死板、幅度过小。Magi-1 克服了这些问题,生成的动作更加流畅、有活力,且场景切换更加顺滑。

MAGI-1 基于扩散变换器架构,引入块因果注意力、并行注意力块、Sandwich 规范化等技术创新,通过分块生成(每块 24 帧)实现高效视频生成。其独特流水线设计支持并行处理,最多可同时生成四个块,大幅提升效率。

该模型采用 Apache 2.0 许可,代码、权重和推理工具已在 GitHub 和 Hugging Face 开放,为全球开发者提供强大创作工具。

模型通过快捷蒸馏技术,支持灵活的推理预算,并在物理行为预测和时间一致性上表现优异,适用于长篇叙事和复杂动态场景。MAGI-1 的“无限视频扩展”功能允许无缝延长视频内容,结合“秒级时间轴控制”,用户可通过逐块提示实现场景转换和精细化编辑,满足影视制作、讲故事等需求。

在图像到视频任务中,模型展现出高保真输出,原生分辨率达 1440x2568px,动作流畅、细节逼真。作为开源模型,MAGI-1 提供 Docker 部署支持,24B 参数版本需 8 张 H100 GPU,未来 4.5B 版本将适配单张 RTX 4090,降低使用门槛。

社区反馈称赞其生成质量和指令遵循能力,评分超 Kling 1.6 和 Wan 2.1,但在非现实风格内容上仍有优化空间。

在竞争激烈的视频生成领域,MAGI-1 以开源和自回归架构脱颖而出。Sand AI 计划推出更轻量化版本,并深化硬件优化,未来或推动实时生成、虚拟现实等应用。

Github Page: https://github.com/SandAI-org/Magi-1

Hugging Face: https://huggingface.co/sand-ai/MAGI-1

声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
资讯

苹果 Siri 团队大换血:AI 浪潮下,新负责人能否力挽狂澜?

2025-4-23 11:24:39

资讯

英伟达发布 Eagle 2.5 视觉语言AI模型:8B 参数媲美 GPT-4o

2025-4-23 17:42:29

搜索