小米深夜上线三大自研 MiMo-V2 系列模型

3 月 19 日消息,今天凌晨,小米集中发布了 MiMo V2 系列三款模型:旗舰语言基座 MiMo-V2-Pro、全模态 Agent 基座 MiMo-V2-Omni,以及语音合成模型 MiMo-V2-TTS。

小米深夜上线三大自研 MiMo-V2 系列模型

MiMo-V2-Pro:

总参数量超过 1T,激活参数为 42B,采用混合注意力(Hybrid Attention)架构,混合比例从前代的 5:1 提升至 7:1,并支持 1M 超长上下文窗口;

在 OpenClaw、Claude Code 等智能体框架中,可在无人工干预条件下完成复杂工作流编排、长程规划与精准工具调用;

Coding 能力方面,小米内部工程师评测体感接近 Claude Opus 4.6,具备更强的系统设计与任务规划能力;

API 定价为 Claude 同级模型的约 1/5,256K 上下文以内输入 $1 / 百万 token,输出 $3 / 百万 token;1M 上下文以内输入 $2 / 百万 token,输出 $6 / 百万 token。

MiMo-V2-Omni 则是小米首个在基座层面统一感知与行动的全模态模型,融合文本、视觉与语音输入,支持 256K 上下文,定价为输入 $0.4 / 百万 token,输出 $2 / 百万 token。

官方宣称其音频理解综合表现超越 Gemini 3 Pro,图像理解超越 Claude Opus 4.6;在实际应用场景中,MiMo-V2-Omni 可结合 OpenClaw 框架实现浏览器自动化操作,包括跨平台比价下单、短视频制作与发布等端到端任务。

MiMo-V2-TTS 语音合成模型支持从整体风格到句内局部情绪的多粒度控制,能够自然处理标点、语气词等格式信号,并支持东北话、四川话、粤语等多种方言,以及角色扮演式风格化演绎和歌声合成。

三款模型均已接入金山 WPS 灵犀,MiMo-V2-Pro 同步上线小米手机端 Agent 产品 miclaw 及小米浏览器。

声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
资讯

Kimi 首披 K2.5 技术路线图:三大底层重构,马斯克点赞「令人印象深刻」

2026-3-19 12:14:16

资讯

黄仁勋:Token 将成为企业预算标配,智能体时代算力消耗将爆发式增长

2026-3-19 12:18:07

搜索