小米深夜上线三大自研 MiMo-V2 系列模型

资讯
3月19日
編輯

admin

3 月 19 日消息，今天凌晨，小米集中发布了 MiMo V2 系列三款模型：旗舰语言基座 MiMo-V2-Pro、全模态 Agent 基座 MiMo-V2-Omni，以及语音合成模型 MiMo-V2-TTS。

MiMo-V2-Pro：

总参数量超过 1T，激活参数为 42B，采用混合注意力（Hybrid Attention）架构，混合比例从前代的 5:1 提升至 7:1，并支持 1M 超长上下文窗口；

在 OpenClaw、Claude Code 等智能体框架中，可在无人工干预条件下完成复杂工作流编排、长程规划与精准工具调用；

Coding 能力方面，小米内部工程师评测体感接近 Claude Opus 4.6，具备更强的系统设计与任务规划能力；

API 定价为 Claude 同级模型的约 1/5，256K 上下文以内输入 $1 / 百万 token，输出 $3 / 百万 token；1M 上下文以内输入 $2 / 百万 token，输出 $6 / 百万 token。

MiMo-V2-Omni 则是小米首个在基座层面统一感知与行动的全模态模型，融合文本、视觉与语音输入，支持 256K 上下文，定价为输入 $0.4 / 百万 token，输出 $2 / 百万 token。

官方宣称其音频理解综合表现超越 Gemini 3 Pro，图像理解超越 Claude Opus 4.6；在实际应用场景中，MiMo-V2-Omni 可结合 OpenClaw 框架实现浏览器自动化操作，包括跨平台比价下单、短视频制作与发布等端到端任务。

MiMo-V2-TTS 语音合成模型支持从整体风格到句内局部情绪的多粒度控制，能够自然处理标点、语气词等格式信号，并支持东北话、四川话、粤语等多种方言，以及角色扮演式风格化演绎和歌声合成。

三款模型均已接入金山 WPS 灵犀，MiMo-V2-Pro 同步上线小米手机端 Agent 产品 miclaw 及小米浏览器。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

小米深夜上线三大自研 MiMo-V2 系列模型

Kimi 首披 K2.5 技术路线图：三大底层重构，马斯克点赞「令人印象深刻」

黄仁勋：Token 将成为企业预算标配，智能体时代算力消耗将爆发式增长

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

Kimi 首披 K2.5 技术路线图：三大底层重构，马斯克点赞「令人印象深刻」

黄仁勋：Token 将成为企业预算标配，智能体时代算力消耗将爆发式增长

小米突然发布新模型：媲美 DeepSeek-V3.2

小米影像大脑全面升级为 AISP，号称“首个 AI 大模型计算摄影平台”

印度提出新要求：科技公司发布生成式AI工具之前，需获得政府许可

消息称雷军亲自重金招募大模型领军人才，DeepSeek 罗福莉将加入小米

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注