面壁发布新一代多模态模型MiniCPM-V 4.0:手机 App 就能用,图像理解超 GPT-4.1-mini

据 OpenBMB 开源社区消息,面壁智能小钢炮新一代多模态模型 MiniCPM-V 4.0 昨日正式开源。面壁发布新一代多模态模型MiniCPM-V 4.0:手机 App 就能用,图像理解超 GPT-4.1-mini

据悉,MiniCPM-V 4.0 依靠 4B 参数,取得在 OpenCompass、OCRBench、MathVista 等多个榜单上取得了同级 SOTA 成绩,且 实现了在手机上稳定、丝滑运行。

具体来看,MiniCPM-V 4.0 在 OpenCompass、OCRBench、MathVista、MMVet、MMBench V1.1、MMStar 等评测基准测试中,综合性能均为同级最高;在 OpenCompass 测评中,MiniCPM-V 4.0 综合性能超过 Qwen2.5-VL 3B 模型和 InternVL2.5 4B 模型,甚至可比肩 GPT-4.1-mini、 Claude 3.5 Sonnet。

MiniCPM-V 4.0 得益于独特的模型结构设计,实现了同尺寸模型下可最快的首响时间与更低的显存占用。经在 Apple M4 Metal 上测试,正常运行 MiniCPM-V 4.0 模型,显存占用仅为 3.33 GB,比 Qwen2.5-VL 3B、Gemma 3-4B 更低。

另外,研发团队还与上海期智研究院首次系统开源了推理部署工具 MiniCPM-V CookBook,面向多种场景实现开箱即用的轻量部署,并提供详尽文档以降低部署门槛、加速落地。

目前,可支持 MiniCPM-V 4.0 本地部署的 iOS App 已开源,开发者可在 CookBook 中下载使用。

Github:https://github.com/OpenBMB/MiniCPM-o

Hugging Face:https://huggingface.co/openbmb/MiniCPM-V-4

ModelScope:https://modelscope.cn/models/OpenBMB/MiniCPM-V-4

CookBook:https://github.com/OpenSQZ/MiniCPM-V-CookBook

声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
资讯

前 Google X 高管:AI 将会引发社会进入「地狱」洗牌阶段

2025-8-7 11:37:03

资讯

打开必应就能生图,微软 Bing Image Creator 免费接入 GPT-4o

2025-8-7 23:32:57

搜索