
5 月 28 日,蚂蚁百灵大模型(Ling)团队今天正式开源统一多模态大模型 Ming-lite-omni。
据介绍,Ming-lite-omni 是一款基于 Ling-lite 构建的 MoE 架构的全模态模型,其总参数 22B,激活参数 3B。其支持「跨模态融合与统一」「理解与生成统一」。
在多项理解和生成能力评测中,Ming-lite-omni 以仅 3B 的参数激活量, 性能与 10B 量级领先的多模态大模型相当或更优。官方表示,这也是目前已知首个在模态支持方面能够与 GPT-4o 相媲美的开源模型。
另外,蚂蚁百灵大模型团队还将持续优化 Ming-lite-omni 在全模态理解和生成任务上的效果,并提升 Ming-lite-omni 的多模复杂推理能力;同时也会训练更大尺寸的全模态模型Ming-plus-omni, 以期进一步解决更多高度专业化或领域化的复杂交互问题。
Ming-lite-omni 当前模型权重和推理代码已开源。
Github:https://github.com/inclusionAI/Ming/tree/main/Ming-omni
HuggingFace:https://huggingface.co/inclusionAI/Ming-Lite-Omni
Model Scope:https://modelscope.cn/models/inclusionAI/Ming-Lite-Omni
Project Page:https://lucaria-academy.github.io/Ming-Omni/