微软发布 Phi-4-mini-flash-reasoning 端侧AI模型：10 倍吞吐量，推理能力升级

资讯
25年7月11日
編輯

admin

7 月 11 日消息，科技媒体 NeoWin 昨日（7 月 10 日）发布博文，报道称微软推出 Phi-4-mini-flash-reasoning 小语言模型，重点提升端侧AI模型的数学和逻辑推理能力。

Phi-4-mini-flash-reasoning 的主要优势在于，它能够在边缘设备、移动应用和嵌入式系统等资源不足的场景下，引入先进的推理功能。

在架构方面，Phi-4-mini-flash-reasoning 创新引入了 SambaY 架构，而该架构的一大亮点，就是名为 Gated Memory Unit（GMU）的组件，它能够高效地在模型的内部之间共享信息，从而提高模型的效率。

这些改进让模型能够更快地生成答案和完成任务，即使面对非常长的输入也能应对自如，Phi 模型还能处理大量数据，理解非常长的文本或对话。

在性能方面，相比较其它 Phi 模型，Phi-4-mini-flash-reasoning 的吞吐量最高提升 10 倍，这意味着在给定的时间内，Phi-4-mini-flash-reasoning 可以完成更多的工作。

它可以在相同的时间内处理 10 倍多的请求或生成 10 倍多的文本，这对于实际应用来说是一个巨大的改进，此外，延迟也降低至其它 Phi 模型的 1/2~1/3。

Phi-4-mini-flash-reasoning 新型模型已在 Azure AI Foundry、NVIDIA API Catalog 和 Hugging Face 上线。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

微软发布 Phi-4-mini-flash-reasoning 端侧AI模型：10 倍吞吐量，推理能力升级

欧盟公布最终版《通用人工智能行为准则》，8 月 2 日起正式实施

消息称亚马逊 AWS 将于 7 月 15 日推出 AI 智能体市场，Anthropic 参与

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

欧盟公布最终版《通用人工智能行为准则》，8 月 2 日起正式实施

消息称亚马逊 AWS 将于 7 月 15 日推出 AI 智能体市场，Anthropic 参与

微软计划将 OpenAI 的 Sora 视频生成模型整合进 Copilot，但需时日

微软 Win11 AI 助手 Copilot 获多项技能升级：支持插件、修改设置、自定义语音命令

首款生成式 AI 安全解决方案，微软 Copilot for Security 4 月 1 日上线

英国监管机构出手，正调查微软与 Inflection AI 相关交易

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注