消息称华为即将发布 AI 推理领域突破性成果：降低对 HBM 依赖，提升国内大模型性能

资讯
25年8月10日
編輯

admin

8 月 10 日消息，据《科创板日报》报道，华为将于 8 月 12 日在 2025 金融 AI推理应用落地与发展论坛上，发布 AI推理领域的突破性技术成果。据透露，这项成果或能降低中国 AI 推理对 HBM（高带宽内存）技术的依赖，提升国内 AI大模型推理性能，完善中国 AI 推理生态的关键部分。

消息称华为即将发布 AI 推理领域突破性成果：降低对 HBM 依赖，提升国内大模型性能

1AI注意到，华为在 AI 推理领域的技术突破已有先例。2025 年 3 月，北京大学联合华为发布了 DeepSeek 全栈开源推理方案，该方案基于北大自研 SCOW 算力平台系统和鹤思调度系统，整合了 DeepSeek、openEuler、MindSpore 与 vLLM / RAY 等社区开源组件，实现了华为昇腾上的 DeepSeek 高效推理。

在性能方面，华为昇腾已实现多项突破。例如 CloudMatrix 384 超节点部署 DeepSeek V3 / R1 时，在 50ms 时延约束下单卡 Decode 吞吐突破 1920 Tokens / s；Atlas 800I A2 推理服务器在 100ms 时延约束下单卡吞吐达到 808 Tokens / s。

科大讯飞与华为的合作也取得了显著成果，双方率先实现了国产算力上 MoE 模型的大规模跨节点专家并行集群推理，使推理吞吐提升 3.2 倍，端到端时延降低 50%。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

消息称华为即将发布 AI 推理领域突破性成果：降低对 HBM 依赖，提升国内大模型性能

全球 500 余台人形机器人共赴「冰丝带」，首届世界人形机器人运动会 8 月 14 日开幕

阿里云通义千问 Qwen Code 宣布每日可免费运行 2000 次：仅限中国大陆用户，一行命令即可安装

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

全球 500 余台人形机器人共赴「冰丝带」，首届世界人形机器人运动会 8 月 14 日开幕

阿里云通义千问 Qwen Code 宣布每日可免费运行 2000 次：仅限中国大陆用户，一行命令即可安装

黄仁勋、扎克伯格力推AI大模型开源 两人互换外套

方大特钢与华为开展全面合作，打造钢铁行业大模型

华为盘古模型亮相

华为启动全球教育医疗伙伴联盟，倡议推动 AI诊疗商业模式落地

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

黄仁勋、扎克伯格力推AI大模型开源两人互换外套