DeepSeek 联合北京大学发布 DSpark 推理加速框架,旨在解决大语言模型高并发生产环境中的推理效率瓶颈,已部署于 DeepSeek-V4-Flash 与 DeepSeek-V4-Pro 预览版服务引擎。相比单 token 推测解码基线 MTP-1,同等吞吐量下单用户生成速度提升 60% 至 85%,相关论文、训练代码等已在 GitHub 开源。技术报告链接:https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!
