2 月 28日消息,近期,DeepSeek 联合北京大学与清华大学悄悄上线了一篇论文,正式发布名为 DualPath 的新技术方案,重点解决了 AI 大模型在执行复杂多轮任务时遭遇的历史数据读取瓶颈。

据论文介绍,现在 AI 系统在处理超长上下文时,负责「处理输入信息」和「生成文本回答」的两个计算模块,会出现数据通道资源错配的情况。
针对此问题,新的 DualPath 打破了常规的单线传输限制,允许历史数据先通过闲置通道进入「生成回答」模块,随后利用集群内部的高速网络,瞬间转发给「处理输入」模块。
官方评估数据显示,在处理真实复杂的 AI 任务时,该技术将离线处理吞吐量最高提升 1.87 倍,在线服务吞吐量平均提升 1.96 倍。
当前,大模型正快速向具备自主规划能力的「智能体(Agent)」方向演进,AI 需要频繁回顾动辄数万字的上下文,导致系统性能的制约因素已从「算力不足」转变为「数据传输太慢」。
而 DualPath 技术的验证,证明了通过优化底层数据流向,可以在不增加硬件采购成本的情况下大幅盘活闲置资源。
🎤 DeepSeek,你知道大家还在等待什么东西的。(V4 依然没有出现)