-
梁文锋署名新论文曝光:DeepSeek V4 或引入全新记忆架构
1 月 13 日消息,今日凌晨,DeepSeek 开源全新架构模块「Engram」,并同步发布技术论文,署名作者中再次出现梁文锋。 据悉,Engram 模块通过引入可扩展的查找式记忆结构,为大模型提供了区别于传统 Transformer 与 MoE 的全新稀疏性维度。 DeepSeek 在论文中指出,当前主流大模型在处理两类任务时存在结构性低效:一类是依赖固定知识的「查表式」记忆,另一类是复杂推理…- 1.3k
-
DeepSeek 开年发布新论文:提出全新 mHC 架构,梁文锋现身作者名单
1 月 2 日消息,DeepSeek 公布了一篇新论文,提出名为 mHC (流形约束超连接)的新架构。根据介绍,该研究旨在解决传统超连接在大规模模型训练中的不稳定性问题,同时保持其显著的性能增益。 这篇论文的第一作者有三位:Zhenda Xie(解振达)、Yixuan Wei(韦毅轩)、Huanqi Cao。值得一提的是,DeepSeek 创始人兼 CEO 梁文锋也在作者名单之列。 1AI附摘要部…- 1.6k
-
DeepSeek-R1 论文登上《自然》封面,通讯作者为梁文锋
9 月 18 日消息,由 DeepSeek 团队共同完成、梁文锋担任通讯作者的 DeepSeek-R1 推理模型研究论文,登上了国际权威期刊《自然(Nature)》第 645 期的封面。与今年 1 月发布的 DeepSeek-R1 的初版论文相比,本次论文披露了更多模型训练的细节。 据悉,DeepSeek-R1 也是全球首个经过同行评审的主流大语言模型。Nature 评价道:目前几乎所有主流的大模…- 2.6k
-
DeepSeek R2 将延迟发布
据《The Information》报道,DeepSeek R2 很可能不会在短期内发布了。 据透露,内部层面上,DeepSeek 创始人梁文锋对 DeepSeek R2 目前的性能还不满意,工程师团队仍在全力优化和打磨,因此发布时间待定。 外部原因方面,英伟达为中国市场设计的 AI 芯片「H20」因美国出口限制,而导致货源紧缺。 据报道,目前国内使用 DeepSeek R1 的云服务客户,都在通…- 1.4k
-
DeepSeek 梁文锋入选《时代》周刊“2025 年全球最具影响力 100 人”
4 月 18 日消息,美国《时代》周刊日前公布了“2025 年全球最具影响力 100 人”名单,DeepSeek 创始人梁文锋入选。 梁文锋出现在了“Pioneers(拓荒者)”分类中,1AI附编辑评语如下: 硅谷花了一段时间才真正理解梁文锋所取得的成就。但很快市场就开始动荡,美国科技主导地位受到公开质疑,梁文锋也因此享誉全球。 通过更高效地处理数据,梁文锋创办的鲜为人知的 AI 初创公司 Dee…- 2.7k
-
DeepSeek 只有 160 名员工:新希望董事长刘永好透露与梁文锋交谈内容,称赞年轻人更懂新的科技
2 月 28 日消息,2025 全国两会召开在即。2 月 27 日,全国政协委员、新希望集团董事长刘永好两会媒体沟通会在北京召开。 综合每日经济新闻、北京商报报道,刘永好在媒体沟通会透露了与 DeepSeek 创始人梁文锋交流的内容。 刘永好称:“DeepSeek 梁同学,这次开会我们又在一块吃饭,我就问他,我说你现在有多少员工,他说 160 个。我说你现在那么大的影响,做那么多事才 160 个?…- 3k
-
硅基流动袁进辉否认拒绝 DeepSeek 梁文锋投资,但承认自己没有远见感到后悔
2 月 20 日消息,大模型云服务商硅基流动于 2024 年底完成亿元人民币 Pre-A 轮融资。对此,创投日报报道透露,2023 下半年,硅基流动 CEO 袁进辉在筹建硅基流动之初,DeepSeek 创始人梁文锋就曾提出希望入股该公司,前提是希望其自研 LLM 推理引擎开源。但当时的袁进辉选择了拒绝,其原因在于,彼时的他“想不明白开源的商业模式”。 今日,袁进辉在朋友圈对此消息进行了否认:“我说…- 1.6k
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!






