全部标签

DeepSeek

DeepSeek-V4-Flash 正式版 API 公测，原生适配 Codex

8 月 1 日消息，DeepSeek 昨日上线 V4-Flash 正式版 API 公测，开发者把模型名设置为 deepseek-v4-flash 即可调用，原有 API 调用方式不变。本次只升级 V4-Flash 的 API 接口，V4-Pro API、App 和网页端模型没有调整。正式版模型基准测试超过 GLM-5.2，结构与参数规模沿用 V4-Flash-preview，只重新进行了后训练。…
资讯
- 842
23小时前
梁文锋 4 小时投资人会议内容曝光：DeepSeek 不追求成为下一个字节或腾讯，克制、开源与低成本是实现 AGI 的核心策略

7 月 23 日消息，近日，有关 DeepSeek 创始人梁文锋此前一次长达 4 小时的投资人会议内容在业内流传。elsewhere 最新放出了此次会议的整理实录。在此次会议中，梁文锋围绕 DeepSeek 的发展方向、AGI（通用人工智能）路线、开源策略、商业化规划以及 AI 行业竞争等话题进行了交流。以下为腾讯科技获得的近4小时的交流会中梁文锋发言实录整理，按主题分类，共计118条，文本尽可…
头条
- 5.1k
7月23日
DeepSeek 创始人梁文锋成为身家最高的 AI 模型创始人

7 月 15 日消息，据彭博社报道，DeepSeek 创始人梁文锋的个人财富估值已增至 360 亿美元，高于 Anthropic CEO Dario Amodei 的 80 亿美元，以及 OpenAI 联合创始人兼总裁 Greg Brockman 的 255 亿美元，成为目前身家最高的 AI 模型创始人。梁文锋的财富增长主要来自其对 DeepSeek 的持股。DeepSeek 在今年 6 月完成…
资讯
- 2k
7月15日
华为天才少年回应 DeepSeek 面试争议

7 月 9 日消息，据 36 氪报道，华为首批「天才少年」、Pine AI 前首席科学家李博杰昨日接受专访，回应了此前引发广泛讨论的 DeepSeek 面试争议及前投资人杜均的「卷款跑路」指控。面试风波起于 7 月 6 日。李博杰在 X 发帖称，DeepSeek 二面 coding 环节中，他因习惯性瞟向摆放腾讯会议界面的另一块屏幕，被面试官多次质疑抄代码，最终在对方表示「无法自证清白即终止面试…
资讯
- 1.2k
7月9日
DeepSeek V4 正式版上线，工作时段涨价一倍

6 月 30 日消息，据蓝鲸新闻，DeepSeek 昨日向 API 用户发送邮件，宣布 V4 正式版计划于 7 月中旬上线，并同步引入峰谷定价机制，高峰时段 API 价格调整为平时的 2 倍。多位开发者已确认收到该邮件。高峰时段定为每日北京时间 9:00–12:00 和 14:00–18:00，具体定价如下： V4 Pro 高峰：缓存命中输入 0.05 元 / 百万 tokens，缓存未命中输入…
资讯
- 4k
6月30日
DeepSeek Harness 组加大招聘力度，放出研究员、工程师和产品经理三种职位

6 月 23 日消息，DeepSeek 新成立的 Harness 组正在加大招聘力度。其 Harness 负责人崔添翼日前公开发帖称，DeepSeek Harness 组正在招聘 Harness 研究员、Harness 工程师和 Harness 产品经理。崔添翼在招聘帖中把 Harness 组的目标描述为「Model + Harness = Agent」：模型之外，围绕 Agent 产品的上下文…
资讯
- 2.6k
6月23日
DeepSeek 完成 500 亿融资

6 月 17 日消息，据 The Information 报道，DeepSeek 已经完成了其首轮融资，募资总额超过 500 亿元人民币，刷新了国产大模型甚至整个中国 AI 行业迄今为止的单轮融资最高纪录。在公开披露的出资方中，梁文峰本人认购份额最大，出资 200 亿元人民币；腾讯跟投 100 亿元人民币；宁德时代出资 50 亿元人民币；京东、网易和 IDG 资本各出资 30 亿元人民币。其余投…
资讯
- 3.7k
6月17日
美国 AI Agent 初创公司将主力模型从 Claude 切到 DeepSeek

6 月 5 日消息，昨天，美国 AI Agent 初创公司 Lindy 创始人兼 CEO Flo Crivello 在 X 上发文称，公司已经把 100% 的 Lindy 流量切换到 DeepSeek V4，并停用 Anthropic 的 Claude 模型。 Crivello 称，这次切换每年可为公司节省数百万美元，并且在多个核心使用场景中看到性能提升。他同时表示仍看好 Anthropic 的企…
资讯
- 2.5k
6月5日
DeepSeek-V4-Pro API 宣布永久降价，调整为原定价的四分之一

5 月 23 日消息，DeepSeek 官方宣布，DeepSeek-V4-Pro 模型 API 现行 2.5 折限时优惠将在 5 月 31 日 23:59 结束后转为永久降价。6 月 1 日起，该模型 API 调整为原定价的四分之一。 DeepSeek API 文档显示，V4-Pro 目前支持 1M 上下文，输入缓存未命中价格为每百万 tokens 0.435 美元，输出价格为每百万 tokens…
资讯
- 2.6k
5月23日
DeepSeek 700 亿融资曝光

5 月 23 日消息，据彭博社报道，DeepSeek 正在进行一轮约 100 亿美元（700 亿元人民币）的融资谈判，估值达到约 450 亿美元。两周前，外媒曝光的这个融资在数字还是500 亿元人民币（约合 73.5 亿美元）。知情人士透露，DeepSeek 创始人梁文锋计划亲自出资，金额可能高达 200 亿元，占整轮融资总额的 40%。若交易达成，这将是中国 AI 初创公司有史以来规模最大的…
资讯
- 2.8k
5月23日
DeepSeek 内测「识图模式」，多模态新模型或将发布

4 月 30 日消息，DeepSeek 昨日开启「识图模式」测试，与现有的「快速模式」、「专家模式」并列，具备完整的多模态图像理解能力，并非简单的 OCR 文字识别。从实测表现来看，DeepSeek 识图模式的整体准确率较高，在不开启思考模式的情况下，最快半秒即可给出回答。对于电影剧照、抽象图片、商品图等常见场景，识别与理解表现良好。更值得关注的是其思考过程：在描述画面内容之外，还会主动追问发…
资讯
- 3.7k
4月30日
DeepSeek V4 成龙虾默认模型，输入 token 缓存命中价格降至 1/10

4 月 27 日消息，日前，OpenClaw「龙虾」正式发布 2026.4.24 版本更新，接入 DeepSeek V4 系列模型，DeepSeek V4-Flash 更是被设为新用户的默认首选模型。与此同时，DeepSeek 官方也更新了 API 文档，宣布下调 DeepSeek 全系列 API 服务的价格，输入缓存命中的价格降至原有价格的 1/10，Pro 模型在 2026 年 5 月 5 …
资讯
- 4.4k
4月27日
迈入百万上下文普惠时代：DeepSeek-V4 模型预览版正式上线并同步开源

4 月 24 日消息，今天上午，DeepSeek-V4 模型预览版正式上线并同步开源。 DeepSeek-V4 拥有百万字超长上下文，在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本：即日起登录官网 chat.deepseek.com 或官方 App，即可与最新的 DeepSeek-V4 对话，探索 1M 超长上下文记忆的全新体验。API 服务已同步更…
资讯
- 4.3k
4月24日
黄仁勋：若 DeepSeek 率先在华为平台上出现，「对美国将是可怕的结果」

4 月 17 日消息，英伟达 CEO 黄仁勋近日在接受科技播客主持人 Dwarkesh Patel 专访时，就美国对华 AI 芯片出口管制政策发出警告。针对 Patel「向中国出售英伟达芯片可能助其训练具备网络攻击能力的 AI 模型」这一质疑，黄仁勋直言「你的前提就是错的」。他指出，Anthropic 旗下 Claude 模型是在规模相当普通的算力上训练完成的，而此类算力在中国「大量可得」；中…
资讯
- 2.5k
4月17日
曝 DeepSeek V4 四月亮相，但「很难是碾压级的强」

4 月 3 日消息，据晚点 LatePost 报道，DeepSeek 的下一代旗舰模型 V4 预计将于今年 4 月发布。今年 1 月，V4 的小参数版本已流出至部分开源框架社区进行适配，大参数版此前原定于春节前后上线，但最终推迟。值得注意的是，报道指出，V4 大概率仍将是开源领域最强模型，但「很难是碾压级的强」。随着 AI 评测标准愈发多元，Benchmark 分数已难以全面衡量模型能力，尤其…
资讯
- 5.1k
4月3日
DeepSeek 悄悄上线新论文，北大清华联创

2 月 28日消息，近期，DeepSeek 联合北京大学与清华大学悄悄上线了一篇论文，正式发布名为 DualPath 的新技术方案，重点解决了 AI 大模型在执行复杂多轮任务时遭遇的历史数据读取瓶颈。据论文介绍，现在 AI 系统在处理超长上下文时，负责「处理输入信息」和「生成文本回答」的两个计算模块，会出现数据通道资源错配的情况。针对此问题，新的 DualPath 打破了常规的单线传输限制，允…
资讯
- 2.8k
2月28日
DeepSeek 正招兵买马，布局 AI搜索与智能体领域

1 月 30 日消息，据彭博社报道，DeepSeek 正通过招聘多语言 AI搜索引擎开发人才、加大对智能体技术的投入，进一步拓展其 AI 产品矩阵，与 OpenAI 及 Alphabet 展开更激烈的竞争。据该公司本月发布的多则招聘信息显示，DeepSeek 正在招募专业人才，以打造一个能够支持多种语言的人工智能搜索引擎。该搜索功能将具备多模态特性，能够同时处理文本、图像及音频等多种形式的输入，…
资讯
- 2.3k
1月30日
DeepSeek 新模型曝光：MODEL1 代码预示新架构，最快有望 2 月发布

1 月 21 日消息，The Information 月初爆料称，DeepSeek 将在今年 2 月中旬农历新年期间推出新一代旗舰 AI模型 ——DeepSeek V4，将具备更强的写代码能力。 1 月 20 日，正值 DeepSeek-R1 发布一周年之际，有开发者发现 DeepSeek 在 GitHub 中更新了一系列 FlashMLA 代码，横跨 114 个文件中有 28 处都提到了未知的“…
资讯
- 3k
1月21日
梁文锋署名新论文曝光：DeepSeek V4 或引入全新记忆架构

1 月 13 日消息，今日凌晨，DeepSeek 开源全新架构模块「Engram」，并同步发布技术论文，署名作者中再次出现梁文锋。据悉，Engram 模块通过引入可扩展的查找式记忆结构，为大模型提供了区别于传统 Transformer 与 MoE 的全新稀疏性维度。 DeepSeek 在论文中指出，当前主流大模型在处理两类任务时存在结构性低效：一类是依赖固定知识的「查表式」记忆，另一类是复杂推理…
资讯
- 3.9k
1月13日
DeepSeek V4 大模型被曝春节前后发布：AI 编程能力超越 OpenAI GPT 及 Anthropic Claude

1 月 10 日消息，The Information 报道称，DeepSeek 将在今年 2 月中旬农历新年期间推出新一代旗舰 AI 模型 ——DeepSeek V4，将具备更强的写代码能力。内部测试表明，其 AI 编程性能有望超越包括 OpenAI GPT 和 Anthropic Claude 在内的行业领先产品。消息人士对 The Information 表示，DeepSeek V4 在处…
资讯
- 5k
1月10日
DeepSeek 开年发布新论文：提出全新 mHC 架构，梁文锋现身作者名单

1 月 2 日消息，DeepSeek 公布了一篇新论文，提出名为 mHC （流形约束超连接）的新架构。根据介绍，该研究旨在解决传统超连接在大规模模型训练中的不稳定性问题，同时保持其显著的性能增益。这篇论文的第一作者有三位：Zhenda Xie（解振达）、Yixuan Wei（韦毅轩）、Huanqi Cao。值得一提的是，DeepSeek 创始人兼 CEO 梁文锋也在作者名单之列。 1AI附摘要部…
资讯
- 3.2k
1月2日
DeepSeek V3.2 正式版发布：推理比肩 GPT-5，首推 Speciale 版本拿下奥数金牌

12 月 2 日消息，DeepSeek V3.2 正式版发布，强化 Agent 能力，融入思考推理。官方今日同时发布两个正式版模型：DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。官方网页端、App 和 API 均已更新为正式版 DeepSeek-V3.2。Speciale 版本目前仅以临时 API 服务形式开放，以供社区评测与研究。新模型技术报告已同步发布，1…
资讯
- 5.6k
25年12月2日
DeepSeek 领跑 AI 实盘交易对决，收益达 9.68%

10 月 27 日消息，据「新智元」报道，香港大学黄超教授团队主导的开源项目「AI-Trader」近日公布最新成果，DeepSeek 模型在真实美股交易实验中以 9.68% 的收益率位居第一，显著超越 GPT、Claude、Gemini 等国际顶级大模型。在实验中，研究团队为 5 个 AI 模型分别配置 1 万美元资金，并允许其在纳斯达克 100 成分股市场自主交易近一个月。规则严格限定「三不…
资讯
- 7.7k
25年10月27日
全球 6 大顶级 AI 实盘厮杀，Deepseek 三天收益爆赚 36% 傲视群雄

10 月 22 日消息，科技媒体 coincentral 昨日（10 月 21 日）发布博文，报道称美国研究公司 Nof1 发起名为“Alpha Arena”的 AI投资实战大赛，DeepSeek Chat V3.1 模型表现出色，三天内将 1 万美元本金增值至 13647.9 美元，实现了超过 36% 的惊人回报率，成功拔得头筹。 Nof1 为了检验顶尖大语言模型在真实市场环境下的交易能力，给 …
资讯
- 3k
25年10月22日