-
DeepSeek 内测「识图模式」,多模态新模型或将发布
4 月 30 日消息,DeepSeek 昨日开启「识图模式」测试,与现有的「快速模式」、「专家模式」并列,具备完整的多模态图像理解能力,并非简单的 OCR 文字识别。 从实测表现来看,DeepSeek 识图模式的整体准确率较高,在不开启思考模式的情况下,最快半秒即可给出回答。对于电影剧照、抽象图片、商品图等常见场景,识别与理解表现良好。 更值得关注的是其思考过程:在描述画面内容之外,还会主动追问发…- 1k
-
DeepSeek V4 成龙虾默认模型,输入 token 缓存命中价格降至 1/10
4 月 27 日消息,日前,OpenClaw「龙虾」正式发布 2026.4.24 版本更新,接入 DeepSeek V4 系列模型,DeepSeek V4-Flash 更是被设为新用户的默认首选模型。 与此同时,DeepSeek 官方也更新了 API 文档,宣布下调 DeepSeek 全系列 API 服务的价格,输入缓存命中的价格降至原有价格的 1/10,Pro 模型在 2026 年 5 月 5 …- 1.5k
-
迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源
4 月 24 日消息,今天上午,DeepSeek-V4 模型预览版正式上线并同步开源。 DeepSeek-V4 拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本: 即日起登录官网 chat.deepseek.com 或官方 App,即可与最新的 DeepSeek-V4 对话,探索 1M 超长上下文记忆的全新体验。API 服务已同步更…- 2.5k
-
黄仁勋:若 DeepSeek 率先在华为平台上出现,「对美国将是可怕的结果」
4 月 17 日消息,英伟达 CEO 黄仁勋近日在接受科技播客主持人 Dwarkesh Patel 专访时,就美国对华 AI 芯片出口管制政策发出警告。 针对 Patel「向中国出售英伟达芯片可能助其训练具备网络攻击能力的 AI 模型」这一质疑,黄仁勋直言「你的前提就是错的」。 他指出,Anthropic 旗下 Claude 模型是在规模相当普通的算力上训练完成的,而此类算力在中国「大量可得」;中…- 1.8k
-
曝 DeepSeek V4 四月亮相,但「很难是碾压级的强」
4 月 3 日消息,据晚点 LatePost 报道,DeepSeek 的下一代旗舰模型 V4 预计将于今年 4 月发布。今年 1 月,V4 的小参数版本已流出至部分开源框架社区进行适配,大参数版此前原定于春节前后上线,但最终推迟。 值得注意的是,报道指出,V4 大概率仍将是开源领域最强模型,但「很难是碾压级的强」。 随着 AI 评测标准愈发多元,Benchmark 分数已难以全面衡量模型能力,尤其…- 3k
-
DeepSeek 悄悄上线新论文,北大清华联创
2 月 28日消息,近期,DeepSeek 联合北京大学与清华大学悄悄上线了一篇论文,正式发布名为 DualPath 的新技术方案,重点解决了 AI 大模型在执行复杂多轮任务时遭遇的历史数据读取瓶颈。 据论文介绍,现在 AI 系统在处理超长上下文时,负责「处理输入信息」和「生成文本回答」的两个计算模块,会出现数据通道资源错配的情况。 针对此问题,新的 DualPath 打破了常规的单线传输限制,允…- 1.8k
-
DeepSeek 正招兵买马,布局 AI搜索与智能体领域
1 月 30 日消息,据彭博社报道,DeepSeek 正通过招聘多语言 AI搜索引擎开发人才、加大对智能体技术的投入,进一步拓展其 AI 产品矩阵,与 OpenAI 及 Alphabet 展开更激烈的竞争。 据该公司本月发布的多则招聘信息显示,DeepSeek 正在招募专业人才,以打造一个能够支持多种语言的人工智能搜索引擎。该搜索功能将具备多模态特性,能够同时处理文本、图像及音频等多种形式的输入,…- 1.1k
-
DeepSeek 新模型曝光:MODEL1 代码预示新架构,最快有望 2 月发布
1 月 21 日消息,The Information 月初爆料称,DeepSeek 将在今年 2 月中旬农历新年期间推出新一代旗舰 AI模型 ——DeepSeek V4,将具备更强的写代码能力。 1 月 20 日,正值 DeepSeek-R1 发布一周年之际,有开发者发现 DeepSeek 在 GitHub 中更新了一系列 FlashMLA 代码,横跨 114 个文件中有 28 处都提到了未知的“…- 1.6k
-
梁文锋署名新论文曝光:DeepSeek V4 或引入全新记忆架构
1 月 13 日消息,今日凌晨,DeepSeek 开源全新架构模块「Engram」,并同步发布技术论文,署名作者中再次出现梁文锋。 据悉,Engram 模块通过引入可扩展的查找式记忆结构,为大模型提供了区别于传统 Transformer 与 MoE 的全新稀疏性维度。 DeepSeek 在论文中指出,当前主流大模型在处理两类任务时存在结构性低效:一类是依赖固定知识的「查表式」记忆,另一类是复杂推理…- 2.1k
-
DeepSeek V4 大模型被曝春节前后发布:AI 编程能力超越 OpenAI GPT 及 Anthropic Claude
1 月 10 日消息,The Information 报道称,DeepSeek 将在今年 2 月中旬农历新年期间推出新一代旗舰 AI 模型 ——DeepSeek V4,将具备更强的写代码能力。 内部测试表明,其 AI 编程性能有望超越包括 OpenAI GPT 和 Anthropic Claude 在内的行业领先产品。 消息人士对 The Information 表示,DeepSeek V4 在处…- 3.4k
-
DeepSeek 开年发布新论文:提出全新 mHC 架构,梁文锋现身作者名单
1 月 2 日消息,DeepSeek 公布了一篇新论文,提出名为 mHC (流形约束超连接)的新架构。根据介绍,该研究旨在解决传统超连接在大规模模型训练中的不稳定性问题,同时保持其显著的性能增益。 这篇论文的第一作者有三位:Zhenda Xie(解振达)、Yixuan Wei(韦毅轩)、Huanqi Cao。值得一提的是,DeepSeek 创始人兼 CEO 梁文锋也在作者名单之列。 1AI附摘要部…- 2.1k
-
DeepSeek V3.2 正式版发布:推理比肩 GPT-5,首推 Speciale 版本拿下奥数金牌
12 月 2 日消息,DeepSeek V3.2 正式版发布,强化 Agent 能力,融入思考推理。 官方今日同时发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。 官方网页端、App 和 API 均已更新为正式版 DeepSeek-V3.2。Speciale 版本目前仅以临时 API 服务形式开放,以供社区评测与研究。 新模型技术报告已同步发布,1…- 4.1k
-
DeepSeek 领跑 AI 实盘交易对决,收益达 9.68%
10 月 27 日消息,据「新智元」报道,香港大学黄超教授团队主导的开源项目「AI-Trader」近日公布最新成果,DeepSeek 模型在真实美股交易实验中以 9.68% 的收益率位居第一,显著超越 GPT、Claude、Gemini 等国际顶级大模型。 在实验中,研究团队为 5 个 AI 模型分别配置 1 万美元资金,并允许其在纳斯达克 100 成分股市场自主交易近一个月。 规则严格限定「三不…- 5.1k
-
全球 6 大顶级 AI 实盘厮杀,Deepseek 三天收益爆赚 36% 傲视群雄
10 月 22 日消息,科技媒体 coincentral 昨日(10 月 21 日)发布博文,报道称美国研究公司 Nof1 发起名为“Alpha Arena”的 AI投资实战大赛,DeepSeek Chat V3.1 模型表现出色,三天内将 1 万美元本金增值至 13647.9 美元,实现了超过 36% 的惊人回报率,成功拔得头筹。 Nof1 为了检验顶尖大语言模型在真实市场环境下的交易能力,给 …- 2.4k
-
单卡日处理 20 万页文档,DeepSeek-OCR 开源上线
10 月 21 日消息,据「Al寒武纪」报道,DeepSeek 团队近日发布全新研究成果 DeepSeek-OCR,提出「上下文光学压缩」方法,为大模型长文本处理带来突破性思路。 研究显示,通过将长文本渲染为图像,再转化为视觉 token,能够在保持高精度的同时显著降低计算成本。 实验数据显示,在小于 10 倍压缩率下,OCR 解码准确率高达 97%;即便在 20 倍超高压缩率下,准确率仍能维持在…- 2.7k
-
《时代》杂志公布年度最佳发明公布:DeepSeek R1、AirPods Pro 3 上榜
10 月 11 日消息,《时代》杂志正式发布 2025 年度「最佳发明」榜单,共收录 300 项来自全球的创新成果,涵盖人工智能、消费电子、医疗健康、绿色能源等多个领域。 在人工智能板块,中国团队研发的 DeepSeek R1 大模型成功入选。该模型以低成本、高效率为核心优势,被认为是对现有大型语言模型格局的有力挑战,展现了中国在全球 AI 竞争中的新突破。 在消费电子类别中,苹果最新推出的 Ai…- 3.1k
-
DeepSeek-V3.2-Exp 模型正式发布并开源,API 大幅降价
9 月 29 日消息,DeepSeek 今日正式发布 DeepSeek-V3.2-Exp 模型,这是一个实验性(Experimental)的版本。 作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(注:一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。 DeepSeek Spa…- 3k
-
李开复:如果十年后回顾 DeepSeek 如何让中国未落后美国,答案是开源
9 月 28 日消息,据界面新闻报道,9 月 27 日,零一万物 CEO 李开复在长江 CEO 组织 20 周年返校日庆典上表示,DeepSeek 对中国 AI 发展的核心贡献在于推动了开源生态的形成。“如果十年后,我们回顾 DeepSeek 怎么让中国没有落后于美国,答案并非其技术能力本身,而是它带来了中国(大模型)开源时代。” 李开复提到,自 DeepSeek 开源以来,国内多家企业相继开源大…- 3.2k
-
AI一键生成论文,用DeepSeek三天写出论文初稿
作为一名大学生、研究生、刚入职的高校教师,或是刚刚踏入科研之路的"小白",你是否常常感到论文写作无从下手?文献读不完、思路理不清、写作效率低……别担心,AI辅助写作已经成为新一代科研人的必备技能! 今天,就为大家介绍如何用DeepSeek(国内领先的大模型工具)快速高效地完成一篇论文初稿,助你三天内从零到一完成论文写作! 1.认识DeepSeek:不只是聊天机器人 DeepSe…- 14.6k
-
DeepSeek 声明:防范冒用“深度求索”名义实施诈骗
9 月 19 日消息,DeepSeek 发布官方声明:近期,有不法分子冒充“深度求索”(DeepSeek)官方或在职员工,伪造工牌、营业执照等材料,在多个平台以“算力租赁”、“股权融资”等名义向用户收取费用实施诈骗。该行为严重侵害用户权益,并损害公司声誉。 现严正声明如下: 1. 深度求索从未要求用户向个人账户或非官方账户付款,任何要求私下转账的行为均属诈骗; 2. 任何冒用公司名义开展“算力租赁…- 2.7k
-
DeepSeek-R1 论文登上《自然》封面,通讯作者为梁文锋
9 月 18 日消息,由 DeepSeek 团队共同完成、梁文锋担任通讯作者的 DeepSeek-R1 推理模型研究论文,登上了国际权威期刊《自然(Nature)》第 645 期的封面。与今年 1 月发布的 DeepSeek-R1 的初版论文相比,本次论文披露了更多模型训练的细节。 据悉,DeepSeek-R1 也是全球首个经过同行评审的主流大语言模型。Nature 评价道:目前几乎所有主流的大模…- 4.3k
-
QuestMobile 报告:豆包月活超越 DeepSeek,夺 8 月中国原生 AI App 月活第一
9 月 16 日消息,QuestMobile 今日发布的 2025 年 8 月 AI 应用行业月度报告显示,截止到 2025 年 8 月,互联网及 AI 科技企业原生 App 用户规模 2.77 亿,应用插件(In-App AI)用户规模 6.22 亿,两大 AI 应用整体规模达 6.45 亿;手机厂商 AI 助手用户规模 5.29 亿;PC 端应用用户规模达到 2.04 亿,其中,网页端用户规模…- 3k
-
微信 AI 搜索进入一级入口,可选择深度思考、上传图片等
9 月 12 日消息,近日,微信搜索界面迎来更新,微信 AI 搜索进入一级入口,首页顶部点击搜索框就能看到相关按钮。 该板块分为深度思考、上传图片、上传文件三个板块。其中,深度思考可选择 DeepSeek-R1 模型或腾讯混元 T1 模型,除此之外,用户还可选择快速回答选项,提供最常见的回答。 上传图片或拍照则可以基于图片进行提问,还支持识图、拍题、搜商品等功能。上传文件或公众号则可以进行总结内容…- 2.7k
-
百度发布文心大模型 X1.1 深度思考模型,整体表现超越 DeepSeek R1
9 月 9 日消息,今日,WAVE SUMMIT 深度学习开发者大会 2025 在北京举行。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰正式发布了文心大模型 X1.1 深度思考模型。 据介绍,文心大模型 X1 深度思考模型是基于文心大模型 4.5 训练而来的深度思考模型,X1.1 再次实现升级。该模型在事实性、指令遵循、智能体等能力上均有显著提升。 1AI注意到,用户已经可以在文心…- 3.7k
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!























