快讯

AI行业最新快讯

5月16

  • 京东大模型开发计算研究登Nature,破解AI落地效率密码

    11:39

    5 月 15 日,京东探索研究院论文《Omniforce:以人为中心的、赋能大模型的、云边协同的自动机器学习系统》发表于Nature旗下期刊npj Artificial Intelligence(https://www.nature.com/articles/s44387-025-00002-0),该项研究提出了一种在开放环境场景中训练、更新大模型,并与小模型协同部署的系统与方法,成为国内首个系统…

    分享到
  • OpenAI CEO 预告新产品

    11:36

    今日凌晨,OpenAI CEO Sam Altman 发文预告称,不久后 OpenAI 团队将发布一个低调的研究预览,并表示将会给该研究预览起一个「比 ChatGPT 更好」的名字,以防止过于火爆。近期,Altman 参加投资机构红杉资本的「2025 AI Ascent」大会,其在问答环节时指出,尽管 OpenAI 没有明确的「总体规划」,但团队希望开发出一种类似于订阅式操作系统的 AI 产品,并…

    分享到
  • 马化腾:微信的 Agentic AI 很独特

    11:36

    日前,腾讯公布了其 2025 年第一季度财报信息,营收 1800 亿元人民币,同比增长 13%。随后,腾讯 CEO 马化腾在该季度业绩电话会上表示,AI 能力已经对效果广告与长青游戏等业务产生实质性的贡献,亦加大对元宝应用与微信内的 AI 等新 AI 机遇的投入。其中,马化腾重点提到了 Agentic AI。他表示,AI 能够帮助用户完成包含多步骤、需要调用工具,甚至连接其他应用的复杂任务。马化腾…

    分享到
  • Claude 新模型曝光

    11:35

    据 The Information 消息,Anthropic 将在未来几周推出两款新的 Claude 系列推理模型。据知情人士透露,两款新模型分别为 Claude Sonnet 系列和 Claude Opus 系列。据悉,两款新模型能够从「思考」与「探索」两种模式之间自由切换,从而来满足解决问题的最佳方式;另外,新模型还将支持「工具使用」,即调用外部工具、App 和数据库来寻求答案。值得一提的是,…

    分享到
  • Qwen3 技术报告首次全公开

    11:33

    不久前,通义千问 Qwen3 系列模型正式开源,而在 5 月 14 日,通义千问团队又正式发布了 Qwen3 的技术报告。在这份Qwen3技术报告中,你可以深入了解到Qwen3模型架构、预训练及后训练过程、模型性能表现等诸多此前尚未公布的技术细节。报告可在GitHub上下载:https://github.com/QwenLM/Qwen3/blob/main/Qwen3_Technical_Repo…

    分享到
  • 随着流量下降 Stack Overflow 考虑品牌重塑

    11:32

    由于 AI 聊天机器人在回答编程相关问题上更快捷更方便,著名编程问答社区 Stack Overflow 的流量持续下降,Stack Overflow 母公司 Stack Exchange 表示在考虑品牌重塑。根据官方统计数据,2025 年 4 月的问题和答案数比 2024 年同期下降了 64% 以上,比峰值的 2020 年 4 月下降了 90% 以上。CEO Prashanth Chandrase…

    分享到
  • Meta 推迟发布旗舰 AI 模型 Behemoth

    11:31

    Meta推迟发布旗舰AI模型Behemoth,最早计划4月发布,后推迟到6月,现预计秋季甚至更晚发布,引发内部对其AI投资的担忧。Meta曾宣传Behemoth在某些测试中超越OpenAI、Google和Anthropic,但内部人士称其性能受训练过程限制。Meta高层对AI产品组,尤其是开发Llama 4的团队表现失望,或将进行管理调整。此外,Meta的第一代Llama模型的14名研究者已有11…

    分享到
  • 梁文锋署名 DeepSeek 新论文:公开 V3 大模型降本方法

    11:31

    DeepSeek 团队近日发表了新论文《Insights into DeepSeek-V3: Scaling Challenges and Reflections on Hardware for AI Architectures》(https://arxiv.org/pdf/2505.09343),梁文锋也参与其中。此论文揭示了 DeepSeek-V3 大模型的优化方法,通过内存优化、计算优化、通…

    分享到
  • 新型AI芯片将大语言模型能耗减半

    11:30

    5月15日消息,据报道,美国俄勒冈州立大学科研团队研发出一种新型AI芯片,新芯片能够借助AI技术,通过训练其上的分类器识别并纠正错误,以更智能高效的方式恢复数据,成功将大语言模型的能耗降低50%。这项成果于近期在波士顿举行的IEEE定制集成电路会议上发布,是半导体领域的重大突破,有望成为解决大语言模型高能耗问题的“绿色钥匙”。(中国科技网)

    分享到
  • CoreWeave宣布今年投入逾200亿美元,以满足人工智能需求

    11:29

    英伟达支持的人工智能初创公司CoreWeave周三表示,计划今年在AI基础设施和数据中心容量方面投入200亿至230亿美元,以满足包括微软在内的客户日益增长的需求。这一巨额支出计划宣布后,该公司股价盘后大跌了近8%。此前由于该公司公布的第一季度营收好于预期,其股价盘中一度飙升11%。(金融界)

    分享到
  • 谷歌Deepmind发布用于设计高级算法的编程AI Agent

    11:29

    谷歌Deepmind在官网发布了用于设计高级算法的编程AI Agent——AlphaEvolve。值得一提的是,谷歌在展示AlphaEvolve的能力时,就特意找了一道300多年的数学难题——亲吻数问题。这道题的历史最早可以追溯到1694年,牛顿还和别人辩论、研究过。其难点在于给定维度的空间中,最多可以有多少个相同大小的球体同时接触一个中心球体,这些球体之间不发生重叠。而AlphaEvolve发现…

    分享到
  • 宇树科技申请多枚机器人牌照商标

    11:29

    近日,杭州宇树科技有限公司申请注册“机器人牌照”“机牌”“Robot license”“Robot plate”等商标,国际分类涉及科学仪器、运输工具、广告销售等,当前商标状态均为等待实质审查。杭州宇树科技有限公司成立于2016年8月,法定代表人为王兴兴,注册资本约259.42万元人民币,由王兴兴、汉海信息技术(上海)有限公司、宁波红杉科盛股权投资合伙企业(有限合伙)等共同持股。

    分享到
  • 红杉美国详解“万亿美元AI机遇”:如何赢得应用层战争?

    11:29

    红杉资本认为AI正同时颠覆软件和服务两大盈利池,应用层是最大价值所在,95%的AI创业与传统创业无异,关键是解决真实问题和组建优秀团队;智能体经济正在形成,AI系统不仅传递信息,还能进行交易、追踪关系、建立信任,最终将形成人机深度协同的嵌套经济网络;行业面临三大技术挑战:智能体的持久身份认证、无缝通信协议构建和安全性保障,未来将进入"高杠杆、低确定性"的新时代。

    分享到
  • DeepMind的AlphaEvolve突破数学极限,陶哲轩合作参

    11:28

    DeepMind发布基于Gemini驱动的AlphaEvolve智能体,能够演化整个代码库,实现算法发现和优化,陶哲轩参与合作探索其数学应用;AlphaEvolve通过"生成-评估-进化"循环机制工作,结合LLM创造力与自动评估系统,显著减少了AI幻觉问题;该系统已应用于优化谷歌数据中心效率(提升0.7%),改进TPU芯片设计;并在矩阵乘法等数学难题上取得突破,在75%的开放性…

    分享到
  •  腾讯混元在《碧优蒂的世界》打造智能NPC,图像2.0将上线

    11:28

    腾讯混元大模型为《碧优蒂的世界》(BUD)打造智能NPC系统,支持自主行动、个性化交互、情感表达和记忆推理等功能;BUD利用腾讯混元角色扮演专属模型和Turbo S快思考模型,实现NPC与玩家的立体互动,3个月内AI对话数超两千万次;游戏通过Dify无代码开发和腾讯云向量数据库支持,大幅缩短开发周期; 同时官方宣布混元图像2.0将于5月16日发布,持续强化AI产品矩阵。

    分享到
  • 阿里Wan2.1-VACE开源视频生成模型,消费级显卡可玩

    11:28

    阿里开源Wan2.1-VACE视频生成与编辑统一模型,支持文生视频、图像参考生成、重绘、局部编辑等6大任务,可实现多任务组合;模型分为1.3B(支持480P、可用消费级显卡)和14B版本(支持720P),采用创新的视频条件单元VCU统一四大输入形态;该模型可一次性完成画幅扩展、时长延展和图像参考等多项任务,如将静态图扩展为动态视频,GitHub获得1.1万star。

    分享到
  • Stability AI加入音频赛道,联手Arm推出最快手机端免云模型

    11:26

    Stability AI与Arm合作推出Stable Audio Open Small音频生成模型,可在手机端离线运行,8秒内生成11秒音频,是目前最快的音频生成模型;该模型拥有3.41亿参数,专为生成短音频和音效设计,训练数据来自免版权的Free Music Archive和Freesound,但仅支持英文提示;模型对年收入低于100万美元的用户免费开放,但有一定局限性,如无法生成逼真人声和高质…

    分享到
  • 腾讯元宝插件上线Chrome:支持划词提问 外文网页翻译

    11:26

    腾讯元宝浏览器插件在Chrome应用商店上线,支持网页划词提问、内容总结、外文网页翻译和一键收藏等功能;插件在页面右侧设有悬浮球和侧边栏,方便用户进行截图提问、上传文件和搜索内容,更高效的浏览网页时处理信息;该插件基于腾讯混元与DeepSeek大模型,目前仅在Chrome可用,更多版本将推出。

    分享到
  • 超越OpenAI、ElevenLabs?MiniMax新一代人格化语音模型

    11:26

    MiniMax新一代语音模型Speech-02在Artificial Analysis榜单上超越OpenAI和ElevenLabs,在字错率和说话人相似度等指标上达到SOTA水平;Speech-02实现了真正的零样本语音克隆,并采用创新的Flow-VAE架构,只需几秒音频即可高度还原说话人音色、语调和节奏;该模型支持32种语言,可实现任意音色灵活控制和情感调节,成本仅为ElevenLabs竞品的1…

    分享到
  • Anthropic新版Claude Sonnet和Opus也在路上,可极限推理

    11:25

    Anthropic将在未来几周推出新版Claude Sonnet和Opus,最大亮点是"极限推理"功能,能在推理和工具使用间建立动态循环;新模型能够自主暂停、重新评估问题并调整策略,在代码生成任务中可自动测试和修正错误;消息称确实有个正在测试、代号为Neptune的新模型,最大支持128k tokens上下文长度。

    分享到

搜索