全部标签

开源

Dario Amodei：从未主张禁止开源权重模型

7 月 29 日消息，据 TechCrunch 报道，Anthropic CEO Dario Amodei 于当地时间 27 日发布博文，就外界关于 Anthropic 支持禁止开源权重模型的传言作出回应。 Amodei 在博文中明确表示，「Anthropic 从未主张禁止开源权重模型」，并强调不具备危险能力的开源权重模型「是一种公共品」，能为企业、开发者和研究人员带来价值。他同时指出，即便是来…
资讯
- 1.4k
7月29日
Anthropic 迟迟不签公开信成“众矢之的”，CEO Dario Amodei 解释称公司从未主张禁止开源 AI模型

7 月 28 日消息，近期关于 AI 是否要开放权重（Open-weight）的话题成为行业讨论焦点。上周五，包括英伟达、Meta 和微软在内的 20 多家公司共同签署了题为《开放权重与美国 AI 领导力》（Open Weights and American AI Leadership）的公开信，支持开放权重 AI。到了周末，OpenAI、谷歌和 SpaceX 也签署了这封信。Anthropi…
资讯
- 1.5k
7月28日
吴恩达开源桌面 AI 智能体 OpenWorker，已获 3.7k Star

7 月 26 日消息，吴恩达（Andrew Ng）（7 月 24 日）在领英（LinkedIn）发布动态，宣布推出开源 AI 智能体 OpenWorker，不仅满足聊天交互，还能高效完成用户交代的任务。在运行平台上，适用于苹果 macOS 的 OpenWorker 已经上线，Github 页面显示 Windows 版已支持运行，但尚未签名。 OpenWorker 基于 Ng 的 aisuite …
资讯
- 2.3k
7月26日
黄仁勋：美国无需害怕中国开源 AI 模型，应警惕国内「封禁」呼声

7 月 23 日消息，英伟达 CEO 黄仁勋接受 Axios 采访时表示，美国无需害怕中国开源 AI模型，更应警惕要求封禁这些模型的声音。他称中国模型「非常出色」，优秀的开源模型应当被使用，美国企业也应被允许采用这些模型。这番表态出现在月之暗面发布 Kimi K3、美国政界重新讨论中国开放模型风险之后。OpenAI 与 Anthropic 指责中国竞争者通过蒸馏获取其模型能力，并提醒华盛顿关注开…
资讯
- 1.9k
7月23日
港大开源 AI 智能体导师 DeepTutor v1.5

7 月 8 日消息，港大数据智能实验室（HKUDS）近日发布了开源 AI 智能体导师 DeepTutor v1.5，该版本在文档解析引擎、RAG 摄取管线及 Python 3.14+ 兼容性上完成了多项升级。 DeepTutor 的核心设计思路是将聊天、测验、研究、可视化、解题与学习路径规划六个教学环节并入同一个智能体运行闭环，学生在不同任务间切换时无需中断后台引擎，学习上下文与多层级记忆会自动同…
资讯
- 3.2k
7月8日
葡萄牙发布首个欧洲葡语开源大语言模型 AMALIA

7 月 2 日消息，葡萄牙政府当地时间本月 1 日宣布，首个基于欧洲葡萄牙语开发的开源大语言模型 AMALIA 正式发布。 1AI了解到作为葡萄牙的国家战略项目，AMALIA 模型由来自葡萄牙多家学术机构的 60 余位研究人员历时 18 个月开发而成，先期投资 550 万欧元，利用了 Deucalion、MareNostrum 5 等算力基础设施。其开发的首个阶段利用约 4 万亿个葡语单词训练出…
资讯
- 1.5k
7月2日
网易有道开源 Confucius4-TTS，3 秒音频即可克隆音色

6 月 25 日消息，网易有道昨日宣布推出「子曰 4.0」TTS 语音合成引擎 Confucius4-TTS。官方称，这是业内首个支持 14 种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型。 Confucius4-TTS 支持零样本语音克隆。用户提供 3 秒音频素材后，无需参考文本和前期训练，模型即可完成音色克隆；官方称克隆音色与原声相似度超过 85%，克隆任务准确度达…
资讯
- 2.8k
6月25日
京东开源实时视频视觉语言交互模型 JoyAI-VL-Interaction

6 月 23 日消息，昨天，京东宣布开源实时视频视觉语言交互模型 JoyAI-VL-Interaction。官方称，这是全球首个全栈开源的 interaction 模型和系统，并获得 vLLM-Omni 的 day-0 原生支持。 JoyAI-VL-Interaction 支持语音输入输出、可视化界面、长期记忆、后台模型接口和 vLLM 部署方案。京东称，开发者可替换 ASR、TTS、后台模型、外…
资讯
- 3.1k
6月23日
蔡崇信：阿里全面投入 AI，开源的主要推动力量来自中国企业

6 月 19 日消息，昨日，阿里巴巴集团主席蔡崇信在欧洲科技峰会 VivaTech 2026 上，阐述了阿里巴巴全栈 AI 的发展战略。蔡崇信在一场对谈中提出，AI 的总潜在市场规模（TAM）应当对标人类生产力本身。“AI 正在创造等同于人类智能和人类生产力的价值单元。放眼全球，超过 100 万亿美元的 GDP 中，至少有一半 ——50 万亿美元，是关于人类生产力和人类智能的，这就是 AI 的总…
资讯
- 5k
6月19日
智谱开源 GLM-5.2，主打 1M 上下文和长程 Coding 任务

6 月 18 日消息，智谱昨日宣布上线并开源 GLM-5.2，新模型专注 Coding 与长程任务。智谱称，GLM-5.2 具备 1M 无损上下文，面向自动化研究、性能优化、复杂系统工程和深度调试等 Coding Agent 场景训练；在 FrontierSWE 长程任务评测中，GLM-5.2 Max 10 Hrs 得分 72.6%，低于 Claude Opus 4.8 Max 20 Hrs …
资讯
- 2.7k
6月18日
MiniMax M3 模型正式开源：原生多模态、百万上下文

6 月 16 日消息，MiniMax 昨日宣布，已正式开源旗下多模态旗舰模型 MiniMax M3 的模型权重，并同步公开了 MSA（MiniMax Sparse Attention）技术论文。 MiniMax M3 总参数量 428B，激活参数 23B，官方将其定位为首个从训练第一步（Step 0）起便引入多模态混合训练的开源大模型。训练阶段大量融入了文本、图像及多模态交错数据，以期在预训练阶…
资讯
- 3.2k
6月16日
巴西模型 Rio 3.5 引发「缝合」Qwen 质疑

6 月 16 日消息，近日，一个由巴西里约热内卢市政府旗下 IT 公司开源的 Rio 3.5 Open 397B 模型在 AI 社区引发讨论。模型页面显示，它以 MIT 协议开放，总参数约 397B，单 token 激活约 17B，并支持较长上下文。然而，模型发布不到 24 小时，开源 AI 团队 Nex-AGI 即在 X 平台发声，指出 Rio 3.5 实质上是通过模型合并（Model Mer…
资讯
- 1.9k
6月16日
网易有道“子曰 4”多模态模型、语音合成模型全量开源

5 月 23 日消息，网易有道昨日宣布，决定将“子曰”大模型 4.0 的核心双引擎 ——“多模态模型”与“语音合成（TTS）模型”，正式面向全球全量开源。开发者可以免费下载、部署，并基于此进行二次开发。此次开源的“子曰 4”多模态模型（27B 参数规模）面向教育场景，支持视觉输入的数理能力，做到了行业顶尖水平（SOTA）。在同等参数的规模模型中，处理带图表的高难度视觉数理问题。纯文本的中文数…
资讯
- 2.8k
5月23日
面壁智能开源 MiniCPM-V 4.6

5 月 14日消息，昨日，面壁智能正式发布并开源 1.3B 端侧多模态大模型 MiniCPM-V 4.6，提供 Instruct 与 Thinking 两个版本。 Instruct 版本：面向通用图文理解、STEM 数理推理、文档 OCR、视频时序理解及目标定位等任务，超越 Qwen3.5-0.8B 与 Gemma4-E2B-it； Thinking 版本：面向多图像关联推理、幻觉抑制等高阶任务，…
资讯
- 3.5k
5月14日
小米开源 OmniVoice 多语言语音克隆 TTS

5 月 8 日消息，昨日，小米 AI 实验室发布并开源多语言语音克隆 TTS 模型 OmniVoice，团队基于 50 个开源数据集构建了 58 万小时的训练数据，覆盖 646 种语种。中英文合成质量优于主流同类模型，推理速度达到 40 倍实时；在 24 种语言上，其语音相似度和可懂度超越多款商用系统；在 102 种语言上，可懂度逼近真实语音，即便是训练数据不足 10 小时的小语种，也能正常…
资讯
- 3.6k
5月8日
未来三年小米 AI 投入超 600 亿元：MiMo-V2.5 将开源，几乎适配国内所有芯片

4 月 27 日消息，据博主 @粮厂研究员Will 分享，在今天的小米投资者日上，小米集团副总裁、技术委员会主席屈恒发表主题为“Agent 范式重塑小米与人车家全生态”的演讲。博主总结核心观点如下： Agent 将范式重塑小米与「人车家全生态」，未来三年 AI 投入超过 600 亿元，这个数字只是保底，会更高；小米拥有 AI 时代的全栈能力：基建层、数据层、模型层、框架层和生态层；一方面重塑…
资讯
- 4.8k
4月27日
迈入百万上下文普惠时代：DeepSeek-V4 模型预览版正式上线并同步开源

4 月 24 日消息，今天上午，DeepSeek-V4 模型预览版正式上线并同步开源。 DeepSeek-V4 拥有百万字超长上下文，在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本：即日起登录官网 chat.deepseek.com 或官方 App，即可与最新的 DeepSeek-V4 对话，探索 1M 超长上下文记忆的全新体验。API 服务已同步更…
资讯
- 4.3k
4月24日
通义千问 Qwen3.6-27B 宣布开源：270 亿参数稠密模型，编程能力超越 15 倍规模 MoE 模型

4 月 23 日消息，阿里云通义千问团队昨日宣布，开源模型家族迎来新成员 ——Qwen3.6-27B。这是一款拥有 270 亿参数的稠密多模态模型，也是社区呼声最高的模型规格。此前，通义千问已陆续发布了 Qwen3.6-Plus 和 Qwen3.6-35B-A3B，而此次开源的 27B 版本在保持稠密架构优势的同时，全面提升了智能体编程与多模态推理能力。据官方介绍，Qwen3.6-27B 支持…
资讯
- 3.9k
4月23日
月之暗面最强模型 Kimi K2.6 发布并开源，代码能力对标 GPT-5.4

4 月 21 日消息，昨天，月之暗面正式发布并开源了新模型 Kimi K2.6，重点升级了代码、AI 智能体和办公能力。代码能力更强：内部基准测试得分提升约 20%，可不间断编码 13 小时、处理超 4000 行代码，支持 Rust、Go、Python 等多种语言； AI 智能体集群扩容：最多支持 300 个子 AI 智能体并行协作，完成 4000 个步骤，任务完成质量显著提升；长时自主运行：…
资讯
- 4.6k
4月21日
Hermes Agent：免费开源AI 智能体框架，越用越聪明的AI Agent

Hermes Agent 是 Nous Research 发布的开源 AI Agent 框架，MIT 协议授权。不同于绑定 IDE 的编程助手或单一 API 的聊天机器人包装器，Hermes Agent 是一个部署在用户自有服务器上的自主智能体，具备跨会话持久记忆和自动技能生成能力——每完成一次复杂任务，框架会自动将解决路径提炼为可复用的技能文件，下次遇到类似任务时直接调用并持续优化，形成&quo…
产品
- 8.1k
4月15日
Hermes Agent安装完整教程，零基础踩坑指南

第一步：Hermes Agent 到底是什么？ Hermes Agent 是一个开源的 AI智能体（AI Agent），由 Nous Research 团队开发。它不像普通聊天机器人（比如 ChatGPT），它会：记住你过去的所有对话（长期记忆）从每次任务中自己学习，自动创建新“技能” 帮你真正做事：执行命令、浏览网页、写文件、管理任务等支持连接 Telegram、飞书、Discord 等聊…
教程
- 13.6k
4月15日
智谱官宣开源最强编程模型 GLM-5.1

4 月 9 日消息，昨天，智谱 AI 正式宣布开源旗舰级 AI 智能体工程模型 GLM-5.1，并继续沿用宽松的 MIT 许可证，支持个人及商业用途。 GLM-5.1 是智谱迄今发布的最强旗舰模型，其核心设计目标是在更长时间跨度内持续有效地执行 AI 智能体任务。据介绍，GLM-5.1 能够在单次任务中独立、持续工作超过 8 小时，期间自主规划、执行、自我迭代，最终交付完整的工程级成果。在官方…
资讯
- 5.9k
4月9日
Google 开源 Gemma 4 系列模型

4 月 3 日消息，今天凌晨，Google DeepMind 发布了新一代开源模型系列 Gemma 4，一次性推出四款覆盖端侧到工作站全场景的模型。 E2B：51 亿总参数、23 亿有效参数，128K 上下文，官方称部分设备内存占用可压至 1.5GB 以下； E4B：80 亿总参数、45 亿有效参数，128K 上下文，MMLU Pro 达 69.4%，接近上一代 27B 水平； 26B A4B M…
资讯
- 3.9k
4月3日
Jellyfish：一站式 AI 生成短剧（竖屏短剧 / 微短剧）的工具，可一键将剧本转为分镜

Jellyfish是一款一站式AI生成短剧（竖屏短剧/微短剧）漫画视频制作工具，支持从小说文本自动生成分镜、角色、场景，并制作成完整视频。整体定位是“AI短剧工厂”。其核心目标是把短剧生产从手工/半自动模式升级为工业化流水线。该工具不仅完全开源，支持本地部署和二次开发，更在技术层面精准击中了AI视频生成的最大痛点。 Jellyfish功能输入剧本：只需提供文字剧本，支持简体中文和英文。智能分镜…
产品
- 13k
3月20日