-
MiniMax M3 模型正式开源:原生多模态、百万上下文
6 月 16 日消息,MiniMax 昨日宣布,已正式开源旗下多模态旗舰模型 MiniMax M3 的模型权重,并同步公开了 MSA(MiniMax Sparse Attention)技术论文。 MiniMax M3 总参数量 428B,激活参数 23B,官方将其定位为首个从训练第一步(Step 0)起便引入多模态混合训练的开源大模型。 训练阶段大量融入了文本、图像及多模态交错数据,以期在预训练阶…- 1.1k
-
巴西模型 Rio 3.5 引发「缝合」Qwen 质疑
6 月 16 日消息,近日,一个由巴西里约热内卢市政府旗下 IT 公司开源的 Rio 3.5 Open 397B 模型在 AI 社区引发讨论。模型页面显示,它以 MIT 协议开放,总参数约 397B,单 token 激活约 17B,并支持较长上下文。 然而,模型发布不到 24 小时,开源 AI 团队 Nex-AGI 即在 X 平台发声,指出 Rio 3.5 实质上是通过模型合并(Model Mer…- 1k
-
网易有道“子曰 4”多模态模型、语音合成模型全量开源
5 月 23 日消息,网易有道昨日宣布,决定将“子曰”大模型 4.0 的核心双引擎 ——“多模态模型”与“语音合成(TTS)模型”,正式面向全球全量开源。开发者可以免费下载、部署,并基于此进行二次开发。 此次开源的“子曰 4”多模态模型(27B 参数规模)面向教育场景,支持视觉输入的数理能力,做到了行业顶尖水平(SOTA)。 在同等参数的规模模型中,处理带图表的高难度视觉数理问题。 纯文本的中文数…- 2.2k
-
面壁智能开源 MiniCPM-V 4.6
5 月 14日消息,昨日,面壁智能正式发布并开源 1.3B 端侧多模态大模型 MiniCPM-V 4.6,提供 Instruct 与 Thinking 两个版本。 Instruct 版本:面向通用图文理解、STEM 数理推理、文档 OCR、视频时序理解及目标定位等任务,超越 Qwen3.5-0.8B 与 Gemma4-E2B-it; Thinking 版本:面向多图像关联推理、幻觉抑制等高阶任务,…- 2.1k
-
小米开源 OmniVoice 多语言语音克隆 TTS
5 月 8 日消息,昨日,小米 AI 实验室发布并开源多语言语音克隆 TTS 模型 OmniVoice,团队基于 50 个开源数据集构建了 58 万小时的训练数据,覆盖 646 种语种。 中英文合成质量优于主流同类模型,推理速度达到 40 倍实时; 在 24 种语言上,其语音相似度和可懂度超越多款商用系统; 在 102 种语言上,可懂度逼近真实语音,即便是训练数据不足 10 小时的小语种,也能正常…- 2.6k
-
未来三年小米 AI 投入超 600 亿元:MiMo-V2.5 将开源,几乎适配国内所有芯片
4 月 27 日消息,据博主 @粮厂研究员Will 分享,在今天的小米投资者日上,小米集团副总裁、技术委员会主席屈恒发表主题为“Agent 范式重塑小米与人车家全生态”的演讲。 博主总结核心观点如下: Agent 将范式重塑小米与「人车家全生态」 ,未来三年 AI 投入超过 600 亿元,这个数字只是保底,会更高; 小米拥有 AI 时代的全栈能力:基建层、数据层、模型层、框架层和生态层;一方面重塑…- 4.5k
-
迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源
4 月 24 日消息,今天上午,DeepSeek-V4 模型预览版正式上线并同步开源。 DeepSeek-V4 拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本: 即日起登录官网 chat.deepseek.com 或官方 App,即可与最新的 DeepSeek-V4 对话,探索 1M 超长上下文记忆的全新体验。API 服务已同步更…- 3.2k
-
通义千问 Qwen3.6-27B 宣布开源:270 亿参数稠密模型,编程能力超越 15 倍规模 MoE 模型
4 月 23 日消息,阿里云通义千问团队昨日宣布,开源模型家族迎来新成员 ——Qwen3.6-27B。这是一款拥有 270 亿参数的稠密多模态模型,也是社区呼声最高的模型规格。 此前,通义千问已陆续发布了 Qwen3.6-Plus 和 Qwen3.6-35B-A3B,而此次开源的 27B 版本在保持稠密架构优势的同时,全面提升了智能体编程与多模态推理能力。 据官方介绍,Qwen3.6-27B 支持…- 3.2k
-
月之暗面最强模型 Kimi K2.6 发布并开源,代码能力对标 GPT-5.4
4 月 21 日消息,昨天,月之暗面正式发布并开源了新模型 Kimi K2.6,重点升级了代码、AI 智能体和办公能力。 代码能力更强:内部基准测试得分提升约 20%,可不间断编码 13 小时、处理超 4000 行代码,支持 Rust、Go、Python 等多种语言; AI 智能体集群扩容:最多支持 300 个子 AI 智能体并行协作,完成 4000 个步骤,任务完成质量显著提升; 长时自主运行:…- 3.6k
-
Hermes Agent:免费开源AI 智能体框架,越用越聪明的AI Agent
Hermes Agent 是 Nous Research 发布的开源 AI Agent 框架,MIT 协议授权。不同于绑定 IDE 的编程助手或单一 API 的聊天机器人包装器,Hermes Agent 是一个部署在用户自有服务器上的自主智能体,具备跨会话持久记忆和自动技能生成能力——每完成一次复杂任务,框架会自动将解决路径提炼为可复用的技能文件,下次遇到类似任务时直接调用并持续优化,形成&quo…- 5.7k
-
Hermes Agent安装完整教程,零基础踩坑指南
第一步:Hermes Agent 到底是什么? Hermes Agent 是一个开源的 AI智能体(AI Agent),由 Nous Research 团队开发。它不像普通聊天机器人(比如 ChatGPT),它会: 记住你过去的所有对话(长期记忆) 从每次任务中自己学习,自动创建新“技能” 帮你真正做事:执行命令、浏览网页、写文件、管理任务等 支持连接 Telegram、飞书、Discord 等聊…- 8.5k
-
智谱官宣开源最强编程模型 GLM-5.1
4 月 9 日消息,昨天,智谱 AI 正式宣布开源旗舰级 AI 智能体工程模型 GLM-5.1,并继续沿用宽松的 MIT 许可证,支持个人及商业用途。 GLM-5.1 是智谱迄今发布的最强旗舰模型,其核心设计目标是在更长时间跨度内持续有效地执行 AI 智能体任务。 据介绍,GLM-5.1 能够在单次任务中独立、持续工作超过 8 小时,期间自主规划、执行、自我迭代,最终交付完整的工程级成果。 在官方…- 4.1k
-
Google 开源 Gemma 4 系列模型
4 月 3 日消息,今天凌晨,Google DeepMind 发布了新一代开源模型系列 Gemma 4,一次性推出四款覆盖端侧到工作站全场景的模型。 E2B:51 亿总参数、23 亿有效参数,128K 上下文,官方称部分设备内存占用可压至 1.5GB 以下; E4B:80 亿总参数、45 亿有效参数,128K 上下文,MMLU Pro 达 69.4%,接近上一代 27B 水平; 26B A4B M…- 2.9k
-
Jellyfish:一站式 AI 生成短剧(竖屏短剧 / 微短剧)的工具,可一键将剧本转为分镜
Jellyfish是一款一站式AI生成短剧(竖屏短剧/微短剧)漫画视频制作工具,支持从小说文本自动生成分镜、角色、场景,并制作成完整视频。整体定位是“AI短剧工厂”。其核心目标是把短剧生产从手工/半自动模式升级为工业化流水线。该工具不仅完全开源,支持本地部署和二次开发,更在技术层面精准击中了AI视频生成的最大痛点。 Jellyfish功能 输入剧本:只需提供文字剧本,支持简体中文和英文。 智能分镜…- 9.9k
-
NemoClaw:开源AI智能体平台,部署安全 AI 助手的开源工具
NVIDIA NemoClaw 是一款用于部署安全 AI 助手的开源工具。它通过一键式安装,帮助用户快速构建和运行安全可靠的自主 AI 助手,应用于各种场景。NemoClaw 提升了 AI 助手的安全性,并简化了部署流程。 NemoClaw功能 一键安全部署:通过单条命令,快速部署安全、持续运行的 AI 助手。NemoClaw 集成了安全和隐私控制,让开发者更放心地构建和运行 AI 助手。 支持任…- 2.6k
-
OpenAI 为开源项目开发者免费提供半年 ChatGPT Pro 订阅,无 Star 数、月下载量等硬性指标
3 月 7 日消息,OpenAI 今天宣布推出 Codex 开源计划,为开源项目维护者 / 开发者免费提供半年的 ChatGPT Pro 订阅。 OpenAI 表示,开源维护者在全球软件生态系统中默默承担了重要工作,Codex 开源基金在过去一年里已经为许多需要 API 的项目提供支持,总额 100 万美元(注:现汇率约合 691.7 万元人民币)。 同时,领取到免费 ChatGPT Pro 的开…- 1.9k
-
阿里 CEO 确认林俊旸离职:开源策略不变、持续加大 AI 投入
昨天,阿里巴巴 CEO 吴泳铭向通义实验室全体员工发出内部邮件,正式确认通义千问技术负责人林俊旸离职。 信中,吴泳铭宣布公司将成立基础模型支持小组,由吴泳铭本人、通义实验室负责人周靖人及范禹三人共同协调集团资源,支持基础模型建设。 APPSO 从知情人士处了解到,阿里内部正推进新一轮组织战略调整,计划对基础模型进行整体升级,大规模引入顶尖技术人才,战略重心已从依赖单一技术领袖转向更系统化的团队建设…- 2.2k
-
阿里桌面 Agent 工具 CoPaw 开源:自由接入本地模型,支持钉钉、飞书、QQ 等
3 月 2 日消息,阿里云今日宣布,阿里桌面 Agent 工具 CoPaw 正式开源,用户可基于 CoPaw 进行二次开发,自由接入本地模型、编写 Skills 和接入专属消息应用,满足更定制化的场景需求。 据介绍,CoPaw 原生支持钉钉、飞书、QQ、Discord、iMessage 等聊天软件和平台,内置了多种 Skills,用户可一键本地部署也可通过阿里云计算巢和魔搭社区创空间实现一键云端部…- 2.9k
-
NanoClaw:开源轻量级个人AI助手,安全的OpenClaw平替
NanoClaw 是开源的 AI 助手,作为 OpenClaw 的轻量级替代品,每个 Agent 在独立沙箱中运行,仅访问显式挂载的目录。NanoClaw支持 WhatsApp、Telegram、Discord 等多渠道接入,首创个人 AI 助手的 Agent Swarms 集群协作能力。NanoClaw摒弃传统配置,用户通过自然语言指令让 Claude Code 直接修改源码实现 bespoke…- 5.1k
-
蚂蚁集团发布并开源全模态大模型 Ming-Flash-Omni 2.0,看得更准、听得更细、生成更稳
2 月 11 日消息,蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0。在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出。 据介绍,Ming-Flash-Omni 2.0 是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。用户只需用自然语言下指令,即可对音色、语速、语调、音量、情绪与方言等进行精细控制。模型…- 5.1k
-
月之暗面推出最强开源 Agent模型 Kimi K2.5
1 月 28 日消息,昨天,月之暗面正式面向公众推出旗舰大模型最新版本「Kimi K2.5」,在视觉、多模态理解、代码生成与智能体能力方面实现全面升级。 据介绍,Kimi K2.5 采用原生多模态架构,支持文本、图像与视频输入,能够执行图像分析、视频解析、视觉编程等任务。 官方展示内容显示,模型可根据平面图生成 3D 模型、从视频重建网页界面,并在图像推理任务中实现更高精度的路径规划与视觉调试能力…- 2.3k
-
阿里云通义开源 6B 参数 Z-Image 基座模型,生成图片拒绝 AI “大众脸”
1 月 28 日消息,阿里云通义今日(1 月 28 日)正式开源发布 Z-Image 基座模型。 该模型尺寸为 6B,为非蒸馏基座模型,保留全量权重分布,原生支持 CFG 引导机制,为 LoRA、ControlNet 等微调任务提供训练底座。 Z-Image 宣称打破单一维度的写实局限:无论是追求光影的 Photorealism,还是具有情绪张力的动漫与数字艺术,Z-Image 均能捕捉并重构每一…- 2.7k
-
Clawdbot安装部署教程来了,给自己搭个7×24小时AI助理
最近一款开源AI助理Clawdbot在外网十分火爆:它能在服务器上7×24小时运行,用户通过即时通讯平台给它发消息,指挥它做各种工作。 还没用过的可以稍微感受一下它的能力,如图: 和一般的AI聊天机器人相比,Clawdbot更擅长“动手”,上面的案例中,直接把Youtube下载插件的活儿都干了。那如何才能拥有它呢? 一、部署Clawdbot所需要的条件 1、Telegram:这是目前最简单、官方推…- 9.3k
-
Clawdbot 安装与入门教程(手把手新手版)
什么是 Clawdbot? Clawdbot 是一个开源的自托管 AI 助手框架,由社区开发者维护(官网:clawd.bot),它允许你将 AI 模型(如 Anthropic 的 Claude、OpenAI 的 GPT 或其他 API 支持的模型)集成到聊天应用中。通过自然语言对话,你可以让 AI 执行服务器命令、读写文件、搜索互联网、管理日历、发送邮件、控制其他服务,甚至访问手机摄像头或推送通知…- 43.8k
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!






















