消息称阿里将在下周发布 Qwen3

获悉,阿里即将在 2025 年 4 月第二周(即下周)发布新模型 Qwen3,这将是阿里在 2025 年上半年最重要的模型产品,而距离 2024 年 9 月阿里在云栖大会上发布 Qwen2.5 ,已过去了大约七个月的时间。上月,通过 GitHub 信息显示,Qwen3 和 Qwen3 MoE 版本已经给 transformers 提了 PR。且阿里云通义千问团队早前透露,Qwen3 预计将于 2025 年第二季度正式发布。据了解,在发布 Qwen2.5 后,阿里云内部的基础模型团队已经开始推动 Qwen3 相关项目,但 2025 年初 DeepSeek 的火爆,改变了团队的部分思路与重心。知情人士透露,DeepSeek 火爆后,推理能力已经成为大模型绕不开的关键能力,并且阿里云基础模型团队把策略中心进一步向模型的推理能力倾斜。

搜索