获悉,阿里即将在 2025 年 4 月第二周(即下周)发布新模型 Qwen3,这将是阿里在 2025 年上半年最重要的模型产品,而距离 2024 年 9 月阿里在云栖大会上发布 Qwen2.5 ,已过去了大约七个月的时间。上月,通过 GitHub 信息显示,Qwen3 和 Qwen3 MoE 版本已经给 transformers 提了 PR。且阿里云通义千问团队早前透露,Qwen3 预计将于 2025 年第二季度正式发布。据了解,在发布 Qwen2.5 后,阿里云内部的基础模型团队已经开始推动 Qwen3 相关项目,但 2025 年初 DeepSeek 的火爆,改变了团队的部分思路与重心。知情人士透露,DeepSeek 火爆后,推理能力已经成为大模型绕不开的关键能力,并且阿里云基础模型团队把策略中心进一步向模型的推理能力倾斜。
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!
