-
业界首个:腾讯混元-A13B 模型发布并开源,极端条件 1 张中低端 GPU 卡即可部署
6 月 27 日消息,腾讯混元大模型家族今日宣布迎来新成员 —— 混元-A13B 模型发布并开源,号称是“业界首个 13B 级别的 MoE 开源混合推理模型”。 混元-A13B 作为基于专家混合(MoE)架构的大模型,总参数 800 亿、激活参数 130 亿,号称“在效果比肩顶尖开源模型的同时,大幅降低推理延迟与计算开销”。 腾讯混元表示,这对个人开发者和中小企业来说,无疑是个好消息,极端条件下仅…- 929
-
阿里发布国内首个“混合推理模型”Qwen3 并开源:支持两种思考模式,预训练约 36 万亿个 token、119 种语言和方言
4 月 29 日消息,今日凌晨,阿里巴巴发布了新一代通义千问 Qwen3 模型,一举登顶全球最强开源模型。 Models Layers Heads (Q / KV) Tie Embedding Context Length Qwen3-0.6B 28 16 / 8 Yes 32K Qwen3-1.7B 28 16 / 8 Yes 32K Qwen3-4B 36 32 / 8 Yes 32K …- 2.6k
-
Anthropic 推出新一代混合推理模型 Claude 3.7 Sonnet:该公司“最智能”AI 模型
2 月 25 日消息,今日人工智能公司 Anthropic 宣布推出其首款“混合推理模型”——Claude 3.7 Sonnet。该模型可以解决更复杂的问题,并在数学和编码等领域中性能超过了以前的模型。 Anthropic 公司表示,这是其有史以来“最智能”的 AI 模型,称这种“混合型”模型同时具备“推理模式”(停下来思考复杂答案)与传统模式(实时生成答案)的能力,并表示该模型是市面上唯一的此类…- 2.4k
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!


