SuperCLUE中文大模型测评基准10月榜单发布

10月26日消息,据CLUE中文语言理解测评基准微信公众号发文,10月25日,SuperCLUE发布中文大模型10月榜单。本次评测主要考察模型在中文能力上的表现,包括专业知识技能、语言理解与生成、AI智能体和安全四大能力维度的上百个任务,选取了目前国内外最具代表性的20个通用大语言模型。与9月相比,新增了月之暗面的Moonshot、百度的文心一言4.0、科大讯飞的星火V3.0、vivo的vivoLM和阿里云的Qwen-14B。SuperCLUE通过本次评测发现,国内第一梯队大模型格局已基本形成,头部几个中文大模型已经与GPT3.5极为接近,但与GPT4的距离依然遥远。

搜索