大模型评测体系：司南OpenCompass2.0发布

2月01日

admin

大型模型开源开放评测体系司南（OpenCompass2.0）正式发布，旨在为大语言模型、多模态模型等各类模型提供一站式评测服务。OpenCompass2.0全面量化了模型在知识、语言、理解、推理和考试等五大能力维度的表现，客观中立地为大型模型技术创新提供技术支持。OpenCompass2.0同时公布了2023年度大型模型公开评测榜单。评测结果显示，GPT-4 Turbo在各项评测中均表现最佳，智谱清言GLM-4、阿里巴巴Qwen-Max、百度文心一言4.0紧随其后；大语言模型整体能力仍有较大提升空间，复杂推理相关能力仍是短板；在中文场景下，国内的模型更具优势，中文闭源大型模型接近GPT-4 Turbo的水平，开源模型进步迅速，以较小的体量达到较高性能水平，表现出较大的发展潜力。

官网：
https://opencompass.org.cn/
CompassHub社区地址：
https://hub.opencompass.org.cn/home

TOP1

用AI制作宠物吃播视频，百万流量爆款视频教程直接抄
9小时前
TOP2

小米突然发布新模型：媲美 DeepSeek-V3.2
10小时前
TOP3

Google、Shopify 前高管加盟 OpenAI
10小时前
OpenAI 发布新生图模型，PK Nano Banana
10小时前
豆包手机：首批货源已售罄，此前行业内传闻的备货数量均不准确
10小时前
OpenAI 宣布：苹果 Apple Music 即将与 ChatGPT 集成
10小时前
Meta 扩大员工使用竞争对手 AI工具权限，含 ChatGPT-5、 Gemini 3 Pro 等
10小时前
AI Diagram Generator：图表生成器，AI一键生成流程图、思维导图、UML图等多种图表
14小时前

❯

搜索

幸运之星即将降临……

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠

_￥_優惠

使用時效：无法使用

使用時效：
之前

使用時效：预期有效

优惠编号：
×

限制以下商品使用：限制以下商品分类用途：不限制使用：

[{{ct.name}}]

所有商品及商品类型需求使用

没有优惠可用！

购物车

×

德

空空如也！

清空貨櫃前往

您的有新私信

没有新私信

写新私信查看全部

{{userData.name}}已认证

大模型评测体系：司南OpenCompass2.0发布

用AI制作宠物吃播视频，百万流量爆款视频教程直接抄

小米突然发布新模型：媲美 DeepSeek-V3.2

Google、Shopify 前高管加盟 OpenAI

OpenAI 发布新生图模型，PK Nano Banana

豆包手机：首批货源已售罄，此前行业内传闻的备货数量均不准确

OpenAI 宣布：苹果 Apple Music 即将与 ChatGPT 集成

Meta 扩大员工使用竞争对手 AI工具权限，含 ChatGPT-5、 Gemini 3 Pro 等

AI Diagram Generator：图表生成器，AI一键生成流程图、思维导图、UML图等多种图表

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注