-
红杉中国推出智能体 基准测试「xbench」
日前,知名投资机构「红杉中国」推出 AI Agent(智能体)基准测试工具「xbench」,并公布了相关技术报告。 据介绍,xbench 的诞生旨在解决「模型能力和 AI 实际效用之间的关系」和「不同时间维度中能力的比较」这两个核心问题。因此红杉中国提出了「为现实世界的实用性开发新的任务设置和评估方式」以及「建立长青评估体系」两大方向。 本次 xbench 推出双轨系列评估集,分为「xbench-…- 800
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!
