智谱 GLM 大模型在模型幻觉排行榜中居首,事实一致性达 98.7%

近日,智谱宣布,旗下 GLM-4-9B 模型在基于幻觉评估模型 HHEM-2.1-Open 的大模型幻觉排行榜中,以 1.3% 的幻觉率排名第一。据悉,智谱 GLM-4-9B 模型在该排行榜中,超过 OpenAI 的 GPT 系列和 Google 的 Gemini 系列在内的一众世界顶尖模型。从具体来看,智谱 GLM-4-9B 模型事实一致性率高达 98.7%,回答率 100%,幻觉率则仅有 1.3%,在参评的 85 个模型中排名第一。据了解,智谱 GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B 及其人类偏好对齐的版本 GLM-4-9B-Chat 均表现出较高的性能。

搜索