微软亚洲研究院联合北京大学、西安交通大学等高校提出了一项名为“从错误中学习(LeMA)”的AI训练方法,旨在通过模仿人类学习过程来改进AI的推理能力。该方法通过使用包含错误解答和修正后正确答案的数据来微调模型。研究人员采用GSM8K和MATH测试了LeMA训练法对5个开源大模型的效果,显示在GSM8K和MATH任务中,改进后的LLaMA-2-70B分别达到了83.5%和81.4%的准确率。
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!