专业智能体指导,让Mistral-7B小模型学会数学推理!

Mistral-7B模型,一个7亿参数的小型语言模型,通过专业智能体辅助创建高质量数学问题数据集,实现了高准确率;利用迭代学习技术,模型在GSM 8k数据集上达到86.81%的准确率,无需依赖模型集成或外部工具;该模型在训练过程中包括有监督微调和通过正负信号的迭代学习,显著提升了解决数学问题的能力。

搜索