MIT再出王炸!全新自学习AI框架PRefLexOR:让AI像人一样

MIT教授Markus J. Buehler团队提出PRefLexOR框架,实现AI自主深度思考与进化,建立动态关系世界模型;该框架结合偏好优化与强化学习,通过思考令牌标记反思推理阶段,实现多步递归推理和自我改进;PRefLexOR不依赖预先生成数据集,能动态生成任务和反馈,在材料设计领域通过RAG构建知识图谱实现复杂交互。

搜索