北大联合多所高校团队发布了一份AI对齐全面性综述。该综述提供了广泛的AI对齐介绍,明确了对齐的目标,包括鲁棒性、可解释性、可控性和道德性,并将对齐方法的范围划分为前向对齐和后向对齐。目前,在前向对齐的两个显着研究领域是从反馈中学习和在分布偏移下学习,而后向对齐由对齐保证和AI治理组成。该综述整合了多方资源,包括教程、论文列表、课程资源等,且该论文将持续更新,面向AI对齐社区长期开放讨论。
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!