OpenAI:用小模型监督大模型

OpenAI发布了超级对齐(Superalignment)团队的第一篇论文,展示了从弱到强的泛化,通过小模型监督大模型。研究表明,可以使用GPT-2级别的模型来激发GPT-4的大部分能力,达到接近GPT-3.5级别的性能。这使得研究人员可以在取得迭代式经验进展的同时,调整未来的超人模型。OpenAI同步开源了代码,并且启动了一项1000万美元的资助计划,支持研究人员广泛开展超人类AI对齐工作。

论文地址:
https://cdn.openai.com/papers/weak-to-strong-generalization.pdf
开源代码:
https://github.com/openai/weak-to-strong

搜索