FAR AI 实验室:发现GPT-4 API存在重大漏洞

FAR AI实验室发布了一份技术报告,报告指出,通过在15个有害示例或100个良性示例上对模型进行微调,可以移除GPT-4中的核心保障措施,使其能够协助用户完成有害请求。研究结果显示,对API(应用程序接口)所提供的功能进行任何添加都会暴露大量新的漏洞,包括让GPT-4提供有针对性的错误信息、生成恶意代码以及泄露私人电子邮件等个人信息。

报告地址:
https://far.ai/publication/pelrine2023novelapis/paper.pdf

搜索