Meta宣布推出Purple Llama项目,旨在为开发人员提供公平竞争的环境,并提供开放的信任与安全工具和评估。作为项目的第一步,Meta发布了CyberSec Eval,这是一套用于对大模型网络安全进行评估的基准工具。此外,Meta还发布了Llama Guard,这是一个用于输入/输出过滤的安全分类器,旨在优化部署的便利性。
Meta解释了为什么选择“紫色”作为该项目的名称:为了真正解决生成式AI带来的挑战,需要同时采取攻击(红队)和防御(蓝队)两种姿态。紫色团队由红队和蓝队共同负责,以合作的方式评估和降低潜在风险。