微软:开源生成式AI风险识别工具PyRIT

微软发布PyRIT开源自动化框架,是一款Python风险识别工具包,帮助安全专业人员和机器学习工程师识别生成式AI系统的潜在风险。微软的AI红队已经开始使用该工具来检查包括Copilot在内的生成式AI系统中的风险。PyRIT框架的工作原理是:PyRit Agent向目标生成式AI系统发送恶意提示词,在接收到生成式AI系统的回应后,将回应发送给PyRIT评分引擎,评分引擎再将结果反馈给PyRit Agent。Agent根据评分引擎的反馈发送新的提示词,这个自动化过程会持续进行,直到安全专家获取所需的结果为止。

GitHub地址:
https://github.com/Azure/PyRIT

搜索