开源 LLM 安全扫描器

阅读：评论：0

开源 LLM 安全扫描器

Vigil 是一款开源安全扫描程序，可检测即时注入、越狱以及对大型语言模型(LLM) 的其他潜在威胁。

当攻击者使用专门设计的输入成功影响 LLM 时，就会出现即时注入。这导致 LLM 无意中实现了攻击者设定的目标。

我对 LLM 的可能性感到非常兴奋，但也注意到围绕它们构建的应用程序以及我们允许应用程序访问的数据需要更好的安全实践。

这个项目给了我一个很好的机会在人工智能和网络安全的交叉点上构建一些东西。希望它能为其他安全研究人员和开发人员提供一个尝试现有的 LLM 输入和输出安全措施，甚至创建自己的安全措施的开始。

Vigil 的创建者 Adam M. Swanda 告诉我们，这比期望直接在生产中使用的任何东西都更有“可能”。

Vigil 可在 GitHub 上下载。该存储库还提供开始自托管所需的检测签名和数据集。

Swanda 计划在短期内继续开发 Vigil。

具体来说，他一直在开发一个应用程序，旨在根据自定义数据集评估 Vigil 及其各种扫描仪。

该应用程序评估误报和其他相关指标等方面。

此外，Swand 正在探索检测基于图像的提示注入的方法。

本文发布于:2024-01-31 09:08:33，感谢您对本站的认可！

上一篇：背单词

标签：扫描器开源 LLM

留言与评论（共有 0 条评论）