首页 > 其他分享 >garak - 开源的 LLMs 漏洞扫描工具

garak - 开源的 LLMs 漏洞扫描工具

时间:2025-01-11 21:57:35浏览次数:3  
标签:name LLMs 模型 生成器 garak -- 开源 model

3300 Stars 288 Forks 306 Issues 29 贡献者 Apache-2.0 License Python 语言

代码: https://github.com/NVIDIA/garak

主页: https://discord.gg/uVch4puUCs

更多AI开源软件AI开源 - 小众AI

​garak​检查是否可以以我们不希望的方式使 LLM 失败。 探测幻觉、数据泄漏、及时注射、错误信息、毒性产生、越狱和许多其他弱点。如果您知道 or / Metasploit Framework,garak 的功能与它们有些相似,但适用于 LLM。garaknmapmsf​

​garak​重点介绍使 LLM 或对话系统失败的方法。它结合了静态、动态和自适应探针来探索这一点。

主要功能

目前支持:

安装和使用

​garak​是一个命令行工具。它是在 Linux 和 OSX 中开发的。

标准安装pip​

只需从 PyPI 获取它,您就可以开始了:

python -m pip install -U garak
使用 安装开发版本pip​

的标准 pip 版本会定期更新。要从 GitHub 获取更新的版本,请尝试:garak​

python -m pip install -U git+https://github.com/NVIDIA/garak.git@main
从源克隆

​garak​有自己的依赖项。您可以在其自己的 Conda 环境中安装:garak​

conda create --name garak "python>=3.10,<=3.12"
conda activate garak
gh repo clone NVIDIA/garak
cd garak
python -m pip install -e .

好吧,如果一切顺利,您可能已经准备好了!

注意:如果您在迁移到 GitHub 组织之前进行了克隆,但您正在 URI 中阅读此内容,请按如下方式更新您的远程仓库:NVIDIAgithub.com/NVIDIA​

git remote set-url origin https://github.com/NVIDIA/garak.git
使用

一般语法为:

​garak <options>​

​garak​需要知道要扫描的模型,默认情况下,它将使用每个探测推荐的漏洞检测器,尝试在该模型上知道的所有探测。您可以使用以下方法查看探针列表:

​garak --list_probes​

要指定生成器,请使用 和 (可选)选项。模型类型指定模型族/界面;Model Name 指定要使用的确切模型。下面的 “生成器简介” 部分介绍了一些支持的生成器。一个简单的生成器系列是 Hugging Face 模型;要加载其中一个,请在 Hub 上将 to 和 to 设置为模型的名称(例如 )。某些生成器可能需要将 API 密钥设置为环境变量,如果需要,他们会通知您。--model_type--model_name--model_typehuggingface--model_name"RWKV/rwkv-4-169m-pile"​

​garak​默认情况下,会运行所有探测,但您也可以对此进行具体说明。 将仅使用 PromptInject 框架的方法。您还可以通过在 ;例如,将使用基于语言模型风险卡框架生成诽谤的模型的检查实现。--probes promptinject.--probes lmrc.SlurUsage​

如需帮助和灵感,请在 TwitterDiscord 上找到我们!

例子

探测 ChatGPT 以进行基于编码的提示注入 (OSX/*nix)(将示例值替换为真实的 OpenAI API 密钥)

export OPENAI_API_KEY="sk-123XXXXXXXXXXXX"
python3 -m garak --model_type openai --model_name gpt-3.5-turbo --probes encoding

查看 GPT2 的 Hugging Face 版本是否容易受到 DAN 11.0 的攻击

python3 -m garak --model_type huggingface --model_name gpt2 --probes dan.Dan_11_0

标签:name,LLMs,模型,生成器,garak,--,开源,model
From: https://blog.csdn.net/puterkey/article/details/144960034

相关文章

  • 终于决定:把自己家的能源管理系统开源了!
    决定了很久把自己公司的能管平台开源了,部分功能和bug正在修复中。欢迎star欢迎轻拍地址:https://gitee.com/ustcyc/zhitan-ems介绍通过物联网技术,采集企业水、电、气、热等能耗数据,帮企业建立能源管理体系,找到跑冒滴漏,从而为企业节能提供依据。进一步为企业实现碳跟踪、碳盘......
  • 2、数据验证组件框架:FluentValidation for .NET - 开源项目研究文章
    FluentValidation是一个开源的.NET验证框架,以其优雅、简洁和链式操作而著称。它支持MVC5、WebApi2和ASP.NETCore的深度集成,并提供了丰富的内置验证器,同时也支持自定义验证器和本地化多语言。使用FluentValidation,开发者可以通过继承AbstractValidator<T>来创......
  • AI开源整合包
    项目B站视频下载地址解压密码FaceFusion3.1.1-AI换脸[Github地址]FaceFusion3.1.1换脸最新版本,支持表情编辑,图片&视频换脸,画质增强,禁用了内容检测,全中文汉化,一键本地部署整合包,解压即用[夸克网盘]提取码:无[百度网盘]暂无提取码:无无C......
  • 阿里开源项目Arthas,java开源诊断工具使用教程
    摘要:最近在项目中遇到一个问题,客户那边部署的项目线上出现了问题,需要远程调试,单凭log日志很难判断问题出现的原因,且无法进行远程debug调。,一开始是通过加日志的方式去排查问题,但日志加上之后还需要重新部署,这样来来回回部署了好几次,这方案非常浪费时间。了解到Arthas开源工具可以......
  • 无需昂贵GPU:本地部署开源AI项目LocalAI在消费级硬件上运行大模型
    无需昂贵GPU:本地部署开源AI项目LocalAI在消费级硬件上运行大模型随着人工智能技术的快速发展,越来越多的AI模型被广泛应用于各个领域。然而,运行这些模型通常需要高性能的硬件支持,特别是GPU(图形处理器),这往往导致较高的成本门槛。为了打破这一限制,开源AI项目LocalAI提供了一种......
  • Word 转成pdf及打印的开源方案支持xp
    Word转成pdf、打印的方案几乎没有免费开源的方案,现在提供一个通过LibreOffice实现的方案操作依赖LibreOffice需要安装,点此下载老版本5.4.7.2是最后一个支持xp的版本如需xp要请安装此版本LibreOffice官方介绍LibreOffice是一款开放源代码的自由免费全能办公软件,可运行于M......
  • 开源库:jcon-cpp
    说明jcon-cpp是一个用于C++的JSON-RPC库,它允许开发者通过JSON-RPC协议进行进程间通信(IPC)。JSON-RPC是一种轻量级的远程过程调用协议,基于JSON格式数据进行通信。基于MIT协议,最新代码基于Qt6实现。可通过Tcp和WebSocket实现RPC。调整源码以适配Qt5修改json_rpc_server......
  • 目标客户营销(ABM)结合开源AI智能名片2+1链动模式S2B2C商城小程序的策略与实践
    摘要:在数字化营销日益盛行的今天,目标客户营销(AccountBasedMarketing,ABM)作为一种高度定制化的营销策略,正逐步成为企业获取高质量客户、提升市场竞争力的重要手段。与此同时,开源AI智能名片2+1链动模式S2B2C商城小程序作为一种创新的数字化营销工具,以其强大的数据分析、智能推......
  • 基于开源AI智能名片2+1链动模式S2B2C商城小程序的企业数字化转型深度策略与实践
    摘要:在大数据、人工智能等前沿技术的推动下,企业数字化转型已成为提升竞争力的关键路径。开源AI智能名片2+1链动模式S2B2C商城小程序作为一种创新工具,凭借其强大的数据分析、智能推荐及社交裂变能力,为企业提供了一个从用户洞察、产品优化到供应链管理的全方位解决方案。本文旨在......
  • 开源飞控之量产固件烧录&品质测试讨论
    开源飞控之量产固件烧录&品质测试讨论1.源由2.核心目标2.1实时数据采集与追踪2.2质量管理2.3设备管理2.4工艺与流程控制2.5异常管理与报警机制3.工程技术3.1固件烧录3.2品质测试3.3数据分析4.总结1.源由智能产品(IT产品)的大规模生产早在笔者从业2006......