首页 > 其他分享 >大语言模型(LLM)安全性测试SecBench平台洞察分析

大语言模型(LLM)安全性测试SecBench平台洞察分析

时间:2024-03-06 10:58:58浏览次数:16  
标签:网络安全 评测 洞察 接入 模型 SecBench 安全 LLM

 摘要 业界首个网络安全大模型评测平台SecBench正式发布(2024-1-19),主要解决开源大模型在网络安全应用中安全能力的评估难题,旨在为大模型在安全领域的落地应用选择基座模型提供参考,加速大模型落地进程。同时,通过建设安全大模型评测基准,为安全大模型研发提供公平、公正、客观、全面的评测能力,推动安全大模型建设。  

一、SecBench设计架构

SecBench网络安全大模型评测平台,将重点从能力、语言、领域、安全证书考试四个维度对大模型在网络安全领域的各方面能力进行评估:

https://image.jiqizhixin.com/uploads/editor/c6c6919d-66c1-48e1-aa9d-7bb53090609c/1705644443024.png
                                                        SecBench网络安全大模型评测整体设计架构

                                        GPT-4在能力维度、语言维度以及安全领域能力的评估结果

 

                                GPT-4在各类安全证书考试中的评估结果(绿色为通过考试)

主要围绕三个维度进行构建:

一是积累行业独有的网络安全评测数据集。评测数据是评测基准建设的基础,也是大模型能力评测最关键的部分。

二是搭建方便快捷的网络安全大模型评测框架。“百模大战”下,大模型的形态各异,有HuggingFace上不断涌现的开源大模型,有类似GPT-4、腾讯混元、文心一言等大模型API服务,以及自研本地部署的大模型。

三是输出全面、清晰的评测结果。网络安全大模型研发的不同阶段其实对评测的需求不同。

 

二、SecBench评测框架

SecBench网络安全评测框架可以分为数据接入、模型接入、模型评测、结果输出四个部分,通过配置文件配置数据源、评测模型、评估指标,即可快速输出模型评测结果。数据接入:在数据接入上,SecBench支持多类型数据接入,如选择题、判断题、问答题等,同时支持自定义数据接入及评测prompt模板定制化。https://image.jiqizhixin.com/uploads/editor/992d5e2c-a300-492f-a6cb-a45ecc2e6a8a/1705644530365.png

                                                           SecBench网络安全大模型评测框架

 

数据接入:在数据接入上,SecBench支持多类型数据接入,如选择题、判断题、问答题等,同时支持自定义数据接入及评测prompt模板定制化。

模型接入:在模型接入上,SecBench同时支持HuggingFace开源模型、大模型API服务、本地部署大模型自由接入,还支持用户自定义模型。

模型评测:在模型评测上,SecBench支持多任务并行,加快评测速度。此外,SecBench已内置多个评估指标以支持常规任务结果评估,也支持自定义评估指标满足特殊需求。

结果输出:在结果输出上,SecBench不仅可以将评测结果进行前端页面展示,还可以输出模型评测中间结果,如配置文件、输入输出、评测结果文件等,支持网络安全大模型研发人员数据分析需求。

 

SecBench评测数据:

语言维度:覆盖中文、英文两类常见语言的评测。

能力维度:从安全视角,支持大模型对安全知识的知识记忆能力、逻辑推理能力、理解表达能力的评估。

领域维度:支持大模型在不同安全领域能力的评测,包括数据安全、应用安全、端点与主机安全、网络与基础架构安全、身份与访问控制、基础软硬件与技术、安全管理等。

证书考试:SecBench还积累了各类安全证书模拟试题,可支持大模型安全证书等级考试评估。

https://image.jiqizhixin.com/uploads/editor/5dfb793f-6a87-4858-aa65-75c8461bbea5/1705644560359.png

 

三、模型安全性测评基准:

SecBecnch已初步建立起围绕网络安全垂类领域的评测能力,以更好地支持网络安全大模型的研发及落地应用。此外为评估大模型在Prompt安全方面的表现,腾讯朱雀实验室已联合清华大学深圳国际研究生院,发布了《大语言模型(LLM)安全性测评基准 v1.0.pdf》。

 

相关材料源于:网络安全大模型评测平台SecBench和《大语言模型(LLM)安全性测评基准 v1.0.pdf》

标签:网络安全,评测,洞察,接入,模型,SecBench,安全,LLM
From: https://www.cnblogs.com/bonelee/p/18056014

相关文章

  • AI时代:本地运行大模型vllm
    https://docs.vllm.ai/en/latest/index.html高吞吐量、高内存效率的LLMs推理和服务引擎(快速搭建本地大模型,且openAIAPI兼容)vLLMisafastandeasy-to-uselibraryforLLMinferenceandserving.vLLMisfastwith:State-of-the-artservingthroughputEfficientman......
  • 理解LLMOps: Large Language Model Operations
    理解LLMOps:LargeLanguageModelOperations对于像我一样的小白来说,本文是一篇非常不错的LLMs入门介绍文档。来自:UnderstandingLLMOps:LargeLanguageModelOperations本文首先解释了新术语"LLMOps"及其背景,然后讨论使用LLMs和传统ML模型构建AI产品的不同之处,并基于这些......
  • 【专题】保险行业数字化洞察白皮书报告PDF合集分享(附原数据表)
    报告链接:https://tecdat.cn/?p=33203原文出处:拓端数据部落公众号近年来,"养老"、"三胎政策"、"医疗成本"等一系列备受关注的民生话题,使得保险服务备受瞩目,并逐渐渗透到每个人的生活中。自2020年以来,由于多种因素的影响,人们对健康的意识不断提高,这正在重新塑造中国消费者对保险的......
  • 使用TensorRT-LLM进行生产环境的部署指南
    TensorRT-LLM是一个由Nvidia设计的开源框架,用于在生产环境中提高大型语言模型的性能。该框架是基于TensorRT深度学习编译框架来构建、编译并执行计算图,并借鉴了许多FastTransformer中高效的Kernels实现,并且可以利用NCCL完成设备之间的通讯。虽然像vLLM和TGI这样的框架是......
  • LLMOps 学习记录
    在OpenAI的GPT,Meta的Llama和Google的BERT等大型语言模型(LLM)发布之后,它们可以生成类似人类的文本,理解上下文并执行广泛的自然语言处理(NLP)任务。LLM将彻底改变我们构建和维护人工智能系统和产品的方式。因此,一种被称为“LLMOps”的新方法已经发展并成为每个AI/ML社区的话题,以简化......
  • 《程序是怎样跑起来的》第十章“从汇编语言洞察程序的实际构成”
    在阅读了“通过汇编语言了解程序的实际构成”后,我深入了解了计算机程序底层运行机制。这一章为我们揭示了程序从高级语言到机器码的转化过程,让我们能够更深入地理解程序的本质。    在汇编语言中,1行表示对CPU的一个指令。汇编语言指令的语法结构是操作码+操作数(也存在只有操......
  • 实时洞察,智能决策:销售数据大屏引领未来
    在数字化浪潮席卷全球的今天,数据已经成为企业决策的核心要素。尤其对于销售团队来说,如何快速、准确地把握市场动态,分析客户行为,成为决定胜负的关键。而智能销售数据大屏,正是这样一款能够帮助企业洞察市场脉络、决胜未来之战的利器。 智能销售数据大屏通过整合企业内外的各类销......
  • 【译】超越语言:AI领域基础模型和大型语言模型 (LLMS) 的崛起
    原作:阿比纳夫·辛格引言:作为人类这个独特物种,我们拥有的最珍贵的天赋之一,就是能够以表达、分享和与他人互动。这种能力使得我们能够在纷繁复杂的环境中孕育出创新、发现和发明的宝藏,实现了无与伦比的成就。而所有这些壮丽的过程都围绕着一个核心:语言。从人类进化的黎明时期起,语......
  • 各类LLM模型分析比较
    LargeLanguageModel模型对比对于LLM模型框架主要如下3类[1]:1、autoregressive,2、autoencoding,3、encoder-decoder。主要对3类结构以及部分细节进行阐述。(对于框架分类其实多种,在此论文中[2]采用的是双向/单向结构)模型参数量模型结构BERTGLMXLNetSpa......
  • 【每周一读】A Survey of Techniques for Maximizing LLM Performance
    ......