Securing Large Language Models: Threats, Vulnerabilities and Responsible Practices

时间：2024-07-07 11:56:11浏览次数：21

标签：风险 Threats Securing Language 安全攻击漏洞隐私 LLM

本文是LLM系列文章，针对《Securing Large Language Models: Threats, Vulnerabilities and
Responsible Practices》的翻译。

保护大型语言模型：威胁、漏洞和负责任的做法

摘要
1 引言
2 背景
3 LLM的安全和隐私问题
4 对抗性攻击和LLM漏洞
5 LLM的风险和失误
6 风险缓解策略
7 新机遇和未来研究
8 结论

摘要

大型语言模型（LLM）极大地改变了自然语言处理（NLP）的格局。它们的影响涵盖了各种各样的任务，彻底改变了我们理解语言和生成的方式。尽管如此，LLM除了具有显著的实用性外，还引入了关键的安全和风险考虑因素。这些挑战需要仔细检查，以确保负责任的部署和防范潜在的漏洞。本研究论文从五个主题角度深入调查了与LLM相关的安全和隐私问题：安全和隐私担忧、对抗性攻击的漏洞、滥用LLM造成的潜在危害、应对这些挑战的缓解策略，同时确定了当前策略的局限性。最后，本文为未来的研究提供了有希望的途径，以加强LLM的安全性和风险管理。

1 引言

2 背景

3 LLM的安全和隐私问题

4 对抗性攻击和LLM漏洞

5 LLM的风险和失误

6 风险缓解策略

7 新机遇和未来研究

8 结论

本文对LLM的安全性和风险缓解方面进行了全面分析。我们研究LLM使用中出现的安全问题，如信息泄露、未经授权的访问和不安全的代码生成。此外，我们还探讨了针对LLM的各种类型的攻击，并将其分为三大类：基于模型的攻击、训练时间攻击和推理时间攻击。我们还调查了LLM的风险和滥用，如偏

标签：风险,Threats,Securing,Language,安全,攻击,漏洞,隐私,LLM
From： https://blog.csdn.net/c_cpp_csharp/article/details/140243708

Calibrating Large Language Models Using Their Generations Only
本文是LLM系列文章，针对《CalibratingLargeLanguageModelsUsingTheirGenerationsOnly》的翻译。仅使用它们的生成来校准大型语言模型摘要1引言2相关工作3方法4实验5讨论6结论摘要随着大型语言模型（LLM）越来越多地部署在面向用户的应用程序中，通过......
BADEDIT: BACKDOORING LARGE LANGUAGE MODELS BY MODEL EDITING
本文是LLM系列文章，针对《BADEDIT:BACKDOORINGLARGELANGUAGEMODELSBYMODELEDITING》的翻译。BADEDIT：通过模型编辑后门攻击大型语言模型摘要1引言2背景和相关工作3后门攻击的轻量级编辑4BADEDIT5实验6结论摘要主流后门攻击方法通常需要大量的中......
Exploring Large Language Models and Hierarchical Frameworks for Classification o
本文是LLM系列文章，针对《ExploringLargeLanguageModelsandHierarchicalFrameworksforClassificationofLargeUnstructuredLegalDocuments》的翻译。探索大型非结构化法律文件分类的大型语言模型和层次框架摘要1引言2相关工作3方法：分类框架（MESc）4结......
What Makes Quantization for Large Language Models Hard？
本文是LLM系列文章，针对《WhatMakesQuantizationforLargeLanguageModelsHard?AnEmpiricalStudyfromtheLensofPerturbation》的翻译。是什么让大型语言模型的量化变得困难？微扰透镜的经验研究摘要1引言2相关工作3前言4从微扰的角度看LLM量子化5......
FOODGPT: A LARGE LANGUAGE MODEL IN FOOD TESTING DOMAIN WITH INCREMENTAL PRE-TRAI
文章目录题目摘要方法题目食品测试的大型语言模型论文地址：https://arxiv.org/abs/2308.10173摘要目前，特定领域的大型语言模型的构建是通过在基础模型上进行微调来完成的。有些模型还包含知识库，无需预先训练。这是因为基础模型在预训练过程中已经包......
Apple - Core Image Kernel Language Reference
本文翻译整理自：CoreImageKernelLanguageReference（更新日期：2015-01-12https://developer.apple.com/library/archive/documentation/GraphicsImaging/Reference/CIKernelLangRef/Introduction/Introduction.html#//apple_ref/doc/uid/TP40004397-CH1-SW1文章目录一......
GSVA: Generalized Segmentation via Multimodal Large Language Models论文阅读笔记
Motivation&AbsGeneralizedReferringExpressionSegmentation(GRES)：相比于原始的RES任务，一个文本描述里可能出现多个需要分割的物体，或者没有需要分割的物体，难点在于建模不同实体之间复杂的空间关系，以及识别不存在的描述。现有的方法如LISA难以处理GRES任务，为此作者提出了GSV......
Dual Instruction Tuning with Large Language Models for Mathematical Reasoning
本文是LLM系列文章，针对《DualInstructionTuningwithLargeLanguageModelsforMathematicalReasoning》的翻译。数学推理的大语言模型双指令调优摘要1引言2方法3实验4结论局限性摘要最近的进展突出了利用思想链（CoT）数据进行数学推理任务的大型语言模型（LLM）......
Large Language Models as Financial Data Annotators: A Study on Effectiveness and
本文是LLM系列文章，针对《LargeLanguageModelsasFinancialDataAnnotators:AStudyonEffectivenessandEfficiency》的翻译。作为财务数据注释器的大型语言模型：有效性和效率研究摘要引言相关工作数据集实验结果讨论局限性结论摘要由于缺乏领域专......
ALoRA: Allocating Low-Rank Adaptation for Fine-tuning Large Language Models
本文是LLM系列文章，针对《ALoRA:AllocatingLow-RankAdaptationforFine-tuningLargeLanguageModels》的翻译。ALoRA：为微调大型语言模型分配低秩自适应摘要1引言2相关工作3方法4实验5结论摘要参数有效微调（PEFT）在大语言模型时代因其有效性和效率而......