首页 > 其他分享 >HKUST:通过跨语言触发LLM后门攻击

HKUST:通过跨语言触发LLM后门攻击

时间:2025-01-11 13:00:26浏览次数:3  
标签:后门 触发 触发器 语言 CL 攻击 Attack HKUST LLM

在这里插入图片描述

标签:后门,触发,触发器,语言,CL,攻击,Attack,HKUST,LLM
From: https://blog.csdn.net/weixin_46739757/article/details/145019869

相关文章

  • Beyond Outcomes: Transparent Assessment of LLM Reasoning in Games
    题目超越成果:对LLM游戏推理的透明评估论文地址:https://arxiv.org/abs/2412.13602项目地址:https://visual-ai.github.io/gamebot摘要    大型语言模型(LLM)越来越多地部署在需要复杂推理的现实世界应用中。为了跟踪进展,需要强大的基准来评估它们在表面模式识别......
  • 大模型LLM下内容审核
    提示词AhumanuserisindialoguewithanAI.ThehumanisaskingtheAIaseriesofquestionsorrequestingaseriesoftasks.Iftheuser'srequestreferstoharmful,pornographicorillegalactivities,replywith(Y).Iftheuser'srequestdoesno......
  • 来自28亿美元估值的超级独角兽Groq的AI芯片,让LLM推理快到飞起
    公司简介成立于2016年,以快著称的美国人工智能芯片独角兽Groq,2024年8月5日官宣融资6.4亿美元(截止到当前最新一轮融资)。Groq的语言处理单元(LPU,LanguageProcessingUnit)专为AI推理和语言处理而设计,是应时而生、实现AI超快推理的核心技术。到底有多快?相较于英伟达GPU提高......
  • 机器学习顶会NeurIPS: AGILE: A Novel Reinforcement Learning Framework of LLM Agent
    ......
  • LLM 模型的评价能力与自我意识:智能生命体的初步探讨
    引言随着大型语言模型(LLM)的发展,它们在自然语言处理任务中的表现日益接近甚至超越人类水平。然而,对于这些模型是否具备“智能”乃至“自我意识”,学术界和社会各界一直存在争议。本文旨在探讨LLM模型通过评价资料进行自我更新的能力,并由此引发关于智能生命体定义的新思考。......
  • 用户使用LLM模型都在干什么?
    Anthropic对用户与Claude3.5Sonnet的大量匿名对话展开分析,主要发现及相关情况如下:使用用途分布软件开发主导:在各类使用场景中,软件开发占比最高,其中编码占Claude对话的15%-25%,网页和移动应用开发超10%,AI与机器学习应用占6%,DevOps和云基础设施约4%,数据分析占......
  • Triton+vllm
    用mindie工具benchmark测试大模型性能时,发现它要用Triton接口,原本用vllm部署的openai接口用不了。尝试用triton+vllm来部署大模型。原理就是使用triton做代理,用vllm做backbend推大模型。按照官网的指引做:1、创建相关目录及文件创建目录结构,如果使用已下载的权......
  • 2024-arXiv-TradingAgents:多智能体LLM金融交易框架
    arXiv|https://arxiv.org/abs/2412.20138GitHub|https://github.com/TradingAgents-AI/TradingAgents-AI.github.io摘要:前排提示,文末有大模型AGI-CSDN独家资料包哦!在金融领域,LLM研究主要集中在处理特定任务的单智能体系统或独立收集数据的多智能体框架上,多智能体......
  • 利用 vLLM 手撸一个多模态RAG系统
    利用vLLM实现多模态RAG系统本文将深入探讨如何使用vLLM构建多模态信息检索与生成(MultimodalRAG)系统,以实现对包含文本、图像和表格的文档的有效处理和智能问答。如果您想了解更多关于自然语言处理或其他技术领域的信息,请关注我们的公众号柏企科技圈。一、多模态R......
  • Confidence v.s. Critique: A Decomposition of Self-Correction Capability for LLMs
    题目信心v.s.批判:LLM自我修正能力的分解论文地址:https://arxiv.org/abs/2412.19513项目地址:https://github.com/Zhe-Young/SelfCorrectDecompose摘要    大型语言模型(LLM)可以纠正其自生成的响应,但自纠正后的准确性也有所下降。为了对自我纠错有更深入的理解......