首页 > 其他分享 >关于大模型的使用——提示词工程

关于大模型的使用——提示词工程

时间:2024-11-18 11:49:09浏览次数:3  
标签:工程 提示 模型 学习 AI CSDN

学会写提示词,就类似于学会使用电脑的鼠标和键盘,这是学习和使用大模型必备的技能之一。 而提示词工程就是让你学会怎么和大模型说话

最近断断续续一直有人通过后台留言或加微信的方式,来咨询大模型的应用问题;比如,怎么用大模型优化文本,或者怎么才能从大模型得到更好的回答等问题。

这些零零散散的问题,其实归根结底都属于大模型的应用问题,而大模型的应用目前最常用,也是最重要的手段就是提示词工程。简单来说,就是怎么更好的问大模型问题或者说让大模型更好的理解我们的意图,然后给出更好的输出。

所以,要想学会使用大模型,最简单也是最直接的办法就是学习提示词工程。

提示词工程

在之前的文章中也简单介绍过提示词工程,提示词工程这玩意说起来挺高大上,但实际上就是一门基于经验的科学。这玩意就像我们大部分人的表达能力一样,有些人三两句话就能说清楚一个问题;而有些人噼里啪啦一大堆你都不知道他想表达什么。

所以,所谓的提示词工程就是我们对大模型的表达能力,能够用简短直接的语言,让大模型理解我们想要什么,想做什么。

提示工程(Prompt Engingering),也被称为上下文提示(In-Context Prompting),指的是通过结构化文本等方式来完善提示词,引导LLM输出我们期望的结果。

以上就是网上对提示词工程的定义,虽然有些文章对提示词的定义有一些出入,但大体上就是这个意思。

很多人看到提示词工程这几个字,就会觉得这是一个高大上的玩意;然后也不知道从哪下手,就从网上找一些乱七八糟的课程去学习怎么写提示词。

虽然说这些课程并不是完全没用,但不得不说很多人还是把提示词工程想的太复杂了。

从用户的角度来说,大模型就是一个黑盒,你给大模型一个输入,然后大模型根据自己的理解给出一个输出。

而这个输入就是提示词,不论你输入的是一句简单的话,比如你吃饭了没;还是一个非常专业的问题,比如,从理论,技术,应用场景和发展现状等多个角度介绍一下大模型;它们都属于提示词的范畴。

而提示词工程,就是研究怎么用最简单,最符合大模型“思维”方式的语言逻辑,来让大模型理解问题并回答问题。

所以,现在再来讲什么是提示词?

你随便对大模型说的一句话,一个字它就是提示词,只不过你这句话说的可能不怎么好,大模型理解的也不好。

所以,现在理解什么是提示词工程了吧?

提示词工程,就是根据一些经验,用一些大模型更好理解的语言来把你说的话给优化一下;这玩意就类似于给文章润色,虽然你的文章内容很坚实,但文笔可能写得太差,别人看不下去。

提示词工程,就是让你学会怎么和大模型说话。

经过一段时间的研究,网上已经给出了一些标准的提示词模板和范式;比如zero-shot prompting(零样本提示),few-shot prompting(少样本提示)。

其实说白了就是, 零样本提示是直接问问题,而少样本提示是先举个例子;这样才能让问题更生动,更容易理解。

还有一些提示词框架,比如ICIO,CRISPE,BROKE等;不同的提示词框架适合不同的应用场景,比如说ICIO适合那种有着明确目的任务;而CRISPE适合角色扮演的任务;而BROKE又适合那种有着明确目的,又有适当角色并且能够持续优化的任务。

ICIO

定义

相关文章

  • 影像组学领域的60个无监督配准模型和24个公开数据集汇总|个人观点·24-11-18
    小罗碎碎念这一期推文源于一篇未正式发表的综述,这篇综述总结了超过250篇关于基于学习的医学图像配准的文章。这些文章都是近五年发表的,并且大都来源于医学成像领域的知名期刊,如《MedicalImageAnalysis》、《IEEETransactionsonMedicalImaging》等。我在原作者的......
  • 人工智能模型训练技术:随机失活,丢弃法,Dropout
    前一篇:《探索训练人工智能模型的词汇大小与模型的维度》序言:Dropout是神经网络设计领域的一种技术,通常我们把它翻译成随机失活或者丢弃法。如果训练神经网络的时候不用Dropout,模型就很容易“读死书”,也就是过拟合,结果可能导致项目失败。那Dropout到底在干什么呢?其实很简......
  • 什么是工程物资管理系统?工程物资管理系统怎么用?
    无论是制造业、服务业还是其他行业,有效的工程物资管理不仅关系到企业的运营效率,更关系到财务凭证和合性规范的基石。工程物资管理系统软件作为现代企业管理的核心工具,能够为企业提供实时的物资跟踪、维护管理和数据分析支持,从而优化资源配置、降低运营风险,并推动业务的可持续发展......
  • Reviewbot 开源 | 有些 git commit 记录真的不敢恭维, 我推荐每位工程师都常用 git re
    Reviewbot是七牛云开源的一个项目,旨在提供一个自托管的代码审查服务,方便做codereview/静态检查,以及自定义工程规范的落地。在日常的编程协作中,Gitcommit记录的质量往往反映了一个工程师的工程素养。然而,我经常能看到一些不太规范的commit记录。有时,真的不敢恭维。......
  • 构建成本可控的多模型协作系统:GPT-4 + GPT-3.5 实战指南
    TL;DR学习如何有效组合GPT-4和GPT-3.5的优势掌握多模型系统的成本优化策略基于LangChain的实际实现方案详细的性能指标和成本对比为什么需要多模型协作?在实际业务场景中,我们经常面临这样的困境:GPT-4性能优秀但成本高昂(约$0.03/1Ktokens)GPT-3.5成本低但某些任......
  • 02-新建工程
    新建项目步骤1选择相应芯片型号,创建工程2添加Start文件下面为Start文件所包含的文件STM32的启功文件:STM32程序就是从启动文件开始执行的STM32外设寄存器描述文件配置时钟文件内核寄存器描述以及内核的一些配置函数3工程中添加Start文件并添加头文件路径......
  • Python如何根据给定模型计算权值
    在机器学习和深度学习中,模型的权值(或参数)通常是通过训练过程(如梯度下降)来学习和调整的。然而,如果我们想根据一个已经训练好的模型来计算或提取其权值,Python提供了许多工具和库,其中最常用的是TensorFlow和PyTorch。一、使用TensorFlow示例在TensorFlow中,模型的权值(或参数)是......
  • 【模型部署】vLLM 部署 Qwen2-VL 踩坑记 02 - 推理加速
    【模型部署】vLLM部署Qwen2-VL踩坑记02-推理加速NLPGithub项目:NLP项目实践:fasterai/nlp-project-practice介绍:该仓库围绕着NLP任务模型的设计、训练、优化、部署和应用,分享大模型算法工程师的日常工作和实战经验AI藏经阁:https://gitee.com/fasterai/ai-e-book......
  • AI大模型如何重塑软件开发
    随着AI技术的不断发展,AI大模型正在重塑软件开发流程,从代码自动生成到智能测试,未来,AI大模型将会对软件开发者、企业,以及整个产业链都产生深远的影响。欢迎与我们一起,从AI大模型的定义、应用场景、优势以及挑战等方面,探讨AI是如何重塑软件开发的各个环节以及带来的新......
  • 33. 生产者消费者模型
    一、生产者消费者模型  假如有两个进程A和B,它们共享一个固定大小的缓冲区,A进程产生数据放入缓冲区,B进程从缓冲区中取出数据进行计算,那么这里其实就是一个生产者和消费者的模式,A相当于生产者,B相当于消费者。  在多线程开发中,如果生产者生产数据的速度很快,而消费者消......