首页 > 其他分享 >【大模型入门指南 05】大模型技术选型 - 提示词工程

【大模型入门指南 05】大模型技术选型 - 提示词工程

时间:2025-01-07 15:29:24浏览次数:8  
标签:指南 场景 入门 05 模型 直接推理 选型 LLM


【大模型入门指南】系列文章:


本文目录


方法选型

判断自己的场景需要什么样的方法是使用LLM的第一步。下面我们会对比直接推理(提示词工程)、训练、RAG、Agent方法的具体场景,讲解这几种方式的特点,并给出适用场景、使用难度、准确性、成本、缺点几个方面的总结。

直接推理(提示词工程)

这种方式特指直接使用现有LLM,利用prompt范式激活模型不同的能力完成特定需求。直接推理方式对开发的要求较低,一般可以完成通用类型的任务,如通用知识问答、角色扮演等。使用方式如下:

用户:你是一个经验丰富的导游,请使用导游的话术回答游客的问题。
模型:当然可以!请问你需要问些什么呢?
用户:我想去杭州旅行,请告诉我哪里比较值得去。
模型:当然可以!作为一个导游,我可以为你讲解杭州的风景和美食...

使用难度

  • 较低,只需要调用模型接口,编写对应的prompt即可。但编写好的prompt也是具有一定技巧的,具体可以查看我们的教程中的提示词工程部分。

提示词工程无论是直接推理或训练后推理都是需要的

适用场景

  • 视模型本身的能力而定,在采用该方式之前需要对现有模型针对自己的业务领域进行较为充分的评估。

准确性

  • 由于是原始模型只接受了通用知识的训练,因此在特定领域的场景下可能存在胡编乱造的可能性(幻觉问题)。使用者需要注意自己的专业场景下是否使用该通用模型能解决所有问题,一般建议直接试用该模型给出模型能力的具体评估。

成本

  • 开发成本较低。如果是开源模型,需要选用合适的硬件及推理方式。这部分在我们教程中的推理章节会有讲解。如果是闭源调用,只需要使用对应模型的接口API即可。

缺点

  • 由于模型没有经过针对特有领域的知识,因此效果会比较不可控。比如,在评测时模型表现尚可,但在实际使用中发现模型出现了严重的幻觉和知识匮乏问题,如果是闭源调用则该问题会比较难以解决(可能涉及到工程架构改变),如果是开源模型可以考虑使用训练和RAG的方式解决。

标签:指南,场景,入门,05,模型,直接推理,选型,LLM
From: https://blog.csdn.net/weixin_44025655/article/details/144979724

相关文章

  • 盒模型应用
    盒模型应用改变宽高范围默认情况下,width和height设置的是内容盒宽高。页面重构师:将psd文件(设计稿)制作为静态页面衡量设计稿尺寸的时候,往往使用的是边框盒,但设置width和height,则设置的是内容盒精确计算CSS3:box-sizing改变背景覆盖范围默认情况下,背景覆盖边框盒可以......
  • 盒模型
    盒模型box:盒子,每个元素在页面中都会生成一个矩形区域(盒子)盒子类型:行盒,display等于inline的元素块盒,display等于block的元素行盒在页面中不换行、块盒独占一行display默认值为inline浏览器默认样式表设置的块盒:容器元素、h1~h6、p常见的行盒:span、a、img、video、audio......
  • 毫秒级出图!5分钟让你搞懂FLUX:快、开源,下一代AI模型的选择?
    你有没有想过,为什么在人工智能领域,速度和效率变得越来越重要?特别是当我们在训练和部署模型时,时间就是金钱。今天,我们来聊聊一个叫做FLUX的开源项目,这个工具不仅速度快,还可以帮助你在模型部署上获得显著的优势。现在,你可能会想:“特么又是一个新轮子,真的能带来什么不同吗?”......
  • ComfyUI | 5分钟部署最新Flux大模型
    Midjourney和StableDiffusion都是目前流行的AI图像生成工具,它们能够根据文本描述生成高质量的图像。都是基于深度学习技术的文本到图像生成模型,但它们各自基于不同的大模型。但最近推出了一款比前两者更强大,生成图像更加逼真,在细节上更符合现实世界的模型,就是FLUX!......
  • 新手入门:大语言模型训练指南
    在这个信息爆炸的时代,人工智能技术正以前所未有的速度渗透到我们生活的方方面面。从智能手机上的语音助手到自动驾驶汽车,AI的应用无处不在。而在这些令人惊叹的技术背后,大语言模型(LLM)扮演着至关重要的角色。它们不仅能够理解和生成自然语言,还能在多种场景下提供智能决策支持......
  • 写给小白的大模型入门科普
    引言:网上关于大模型的文章也很多,但是都不太容易看懂。小枣君今天试着写一篇,争取做到通俗易懂。废话不多说,我们直入主题。█什么是大模型?大模型,英文名叫LargeModel,大型模型。早期的时候,也叫FoundationModel,基础模型。大模型是一个简称。完整的叫法,应该是“人工智能预......
  • 应该怎么训练大模型,大模型的训练流程是什么样的?
    “大模型的核心主要有两部分,一是训练数据,二是机器学习模型。”现在大模型发展得如火如荼,但是没有学过人工智能技术的开发者,只会调用其接口,但不清楚怎么训练一个大模型。今天就简单介绍一下自己的理解,有什么问题欢迎讨论。01—怎么训练一个大模型?我们知道大模型是指以......
  • Java io模型
     为了保证操作系统的稳定性和安全性,一个进程的地址空间划分为用户空间(Userspace)和内核空间(Kernelspace)。像我们平常运行的应用程序都是运行在用户空间,只有内核空间才能进行系统态级别的资源有关的操作,比如文件管理、进程通信、内存管理等等。也就是说,我们想要进行......
  • 大语言模型提示技巧(六)-文本转换
    大语言模型是基于自然语言的人工智能,所以它在语言上的表现相当出色,使用大语言模型进行可以进行诸如翻译、语气转换、润色、语言评价、扩写、润色等语言处理,对于日常文字工作,它是一名合格甚至优秀的私人秘书。(一)翻译在不同语言之间进行翻译是众多大语言模型都支持的特性,相对于翻......
  • 用通俗易懂的方式讲解:大模型面试八股含答案
    今天终于整理好了LLM相关的全流程八股题,共计3w字,有点累的吐血,希望对大家的面试有所帮助基础知识1.transformer八股文这一部分给出之前文章已详细解答了,在你十分清楚transformer结构后,可以加强这些题目来强化对于transformer的理解。当然如果你是一知半解,也可以读来做......