首页 > 其他分享 >Base/chat/instruct in LLM

Base/chat/instruct in LLM

时间:2024-09-10 22:46:33浏览次数:11  
标签:LLM 模型 instruct Base 对话 指令 chat

Base/chat/instruct

https://blog.csdn.net/qq_43127132/article/details/140447880

大模型库中的base、chat、instruct和4bit通常指的是不同类型或配置的预训练语言模型。它们的区别主要在于训练目标、用途和模型参数的精度。以下是对这些术语的解释:
1. Base 模型 (base)

    定义:Base模型通常是指未经特定任务微调的基础预训练模型,在训练过程中最初被开发和优化的,它旨在平衡性能和资源消耗。
    用途:这些模型通常用于进一步的微调,以适应特定任务或应用场景。如:智能对话、文本内容生成等
    特点:它们包含了大量通用知识,但没有针对特定任务进行优化。

2. Chat 模型 (chat)

    定义:Chat模型专门为对话系统(聊天机器人)设计和优化。
    用途:用于生成自然语言对话,能够理解上下文并生成连贯且有意义的回复。如:聊天机器人、智能助力
    特点:通常经过大量对话数据微调,具备更好的上下文理解能力和对话生成能力。

3. Instruct 模型 (instruct)

    定义:Instruct模型是为遵循指令或完成特定任务而设计和优化的模型。
    用途:用于执行具体指令,如回答问题、生成文本、翻译等任务。
    特点:经过指令数据集微调,能够更好地理解和执行用户提供的指令。

 

  • base 模型是通用基础模型,适合进一步微调以适应特定任务。
  • chat 模型专为对话系统设计,擅长生成自然语言对话。
  • instruct 模型专为执行具体指令设计,擅长理解和执行用户提供的任务。

 

标签:LLM,模型,instruct,Base,对话,指令,chat
From: https://www.cnblogs.com/lightsong/p/18407409

相关文章

  • 2024basectf[week3]
    1、复读机这题页面是一个之后在网络中可以看到这个网页的处理器是python而且flag中还有类似于{}这样的字眼,而且还是python处理的,所以就想到了ssti果然,出现了waf,所以基本上就是这个思路+-*/.{{}}__:"\这些好像都被过滤了,还有一些关键字也被过滤了,可以在关键......
  • RAG与LLM原理及实践(17)---Docker Redis & Python Usage
    目录背景Redis环境download修改镜像RunRedisCodingpythonredisdownload基本使用描述完整代码运行结果高阶用法序列化的方式 Snapshot与AOF快照(RDB)AOF(Append-OnlyFile)代码总结发布与订阅描述     代码运行结果注意事项解释Transanction......
  • LLM 工程师入门:生成式 AI 的简易指南
    大模型发展了近两年,BaihaiIDP也分享了近百篇LLM各环节的技术洞察,有前沿探讨、有落地实践、有应用经验。但回头来看,我们似乎从来没有认真、从0开始探讨过LLM的基本原理。最近,一些企业客户和伙伴来询问,是否有LLM的从0到1的科普贴。他们说:"虽然在很多场景中,L......
  • 北大&阿里最新LLM偏好学习调研报告
    《TowardsaUnifiedViewofPreferenceLearningforLargeLanguageModels:ASurvey》链接:https://arxiv.org/pdf/2409.02795github:https://github.com/kbsdjames/awesome-LLM-preference-learning摘要大型语言模型(LLMs)展现出强大的能力,但要实现与人类偏好的对齐,往往......
  • RLPF:用于LLM用户摘要的预测反馈
    《RLPF:ReinforcementLearningfromPredictionFeedbackforUserSummarizationwithLLMs》链接:https://arxiv.org/pdf/2409.04421文章介绍了一种新的强化学习方法RLPF(ReinforcementLearningfromPredictionFeedback),用于优化大型语言模型(LLMs)生成的用户摘要,以提高下......
  • 【LLM训练系列】从零开始训练大模型之Phi2-mini-Chinese项目解读
    一、前言本文主要是在复现和实践Phi2-mini-Chinese后,简要分析下Phi2-mini-Chinese这个项目,做一个学习实战总结。原文发布于知乎:https://zhuanlan.zhihu.com/p/718307193,转载请注明出数。Phi2-mini-Chinese简介Phi2-Chinese-0.2B从0开始训练自己的Phi2中文小模型,支持接入langc......
  • 【倒计时10天...IEEE出版】第五届大数据、人工智能与软件工程国际研讨会(ICBASE 2024,9
    第五届大数据、人工智能与软件工程国际研讨会(ICBASE2024)将于2024年09月20-22日在中国温州隆重举行。会议主要围绕大数据、人工智能与软件工程等研究领域展开讨论。会议旨在为从事大数据、人工智能与软件工程研究的专家学者、工程技术人员、技术研发人员提供一个共享科研......
  • BinLLM论文阅读笔记
    Text-likeEncodingofCollaborativeInformationinLargeLanguageModelsforRecommendation论文阅读笔记Abstract现存的问题:​ 在调整用于推荐的大型语言模型(LLMRec)时,整合协作信息至关重要。现有的方法通过从头开始学习LLM潜在空间中的协作嵌入或通过外部模型的映射来......
  • [Base64] 前端上传文件,通过 base64 传递给服务器
    前端FileReader将文件转换为Base64编码字符串,然后将其作为请求体发送到后端。<inputtype="file"id="fileInput"/><buttononclick="uploadFileAsBase64()">上传文件</button><script>functionuploadFileAsBase64(){constfileInp......
  • LLM面试题汇总
    LLM相关LLM基础zeroshot、oneshot、threeshot是什么zeroshot:零样本学习。对于模型没有见过的图像,通过已有的图像和特征相关联,从而判别新的图片fewshot:少样本学习。通过判断测试样本与训练样本的相似性,来推测测试样本属于什么类bf16和fp16有什么区别LLM微......