首页 > 其他分享 >LLM学习-基础知识

LLM学习-基础知识

时间:2024-10-21 23:43:10浏览次数:1  
标签:NLP 模型 基础知识 学习 LLM 文本 生成 向量

NLP

NLP代表自然语言处理,是关于计算机和人类语言之间交互的领域。NLP涵盖了一系列任务,包括文本处理、语音识别、语言翻译、信息检索等。NLP技术的发展使得计算机能够理解、解释和生成人类语言,促进了许多领域的发展,包括智能助手、文本分析、情感分析等。

LLM

LLM指的是大型语言模型(Large Language Models),是一类基于深度学习的模型,用于处理自然语言处理任务(NLP)。NLP是关于计算机和人类语言之间交互的领域,是一种概念;而LLM是一类基于深度学习的大型语言模型,是一种。
常见LLM模型:
image

  • 闭源LLM:ChatGPT(OpenAI)、Claude(Anthropic)、PaLM/Gemini(Google)、文心一言(百度)、星⽕⼤模型(讯⻜)..
  • 开源LLM:LLama(Meta)、通义千问(阿里巴巴)、ChatGLM(清华+智谱)、Baichuan(百川智能)..

RAG

检索增强⽣成(RAG, Retrieval-Augmented Generation),一种架构,通过融合检索模块和生成模块,提供更加准确和连贯的文本生成能力。整合了从庞⼤知识库中检索到的相关信息,并以此为基础,指导⼤型语⾔模型⽣成更为精准的答案,从⽽显著提升了回答的准确性与深度。
工作流:
image

Finetune

微调,通过在特定数据集上进⼀步训练⼤语⾔模型,来提升模型在特定任务上的表现。

LangChain

LangChain是一个用于构建基于语言模型的应用程序的框架。它的设计目标是帮助开发者更方便地使用大型语言模型并将其集成到实际应用中。LangChain提供了一系列工具和组件,使得开发者能够更容易地进行任务如生成文本、问答、对话系统等。
image

Embeddings

也叫词向量,一种文本嵌入技术,文本嵌入技术的核心思想是将文本中的单词、短语或句子映射到高维向量空间中。这些向量空间中的点表示文本单位,并且相似的文本单位在向量空间中应该距离较近。通过这种方式,文本嵌入可以捕捉到词语之间的语义关系。

向量数据库

存储经过了Embeddings的向量数据。向量数据库是⽤于⾼效计算和管理⼤量向量数据的解决⽅案。向量数据库是⼀种专⻔⽤于存储和检索向量数据(embedding)的数据库系统。它与传统的基于关系模型的数据库不同,它主要关注的是向量数据的特性和相似性。

Prompt

提示词,分为系统提示词、用户提示词。

  • System Prompt:在整个会话过程中持久地影响模型的回复,且相⽐于普通Prompt 具有更⾼的重要性。(如:设定模型始终模拟一个幽默的助理)
  • User Prompt:用户给模型的原始输入。
    所谓的提示词工程Prompt Engineering便是通过更加合理的输入,让大模型理解问题,以输出最合理的答案。

temperature参数

LLM中的温度参数,控制模型输出的随机性和多样性的重要超参数。它通常用于采样生成文本的过程,尤其是在生成式任务中,如文本生成、对话系统等。temperature 参数可以影响生成文本的样式和内容。
Temperature ⼀般取值在 0~1 之间,当取值较低接近 0 时,预测的随机性会较低,产⽣更保守、可预测的⽂本,不太可能⽣成意想不到或不寻常的词。当取值较⾼接近 1 时,预测的随机性会较⾼,所有词被选择的可能性更⼤,会产⽣更有创意、多样化的⽂本,更有可能⽣成不寻常或意想不到的词。

Transformer

是一种深度学习模型架构,最初用于自然语言处理任务,ChatGPT就是基于此架构开发的。
image

TensorFlow、PyTorch

TensorFlow(谷歌)和 PyTorch(Meta)为最受欢迎的两个深度学习开源框架,它们提供了丰富的算法库和工具,支持研究者和开发人员高效地实现复杂的神经网络模型。

预训练

使用海量的训练数据(纯文本,没有QA),这些数据可以来自互联网网页、维基百科、书籍、GitHub、论文、问答网站等,构建包含数千亿甚至数万亿单词的具有多样性的内容,经过数千块高性能GPU和高速网络组成的超级计算机,花费数十天甚至数月的时间完成深度神经网络参数的训练,构建基础模型(Foundation Model),也叫基座模型。
此时,基础模型能够对长文本进行建模,具备语言生成能力,根据输入的提示词,模型可以生成文本补全句子。

有监督微调/指令微调

在已经预训练好的模型基础上,通过使用有标注的特定任务数据(QA)对模型进行进一步的训练和调整,以提高模型在特定任务或领域上的性能。

奖励模型

文本质量对比模型,它接受环境状态、生成的结果等信息作为输入,并输出一个奖励值作为反馈。奖励模型通过训练,能够识别并区分不同输出文本之间的优劣,为后续的强化学习阶段提供准确的奖励信号。

强化学习

根据数十万名用户给出的提示词,利用前一阶段训练的奖励模型,给出SFT模型对用户提示词补全结果的质量评估,并与语言模型建模目标综合得到更好的效果。

模型量化

模型量化就是将浮点存储(运算)转换为整型存储(运算)的一种模型压缩技术。简单直白点讲,即原来表示一个权重需要使用float32表示,量化后只需要使用int8来表示就可以啦,仅仅这一个操作,就可以获得接近4倍的网络加速。

Agent

应用于特定领域的智能体,如医疗、教育、金融、娱乐等。

标签:NLP,模型,基础知识,学习,LLM,文本,生成,向量
From: https://www.cnblogs.com/judes/p/18491639

相关文章

  • C语言学习笔记4
    函数函数是一组一起执行一个任务的语句。每个C程序都至少有一个函数,即主函数 main() ,所有简单的程序都可以定义其他额外的函数。C语言的函数分为:1.库函数2.自定义函数对于库函数引用对于头文件即可使用,自定义函数需要自己调用与声明函数的调用与声明C语言中的函数......
  • 10.21学习
    1.格式说明符中的%2s在C语言中, %2s 是一个格式说明符,用于 scanf 、 fscanf 、 sscanf 等输入函数中。它指定了函数应该读取的字符串的最大长度。具体来说: % :表示开始一个格式说明符。 2 :指定要读取的字符的最大数量,这里是2个字符。 s :表示要读取的数据......
  • 全网最详细深度学习环境配置(Pycharm+anaconda+pytorch+TensorFlow+cuda+cudnn+改变虚
    目录1.版本说明2.安装Pycharm3.安装anaconda1.安装2.配置路径3.修改镜像源4.修改默认虚拟环境安装位置1.查看conda信息2.修改对应文件的权限3.再次查看信息5.配置Pycharm环境4.安装torch5.安装TensorFlow+cuda+cudnn1.打开对应的文件CUDA2.打开CUDNN3.安装T......
  • 带权并查集 学习笔记
    顾名思义,就是并查集带权值。在路径压缩的时候,我们还要维护权值应该怎么办呢?关联题目:P1196[NOI2002]银河英雄传说。我们对于一个舰队维护一个\(fr\)表示到头部的距离,\(cnt\)表示该舰队的战舰数量。那么每一次合并时,先进行路径压缩,找到父亲,在将父亲的权值传下来即可。因为每......
  • #护网面试#红蓝攻防#安全# 木马文件的学习
    声明:本博文,只是基于学习进行记录。冰蝎源码<?php@error_reporting(0);session_start();$key="密钥";//该密钥为连接密码32位md5值的前16位,默认连接密码rebeyond$_SESSION['k']=$key;$post=file_get_contents("php://input");if(!extension_loaded('......
  • 机器学习中的图像处理与计算机视觉
    引言在现代计算机科学中,图像处理和计算机视觉已成为最活跃的研究领域之一,这得益于机器学习和深度学习的发展。本文将深入探讨图像处理与计算机视觉的基础概念、常见应用、关键技术、常用工具,以及在这些领域中的代码示例。通过本篇文章,我们将了解如何从头开始构建一个简单的计......
  • 【机器学习】支持向量机SVM|高斯核 讲解及代码实现
    支持向量机SVM支持向量机介绍SVM全称是SupportedVectorMachine(支持向量机)即寻找到一个超平面使样本分成两类,并且间隔最大。是一种监督学习算法,主要用于分类,也可用于回归与逻辑回归和决策树等其他分类器相比,SVM提供了非常高的准确度优点:适合小样本高纬度数据......
  • 基于深度学习CNN算法的花卉分类识别系统01-python-带UI-包配置
    项目基本介绍:【算法】深度学习CNN网络mobilenet算法网络【环境】python>=3.8pytorchopencvpyqt5matplotlib(含详细环境配置教程视频)【文件】训练、预测全部源代码、训练好的模型、数据集、模型评价指标:训练acc/loss曲线图和混淆矩阵图、U1界面源码及源文件、环境配置......
  • 【机器学习】朴素贝叶斯详解
    朴素贝叶斯朴素贝叶斯介绍复习常见概率的计算知道贝叶斯公式了解朴素贝叶斯是什么了解拉普拉斯平滑系数的作用【知道】常见的概率公式条件概率:表示事件A在另外一个事件B已经发生条件下的发生概率,P(A|B)在女神喜欢的条件下,职业是程序员的概率?女神喜欢条件下......
  • 基于深度学习CNN网络的人脸表情识别系统-带UI界面-数据集-包配置
    项目基本介绍:【算法】深度学习CNN网络mini-xception算法网络【环境】python=3.8tensorflowopencvpyqt5matplotlib等(含详细环境配置教程视频)【文件】训练、预测全部源代码、训练好的型、数据集、模型评价指标:训练acc/loss曲线图和混淆矩阵图、U1界面源码及源文件、环......