如果你真的想自学大模型，请参考我的方法，系统入门看这篇就够了！！

时间：2024-12-06 11:29:19浏览次数：6

标签：NLP 入门 AI 模型这篇学习构建 LLM 自学

在这里插入图片描述

第一阶段：学习前置知识：Python 基础、Linux 基础

学习目的：

1.熟练掌握 Python 语言，熟悉常用的 Python 库和工具，如 NumPy、Pandas、TensorFlow、PyTorch 等。

2.具备 NLP 相关的基础知识，包括文本预处理、分词、词性标注等。

3.对大模型有一定了解，包括 Transformer 模型的结构和原理、基于注意力机制的自然语言处理技术等。

第二阶段：NLP 相关基础知识

学习目的：

1.了解文本预处理、分词、词性标注、命名实体识别、词向量表示等基础知识。

2.掌握自然语言处理（NLP）相关技术，如分词、词性标注、命名实体识别、句法分析等。

3.掌握机器学习中的数据预处理、特征提取、分类、回归等基础算法，并了解其在 NLP 领域的应用。

4.了解大规模 NLP 任务中的常用技术和方法，如深度学习中的 Transformer 模型、BERT、GPT 等。

要求：

理解并掌握机器学习、深度学习、自然语言处理的基础概念，最好能够独立实现在 colab 上训练模型（小模型）

第三阶段：GPT API 调用及 Prompt设计

学习目的：

了解 GPT API 的调用方式和基本操作，熟悉 Prompt 设计技巧和要点，能够结合自己的任务调用 API 实现对应的任务代码。

要求

了解大模型以及对应 NLP 知识的基础原理，能够熟练调用GPT API，编写 Prompt 完成各种任务。

第四阶段：模型微调（Fine-tuning）

学习目的

1.了解常见的微调模型的基本流程和原理，熟悉数据集的构造、训练、评估等过程，能够独立构建 QA 对，在服务器上对模型进行微调。

学习内容

QA 问答对微调数据构建、LLM 全流程框架（包含教程）

手把手微调教程、服务器租用

要求：

能够独立完成大模型的微调数据构建、训练以及部署工作。

第五阶段：RAG（外挂数据库）

学习目的

RAG 作为目前最火的一个 LLM 落地方向，可以结合私有数据（表格、word、txt、pdf、数据库皆可）实现本地问答，且训练成本较低，可以快速实现效果。

学习内容

Langchain、FastGPT、LangChain-Chatchat（快速部署框架）、DB-GPT、RAG进阶优化

要求：

能够在本地实现基于大模型的外挂部署方案

针对所有自学遇到困难的同学们，我帮大家系统梳理大模型学习脉络，将这份 LLM大模型资料 分享出来：包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等,

标签：NLP,入门,AI,模型,这篇,学习,构建,LLM,自学
From： https://blog.csdn.net/2401_84208172/article/details/144230591

etcd分布式存储系统快速入门指南
在分布式系统的复杂世界中，确保有效的数据管理至关重要。分布式可靠的键值存储在维护跨分布式环境的数据一致性和可伸缩性方面起着关键作用。在这个全面的教程中，我们将深入研究etcd，这是一个开源的分布式键值存储。我们将探索其基本概念、特性和用例，并提供一个动手快速入......
Qwen2大模型微调入门实战（附完整代码）
Qwen2(https://modelscope.cn/models/qwen/Qwen2-1.5B-Instruct/summary)是通义千问团队最近开源的大语言模型，由阿里云通义实验室研发。前排提示，文末有大模型AGI-CSDN独家资料包哦！以Qwen2作为基座大模型，通过指令微调的方式做高精度文本分类，是学习LLM微调的入门任务。在......
零基础入门SQL（2）：如何用SQL基础语法检索数据
在上一篇文章中，我们介绍了SQL（结构化查询语言）的基本概念，以及它在用户研究中的重要作用。今天，我们将深入了解SQL的基本语法，并通过实际应用场景帮助你更好地理解如何使用SQL提取和分析数据。对于刚开始学习SQL的用户研究者来说，掌握这些基础语法和应用技巧，将为你的数据分析工作......
技术栈4：Docker入门 & Linux入门指令
目录1.Linux系统目录结构2.处理目录的常用命令3.Docker概述4.Docker历史5.Docker基本组成6.Docker底层原理7.Docker修改镜像源8.Docker基本命令在学习docker之前我们先要熟悉Linux系统，推荐阅读：Linux笔记（狂神说）-你我不在年少-博客园1.Linux系统目录结构以下是......
【stable diffusion】保姆级入门课程-Stable diffusion（SD）介绍与安装
1.什么是AI绘画**ai绘画简单来说就是利用人工智能技术进行绘画创作，它通过程序和算法模拟人类的绘画过程，从而实现自主创作。但是AI绘画并不是无中生有，而是基于训练模型，进行二次创作。举个容易理解的例子，比如你(模型)想写出颜真卿风格的字体，就需要对着颜真卿的书法(素材)不停......
AI换脸软件-DeepFaceLab汉化版新手小白视频换脸入门教程
教程主要是整理了针对新手小白上手操作软件进行一个视频换脸的流程，所以不会讲太多原理和一些太专业的性术语，大部分小白对专业性的术语名词也听不大懂。新手小白两大不建议：1.作为DeepFaceLab新手小白刚入门不建议大家过度的去研究他的原理和英文代码性的东西，研究的越多脑子越......
第一部分：基础知识 6. 函数 --[MySQL轻松入门教程]
MySQL提供了丰富的内置函数，涵盖了字符串处理、数值计算、日期时间操作、聚合分析以及控制流等多个方面。这些函数可以帮助用户更高效地进行数据查询和处理。1.字符串函数MySQL提供了丰富的字符串函数来帮助用户处理和操作字符串数据。下面是一些常用的MySQL字符串函数......
Python入门：从零基础到精通的详细教程(0广告，纯干货）
前言：在信息技术飞速发展的今天，掌握编程语言的运维工程师与那些尚未涉足编程领域的运维工程师，仿佛生活在两个截然不同的世界。本博主深感这一鸿沟之深远，因此决定倾力打造一系列详尽至极的Python从零到精通教程，旨在帮助更多运维人员跨越这一技术壁垒。本系列教程将分为三大阶......
Python 编程入门教程
Python是一种广泛使用的高级编程语言，以其代码的可读性、简洁性和强大的库支持而闻名。Python的设计哲学强调代码的可读性和简单性，这使得它成为初学者和专业人士学习编程的理想选择。Python应用广泛，从网站开发到数据科学、人工智能、自动化脚本等，几乎涵盖了所有编程领域。Py......
【Vulkan入门】04-开启Debug输出
目录先叨叨git信息关键代码和主要APIVulkanEnv::SetDebugUtilMessenger()VulkanEnv::CreateVkInstance()题外话先叨叨到上篇为止我们已经作了很多事情了。建立了Instance、挑选了物理设备、建立的Device和Queue。之前做的都是相对简单和线性的工作，只要认真对照说明......

如果你真的想自学大模型，请参考我的方法，系统入门看这篇就够了！！

第一阶段：学习前置知识：Python 基础、Linux 基础

学习目的：

推荐课程：

第二阶段：NLP 相关基础知识

学习目的：

推荐课程：

要求：

第三阶段：GPT API 调用及 Prompt设计

学习目的：

要求

第四阶段：模型微调（Fine-tuning）

学习目的

学习内容

要求：

第五阶段：RAG（外挂数据库）

学习目的

学习内容

要求：

相关文章

赞助商

阅读排行

如果你真的想自学大模型，请参考我的方法，系统入门看这篇就够了！！

第一阶段： 学习前置知识：Python 基础、Linux 基础

学习目的：

推荐课程：

第二阶段：NLP 相关基础知识

学习目的：

推荐课程：

要求：

第三阶段：GPT API 调用及 Prompt设计

学习目的：

要求

第四阶段：模型微调（Fine-tuning）

学习目的

学习内容

要求：

第五阶段：RAG（外挂数据库）

学习目的

学习内容

要求：

相关文章

赞助商

阅读排行

第一阶段：学习前置知识：Python 基础、Linux 基础