大语言模型（LLM）学习资料汇总

时间：2024-12-25 12:02:34浏览次数：5

标签：https 语言模型汇总学习 LLM GPT 应用

大语言模型（LLM）学习资料汇总

前排提示，文末有大模型AGI-CSDN独家资料包哦！

0x00 学习路径

本文分为四个章节，各章节的学习目标如下。请注意本文主要是面向工程界撰写，学术部分较少。

入门篇：
了解大语言模型的基础知识和常见术语。
学会使用编程语言访问 OpenAI API 等常见大语言模型接口。
提高篇：
了解机器学习、神经网络、NLP 的基础知识。
了解 Transformer 以及典型 Decoder-only 语言模型的基础结构和简单原理。
了解大语言模型发展历史，以及业界主流模型（含开源模型）进展。
应用篇：
可以在本地环境搭建开源模型的推理环境。
Prompt 工程。
使用已有框架（如Langchain）或自行开发，结合大语言模型结果，开发生产应用。
深入篇：（本文涉及少量资料）
掌握 Continue Pre-train、Fine-tuning 已有开源模型的能力。
掌握 Lora、QLora 等低资源高效模型训练的能力。
掌握大语言模型微调以及预训练数据准备的能力。
深入了解大模型背后的技术原理。
了解生产环境部署大模型的相关技术点。

读者可以根据自己需要选择对应的章节，如对大语言模型的原理不感兴趣，可只关注入门篇和应用篇。考虑到阅读背景，本文尽可能提供中文资料或有中文翻译的资料。

0x10 入门篇

在入门之前，请申请 OpenAI API，并具备良好的国际互联网访问条件。

大语言模型综述
大语言模型迄今为止最好的学术向中文综述。
中文版本：LLM_Survey_Chinese_0418.pdf
作为入门资料偏难，看不懂的部分可以等到后面章节再回头重看。
ChatGPT Prompt Engineering for Developers
虽然是 Prompt 工程，但是内容比较简单，适合入门者。
中英双语字幕：https://github.com/GitHubDaily/ChatGPT-Prompt-Engineering-for-Developers-in-Chinese
OpenAI Quickstart
OpenAI 官方 Quickstart 文档。
以及 API Reference
State of GPT：GPT 联合创始人做的演示，极好的总结了 GPT 的训练和应用。
视频：https://www.youtube.com/watch?v=bZQun8Y4L2A
PPT：https://karpathy.ai/stateofgpt.pdf

0x20 提高篇

清华大模型公开课：从NLP到大模型的综合课程，挑选感兴趣的了解。
深度学习：台湾大学李宏毅：台湾大学李宏毅，国语教程里最好的，讲的很清楚，也比较有趣。
Understanding large language models ：理解大语言模型。
The Illustrated GPT-2 (Visualizing Transformer Language Models)：图解 GPT2
中文翻译：https://zhuanlan.zhihu.com/p/139840113
InstructGPT: Training language models to follow instructions with human feedback：著名的 InstructGPT 论文。
另外一篇中文介绍：https://huggingface.co/blog/zh/rlhf
Huggingface NLP Course：NLP 入门课程

0x30 应用篇

Building Systems with the ChatGPT API
中文字幕：https://www.bilibili.com/video/BV1gj411X72B/
Langchain
中文字幕：https://www.bilibili.com/video/BV1Ku411x78m/
Langchain 是大语言模型最火的应用框架。即使不使用，也可以借鉴。
LangChain for LLM Application Development
GPT best practices：OpenAI 官方出的最佳实践。
openai-cookbook：OpenAI 官方 Cookbook。
Brex’s Prompt Engineering Guide：Prompt 工程简介

0x40 深入篇

Huggingface Transformer 文档：Transformer 官方文档
复杂推理：大语言模型的北极星能力：略学术，解释大语言模型能力的来源。
GPT，GPT-2，GPT-3 论文精读：视频精读。
Building LLM applications for production：在生产环境中构建 LLM 应用。

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型！

标签：https,语言,模型,汇总,学习,LLM,GPT,应用
From： https://blog.csdn.net/lvaolan/article/details/144715567

如何从零开始学习大模型等人工智能算法
学习人工智能可以分为几个关键步骤。以下是一个从零开始学习人工智能的指南：前排提示，文末有大模型AGI-CSDN独家资料包哦！建立数学和统计基础：学习线性代数，了解矩阵、向量、矩阵运算等基本概念。掌握微积分，包括导数和积分，对于理解机器学习算法中的优化过程很重要。理解......
AI大模型应用入门实战与进阶：构建你的第一个大模型：实战指南
2017年是机器学习领域历史性的一年。GoogleBrain团队的研究人员推出了Transformer，它的性能迅速超越了大多数现有的深度学习方法。著名的注意力机制成为未来Transformer衍生模型的关键组成部分。Transformer架构的惊人之处在于其巨大的灵活性：它可以有效地用于各种机器......
如何学习语言大模型
如何学习语言大模型需要掌握以下关键概念和技术：前排提示，文末有大模型AGI-CSDN独家资料包哦！1.编程和数据处理Python:学习基本语法、数据结构、文件操作和常用库（如NumPy、Pandas）的使用。资源建议:PythonforEverybody提供了一个很好的Python入门教程，专注于数据处......
零基础大语言模型学习笔记
ChatGPT的横空出世惊艳了世人，让人们对大语言模型（LargeLanguageModel，LLM）和生成式人工智能（ArtificialIntelligenceGeneratedContent，AIGC，或者GenerativeAI）的兴趣飙升，而LLM表现出的卓越的泛化能力，也被视为实现通用人工智能（ArtificialGeneralIntelligence，AGI）的潜在希......
【NLP】关于大模型训练常见概念讲解
随着LLM学界和工业界日新月异的发展，不仅预训练所用的算力和数据正在疯狂内卷，后训练（post-training）的对齐和微调等方法也在不断更新。下面笔者根据资料整理一些关于大模型训练常见概念解释。前排提示，文末有大模型AGI-CSDN独家资料包哦！1Pre-training（预训练）预训练是指在模型......
英伟达最新提出ComfyGen，利用大模型自动生成Comfyui工作流，Comfyui再无难度
StableDiffusion大家都知道，但是想玩好SD，并且玩出花样，那Comfyui肯定得会用。Comfyui相对于去年已经越来越成熟，五花八门的工作流有着五花八门的功能。越来越成熟的背后，却是越来越多的节点，乱糟糟的看着就头疼。要不说英伟达服务好呢，生产芯片也不忘了给用芯片的人提供一些有趣......
TurboAttention：基于多项式近似和渐进式量化的高效注意力机制优化方案，降低LLM计算成本7
随着大型语言模型(LLMs)在AI应用领域持续发展，其计算成本也呈现显著上升趋势。数据分析表明，GPT-4的运行成本约为700美元/小时，2023年各企业在LLM推理方面的总支出超过50亿美元。这一挑战的核心在于注意力机制——该机制作为模型处理和关联信息的计算核心，同时也构成了主要的性能瓶颈......
Java 开发之关键注解详细汇总
一、JDK自带的基本注解@Override作用：用于标识方法重写。它告诉编译器这个方法是重写父类中的方法，如果父类没有这个方法或者方法签名不匹配，编译器会报错。示例：classParent{publicvoidprint(){System.out.println("Parentprint");}}classChilde......
EsChatPro 接入国内 DeepSeek 大模型
EsChatPro接入国内DeepSeek大模型前言上一篇文章我们讲了EsChatPro如何在本地安装运行，接下来给大家带来接入deepseek大模型的教程，实现AI对话功能详见：EsChatPro本地开发运行指南前置准备首先我们打开deepseek的官网：https://www.deepseek.com/点击接入AP......
基于注意力机制的图表示学习：GRAPH-BERT模型
人工智能咨询培训老师叶梓转载标明出处图神经网络（GNNs）在处理图结构数据方面取得了显著的进展，但现有模型在深层结构中存在性能问题，如“悬挂动画问题”和“过平滑问题”。而且图数据内在的相互连接特性限制了大规模图输入的并行化处理，这在内存限制下尤为突出。针对这些问题，美......

大语言模型（LLM）学习资料汇总

大语言模型（LLM）学习资料汇总

0x00 学习路径

0x10 入门篇

0x20 提高篇

0x30 应用篇

0x40 深入篇

相关文章

赞助商

阅读排行