首页 > 其他分享 >大语言模型(LLM)学习资料汇总

大语言模型(LLM)学习资料汇总

时间:2024-12-25 12:02:34浏览次数:5  
标签:https 语言 模型 汇总 学习 LLM GPT 应用

大语言模型(LLM)学习资料汇总

前排提示,文末有大模型AGI-CSDN独家资料包哦!

0x00 学习路径

本文分为四个章节,各章节的学习目标如下。请注意本文主要是面向工程界撰写,学术部分较少。

  • 入门篇:

  • 了解大语言模型的基础知识和常见术语。

  • 学会使用编程语言访问 OpenAI API 等常见大语言模型接口。

  • 提高篇:

  • 了解机器学习、神经网络、NLP 的基础知识。

  • 了解 Transformer 以及典型 Decoder-only 语言模型的基础结构和简单原理。

  • 了解大语言模型发展历史,以及业界主流模型(含开源模型)进展。

  • 应用篇:

  • 可以在本地环境搭建开源模型的推理环境。

  • Prompt 工程。

  • 使用已有框架(如Langchain)或自行开发,结合大语言模型结果,开发生产应用。

  • 深入篇:(本文涉及少量资料)

  • 掌握 Continue Pre-train、Fine-tuning 已有开源模型的能力。

  • 掌握 Lora、QLora 等低资源高效模型训练的能力。

  • 掌握大语言模型微调以及预训练数据准备的能力。

  • 深入了解大模型背后的技术原理。

  • 了解生产环境部署大模型的相关技术点。

读者可以根据自己需要选择对应的章节,如对大语言模型的原理不感兴趣,可只关注入门篇和应用篇。考虑到阅读背景,本文尽可能提供中文资料或有中文翻译的资料。

0x10 入门篇

在入门之前,请申请 OpenAI API,并具备良好的国际互联网访问条件。

  • 大语言模型综述

  • 大语言模型迄今为止最好的学术向中文综述。

  • 中文版本:LLM_Survey_Chinese_0418.pdf

  • 作为入门资料偏难,看不懂的部分可以等到后面章节再回头重看。

  • ChatGPT Prompt Engineering for Developers

  • 虽然是 Prompt 工程,但是内容比较简单,适合入门者。

  • 中英双语字幕:https://github.com/GitHubDaily/ChatGPT-Prompt-Engineering-for-Developers-in-Chinese

  • OpenAI Quickstart

  • OpenAI 官方 Quickstart 文档。

  • 以及 API Reference

  • State of GPT:GPT 联合创始人做的演示,极好的总结了 GPT 的训练和应用。

  • 视频:https://www.youtube.com/watch?v=bZQun8Y4L2A

  • PPT:https://karpathy.ai/stateofgpt.pdf

0x20 提高篇

  • 清华大模型公开课:从NLP到大模型的综合课程,挑选感兴趣的了解。

  • 深度学习:台湾大学李宏毅:台湾大学李宏毅,国语教程里最好的,讲的很清楚,也比较有趣。

  • Understanding large language models :理解大语言模型。

  • The Illustrated GPT-2 (Visualizing Transformer Language Models):图解 GPT2

  • 中文翻译:https://zhuanlan.zhihu.com/p/139840113

  • InstructGPT: Training language models to follow instructions with human feedback:著名的 InstructGPT 论文。

  • 另外一篇中文介绍:https://huggingface.co/blog/zh/rlhf

  • Huggingface NLP Course:NLP 入门课程

0x30 应用篇

  • Building Systems with the ChatGPT API

  • 中文字幕:https://www.bilibili.com/video/BV1gj411X72B/

  • Langchain

  • 中文字幕:https://www.bilibili.com/video/BV1Ku411x78m/

  • Langchain 是大语言模型最火的应用框架。即使不使用,也可以借鉴。

  • LangChain for LLM Application Development

  • GPT best practices:OpenAI 官方出的最佳实践。

  • openai-cookbook:OpenAI 官方 Cookbook。

  • Brex’s Prompt Engineering Guide:Prompt 工程简介

0x40 深入篇

  • Huggingface Transformer 文档:Transformer 官方文档

  • 复杂推理:大语言模型的北极星能力 :略学术,解释大语言模型能力的来源。

  • GPT,GPT-2,GPT-3 论文精读:视频精读。

  • Building LLM applications for production:在生产环境中构建 LLM 应用。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

标签:https,语言,模型,汇总,学习,LLM,GPT,应用
From: https://blog.csdn.net/lvaolan/article/details/144715567

相关文章

  • ​如何从零开始学习大模型等人工智能算法
    学习人工智能可以分为几个关键步骤。以下是一个从零开始学习人工智能的指南:前排提示,文末有大模型AGI-CSDN独家资料包哦!建立数学和统计基础:学习线性代数,了解矩阵、向量、矩阵运算等基本概念。掌握微积分,包括导数和积分,对于理解机器学习算法中的优化过程很重要。理解......
  • AI大模型应用入门实战与进阶:构建你的第一个大模型:实战指南
    2017年是机器学习领域历史性的一年。GoogleBrain团队的研究人员推出了Transformer,它的性能迅速超越了大多数现有的深度学习方法。著名的注意力机制成为未来Transformer衍生模型的关键组成部分。Transformer架构的惊人之处在于其巨大的灵活性:它可以有效地用于各种机器......
  • 如何学习语言大模型
    如何学习语言大模型需要掌握以下关键概念和技术:前排提示,文末有大模型AGI-CSDN独家资料包哦!1.编程和数据处理Python:学习基本语法、数据结构、文件操作和常用库(如NumPy、Pandas)的使用。资源建议:PythonforEverybody提供了一个很好的Python入门教程,专注于数据处......
  • 零基础大语言模型学习笔记
    ChatGPT的横空出世惊艳了世人,让人们对大语言模型(LargeLanguageModel,LLM)和生成式人工智能(ArtificialIntelligenceGeneratedContent,AIGC,或者GenerativeAI)的兴趣飙升,而LLM表现出的卓越的泛化能力,也被视为实现通用人工智能(ArtificialGeneralIntelligence,AGI)的潜在希......
  • 【NLP】关于大模型训练常见概念讲解
    随着LLM学界和工业界日新月异的发展,不仅预训练所用的算力和数据正在疯狂内卷,后训练(post-training)的对齐和微调等方法也在不断更新。下面笔者根据资料整理一些关于大模型训练常见概念解释。前排提示,文末有大模型AGI-CSDN独家资料包哦!1Pre-training(预训练)预训练是指在模型......
  • 英伟达最新提出ComfyGen,利用大模型自动生成Comfyui工作流,Comfyui再无难度
    StableDiffusion大家都知道,但是想玩好SD,并且玩出花样,那Comfyui肯定得会用。Comfyui相对于去年已经越来越成熟,五花八门的工作流有着五花八门的功能。越来越成熟的背后,却是越来越多的节点,乱糟糟的看着就头疼。要不说英伟达服务好呢,生产芯片也不忘了给用芯片的人提供一些有趣......
  • TurboAttention:基于多项式近似和渐进式量化的高效注意力机制优化方案,降低LLM计算成本7
    随着大型语言模型(LLMs)在AI应用领域持续发展,其计算成本也呈现显著上升趋势。数据分析表明,GPT-4的运行成本约为700美元/小时,2023年各企业在LLM推理方面的总支出超过50亿美元。这一挑战的核心在于注意力机制——该机制作为模型处理和关联信息的计算核心,同时也构成了主要的性能瓶颈......
  • Java 开发之关键注解详细汇总
    一、JDK自带的基本注解@Override作用:用于标识方法重写。它告诉编译器这个方法是重写父类中的方法,如果父类没有这个方法或者方法签名不匹配,编译器会报错。示例:classParent{publicvoidprint(){System.out.println("Parentprint");}}classChilde......
  • EsChatPro 接入国内 DeepSeek 大模型
    EsChatPro接入国内DeepSeek大模型前言上一篇文章我们讲了EsChatPro如何在本地安装运行,接下来给大家带来接入deepseek大模型的教程,实现AI对话功能详见:EsChatPro本地开发运行指南前置准备首先我们打开deepseek的官网:https://www.deepseek.com/点击接入AP......
  • 基于注意力机制的图表示学习:GRAPH-BERT模型
    人工智能咨询培训老师叶梓转载标明出处图神经网络(GNNs)在处理图结构数据方面取得了显著的进展,但现有模型在深层结构中存在性能问题,如“悬挂动画问题”和“过平滑问题”。而且图数据内在的相互连接特性限制了大规模图输入的并行化处理,这在内存限制下尤为突出。针对这些问题,美......