首页 > 其他分享 >2024最新大模型入门自学资源汇总!收藏这一篇就够了!

2024最新大模型入门自学资源汇总!收藏这一篇就够了!

时间:2024-11-08 11:51:02浏览次数:3  
标签:学习 入门 AI 模型 就够 2024 API LLM GPT

接触各种AI工具到现在也快两年了,今年和同学陆续做了一些AI应用的科普宣讲,在这过程中收集了不少自学资源,特地挑出一部分整理成以下的内容。

扫描下方即可领取全部资料

书籍

大模型应用开发极简入门:基于GPT-4和ChatGPT

首推今年年初出版的《大模型应用开发极简入门:基于GPT-4和ChatGPT》,小红书上也有人叫它“章鱼书”(实际上是刺蛇尾Ophiothrix spiculata)。
在这里插入图片描述

这本书应该是目前综合下来最好的大模型应用入门类书籍,从大模型的基础概念和发展史讲起:

  • 第 1 章 初识 GPT-4 和 ChatGPT

  • 1.1 LLM 概述

  • 1.1.1 探索语言模型和 NLP 的基础

  • 1.1.2 理解 Transformer 架构及其在 LLM 中的作用

  • 1.1.3 解密 GPT 模型的标记化和预测步骤

  • 1.2 GPT 模型简史:从 GPT-1 到 GPT-4

  • 1.2.1 GPT-1

  • 1.2.2 GPT-2

  • 1.2.3 GPT-3

  • 1.2.4 从 GPT-3 到 InstructGPT

  • 1.2.5 GPT-3.5、Codex 和 ChatGPT

  • 1.2.6 GPT-4

第一章就有案例帮助读者深入浅出地理解大模型的落地应用:

  • 1.3 LLM 用例和示例产品

  • 1.3.1 Be My Eyes

  • 1.3.2 摩根士丹利

  • 1.3.3 可汗学院

  • 1.3.4 多邻国

  • 1.3.5 Yabble

  • 1.3.6 Waymark

  • 1.3.7 Inworld AI

  • 1.4 警惕 AI 幻觉:限制与考虑

  • 1.5 使用插件和微调优化 GPT 模型

  • 1.6 小结

第二章直接开讲OpenAI的API调用:

  • 第 2 章 深入了解 GPT-4 和 ChatGPT 的 API

  • 2.1 基本概念

  • 2.2 OpenAI API 提供的可用模型

  • 2.3 在 OpenAI Playground 中使用 GPT 模型

  • 2.4 开始使用 OpenAI Python 库

  • 2.4.1 OpenAI 访问权限和 API 密钥

  • 2.4.2 Hello World 示例程序

  • 2.5 使用 GPT-4 和 ChatGPT

  • 2.5.1 ChatCompletion 端点的输入选项

  • 2.5.2 ChatCompletion 端点的输出格式

  • 2.5.3 从文本补全到函数

  • 2.6 使用其他文本补全模型

  • 2.6.1 Completion 端点的输入选项

  • 2.6.2 Completion 端点的输出格式

  • 2.7 考虑因素

  • 2.7.1 定价和标记限制

  • 2.7.2 安全和隐私

  • 2.8 其他 OpenAI API 和功能

  • 2.8.1 嵌入

  • 2.8.2 内容审核模型

  • 2.8.3 Whisper 和 DALL · E

  • 2.9 小结(含速查清单)

第三章就开始教你构建基于大模型的应用了,还有示例项目:

  • 第 3 章 使用 GPT-4 和 ChatGPT 构建应用程序

  • 3.1 应用程序开发概述

  • 3.1.1 管理 API 密钥

  • 3.1.2 数据安全和数据隐私

  • 3.2 软件架构设计原则

  • 3.3 LLM 驱动型应用程序的漏洞

  • 3.3.1 分析输入和输出

  • 3.3.2 无法避免提示词注入

  • 3.4 示例项目

  • 3.4.1 项目 1:构建新闻稿生成器

  • 3.4.2 项目 2:YouTube 视频摘要

  • 3.4.3 项目 3:打造《塞尔达传说:旷野之息》专家

  • 3.4.4 项目 4:语音控制

  • 3.5 小结

第四章包括了提示词和微调的技巧:

  • 第 4 章 GPT-4 和 ChatGPT 的高级技巧

  • 4.1 提示工程

  • 4.1.1 设计有效的提示词

  • 4.1.2 逐步思考

  • 4.1.3 实现少样本学习

  • 4.1.4 改善提示效果

  • 4.2 微调

  • 4.2.1 开始微调

  • 4.2.2 使用 OpenAI API 进行微调

  • 4.2.3 微调的应用

  • 4.2.4 生成和微调电子邮件营销活动的合成数据

  • 4.2.5 微调的成本

  • 4.3 小结

第五章讲LangChain和API插件:

  • 第 5 章 使用 LangChain 框架和插件增强 LLM 的功能

  • 5.1 LangChain 框架

  • 5.1.1 动态提示词

  • 5.1.2 智能体及工具

  • 5.1.3 记忆

  • 5.1.4 嵌入

  • 5.2 GPT-4 插件

  • 5.2.1 概述

  • 5.2.2 API

  • 5.2.3 插件清单

  • 5.2.4 OpenAPI 规范

  • 5.2.5 描述

  • 5.3 小结

  • 5.4 总结

如果只读一本书,那么这本就是目前最全最容易上手的教材。缺点就是这本书是译制书,有些用语读起来可能不如本土化教材那么顺畅。

GPT 图解 - 大模型是怎样构建的!

黄佳老师之前出版过好几本和数据分析与机器学习相关的书籍。这本《GPT 图解 - 大模型是怎样构建的!》花费了很大的篇幅用图解的方式对大模型的原理进行了揭秘,在GPT原理解释上比上面那本书还要来得深入,缺点是实战案例相对没那么多,而且售价将近80元。

在这里插入图片描述

当然,如果你有条件可以顺便把黄佳老师的另一本书《动手做AI Agent》也一并买了:

在这里插入图片描述

这两本书在Github上都有对应的示例和代码:

  • GitHub - huangjia2019/llm-gpt: 异步图书 《GPT图解 大模型是怎样构建的!》

  • GitHub - huangjia2019/ai-agents: 异步图书 《大模型应用开发 动手做AI Agent》

大规模语言模型:从理论到实践

如果之前提到的那本书你嫌贵,又想看正规、免费、系统的教材,网上也有。

这里先推荐复旦大学计算机科学技术学院团队出品的《大规模语言模型:从理论到实践》:

在这里插入图片描述

一共八章课件(PPT格式):

  • 第一章 绪论

  • 第二章 大语言模型基础

  • 第三章 大语言模型预训练数据

  • 第四章 分布式模型训练

  • 第五章 有监督微调

  • 第六章 强化学习

  • 第七章 大语言模型应用

  • 第八章 大语言模型评估

Github


如果你不是编程小白,熟悉Github的话,大模型相关的优质资源就更多了。

Datawhale

首先找到这个Github账号:Datawhale

然后到Repo下面按Stars排序,那么你就得到了一片和机器学习、深度学习、大模型等知识构成的海洋:
在这里插入图片描述

和大语言模型相关且热度比较高的repo有这几个,你可以clone到本地慢慢啃:

  • https://github.com/datawhalechina/llm-cookbook

  • https://github.com/datawhalechina/self-llm

  • https://github.com/datawhalechina/llm-universe

  • https://github.com/datawhalechina/so-large-lm

动手学大模型Dive into LLMs系列

当然Github上的宝藏坑位也不止一个,还有Github用户Lordog和其他6个Contributor开源的教程:《动手学大模型Dive into LLMs》系列编程实践教程,本质是上海交大《人工智能安全技术》课程的拓展。

在这里插入图片描述

llm-action

还有一个比较推荐的是知乎答主吃果冻不吐果冻皮在Github上的llm-action项目:https://github.com/liguodongiot/llm-action

从目录上看这比前两个Github教程更全面和连贯,也更系统。如果你只打算找一个Github项目来全面了解大模型,那么选这个就没错了:

相关文章

  • 大模型蓝皮书最新:2024人工智能大模型技术财务应用蓝皮书,报告共计:129页PDF无偿分享
    今天分享的是:2024人工智能大模型技术财务应用蓝皮书报告共计:129页《人工智能大模型技术财务应用蓝皮书》由智能财务研究院出品,探讨了人工智能大模型技术在财务领域的应用。大模型具有突出的“涌现”能力、统一的Prompt交互、高扩展性的应用框架和高成本的训练和推理过程......
  • 20241107数据封装
    20241107数据封装数据包利用网络在不同设备之间传输时,为了可靠和准确地发送到目的地,并且高效地利用传输资源(传输设备和传输线路),事先要对数据包进行拆分和打包,在所发送的数据包上附加上目标地址,本地地址,以及一些用于纠错的字节,安全性和可靠性较高时,还要进行加密处理等等。这些操......
  • 11.8 javaweb学习 day1 入门
    网页响应流程浏览器前端服务器后端服务器数据库1.浏览器请求前端2.前端响应浏览器3.浏览器请求后端4.后端请求数据库5.数据库响应后端6.后端响应浏览器网页的组成1.网页的文字,图片,音频,视频,超链接什么的,本质是前端代码2.前端代码通过浏览器的转化......
  • Vue3+ElementPlus快速入门 | 小蚂蚁云
       项目介绍基于SpringBoot3、SpringSecurity、MybatisPlus、Vue3、TypeScript、Vite、ElementPlus、MySQL等技术栈实现的单体前后端分离后台管理系统;后端基于Java语言采用SpringBoot3、SpringSecurity、MybatisPlus、MySQL等主流技术栈,前端基于Vue3、TypeScript、Vite等技......
  • 36套Web前端全栈Vue3项目实战P7架构-入门篇+项目篇+进阶篇+架构篇
    36套Web前端全栈Vue3项目实战P7架构-入门篇+项目篇+进阶篇+架构篇36套eb前端全栈Vue3项目实战-入门篇+项目篇+进阶篇+架构篇,P7前端架构,高薪面试,Vue3源码剖析视频课程-技术栈-TypeScript+Vute+ElementPlus+Koa2+Node.js+Pinia+EChart4.0+Uni-App+React18+Flutter+Web3D+Vant+UI,项......
  • Oracle10g / oracle11g 安装过程中的常见错误解决办法-【20241118】
    一、oracle10g安装1、在ORACLE10g安装准备的过程中:缺少libXp.so.6依赖上网搜过不少文章,但是都不是很好的解决我自己摸索出一个解决方法:在RHEL5的安装盘中找到libXp-1.0.0-8.i386.rpm,进行安装后,便可解决。2、在ORACLE10g安装过程中Xlib:connectionto......
  • 人工智能入门
    确定性计算,符号主义(早期人工智能) 不确定性计算:建模、机器学习(世界的随机性、不确定性和动态性- 需要模式识别(学习)的能力,从数据中总结规律) 智能即学习。人类的学习,是有类比思维的,得出方法论、哲学;机器的学习,只是在训练特征参数,没有灵性。  机器学习常见的问题 ......
  • C++入门基础(一)
    目录C++关键字命名空间命名冲突例子域的概念理解命名空间定义例子1例子2例子3例子4例子5例子6例子7C++输出与输入输出输入感谢各位大佬对我的支持,如果我的文章对你有用,欢迎点击以下链接......
  • 【全99集】强推!这可能是C站最全的大模型零基础全套教程,2024最新版,草履虫能都学会!存下
    ChatGPT的出现在全球掀起了AI大模型的浪潮,2023年可以被称为AI元年,AI大模型以一种野蛮的方式,闯入你我的生活之中。从问答对话到辅助编程,从图画解析到自主创作,AI所展现出来的能力,超出了多数人的预料,让不少人惊呼:“未来是属于AI的”。AI大模型——成为互联网从业者必备技能。......
  • [赛记] NOIP2024加赛1 && 多校A层冲刺NOIP2024模拟赛18
    暴力错解大赛玩游戏82pts乱糊的错解,正确性和时间复杂度都不对,但是拿了82pts;对于正解,考虑从$k$将原序列分成两个部分,左边和右边,然后分别求一次前缀和(注意这里,可以省去很多分讨和常数),设前一个前缀和数组为$a$,后一个为$b$,那么问题就转化成有两个指针$i,j$,可以任......