精选指南：如何从众多大模型书籍中找到最适合你的那一本，大模型书籍最全整理

大模型的书这么多，该怎么选呢？

本期书单就来教大家怎么快速地从众多大模型书中选到你想要的那一本！

大模型基础

大模型入门不可错过的一本书，就是这本大模型界的经典畅销书**《大规模语言模型》**！系统性强，内容适合初学者，如果你想知道如何构建一个大模型应用，系统了解大模型的构建，选它准没错！

**▊《**大规模语言模型：从理论到实践》

张奇，桂韬，郑锐，黄萱菁著

解码大语言模型奥秘，引领机器智能新时代
详细介绍构建LLM的四个主要阶段：预训练、有监督微调、奖励建模和强化学习
解读ChatGPT背后的核心技术
配全书PPT课件

为了使更多的自然语言处理研究人员和对大语言模型感兴趣的读者能够快速了解大模型的理论基础，并开展大模型实践，复旦大学张奇教授团队结合他们在自然语言处理领域的研究经验，以及分布式系统和并行计算的教学经验，在大模型实践和理论研究的过程中，历时8个月完成本书的撰写。希望这本书能够帮助读者快速入门大模型的研究和应用，并解决相关技术问题。

本书详细介绍了构建大语言模型的四个主要阶段：预训练、有监督微调、奖励建模和强化学习。每个阶段都有算法、代码、数据、难点及实践经验的详细讨论。

本书以大语言模型的基础理论开篇，探讨了大语言模型预训练数据的构建方法，以及大语言模型如何理解并服从人类指令，介绍了大语言模型的应用和评估方法，为读者提供了更全面的视野。

本书旨在为对大语言模型感兴趣的读者提供入门指南，也可作为高年级本科生和研究生自然语言处理相关课程的补充教材！

《大语言模型》，作者来自一线的产业界，书中有工程实践，代码配套齐全，如果你想了解更多产业实践方面的内容，就选它！

**▊《**大语言模型：原理与工程实践》

杨青编著

揭开LLM的神秘面纱，解读其机理和工程实践，手把手教你训练7B LLM

本书用10 章对大语言模型进行全面且深入的介绍。首先对大语言模型的基本概念进行介绍。其次，从大语言模型的基础技术、预训练数据构建、预训练技术等方面展开讨论，帮助读者深入了解大语言模型的构建和训练过程。然后，详细介绍有监督微调和强化对齐等技术，以及如何评估大语言模型的性能。外，介绍提示工程和工程实践等方面的内容，帮助读者了解大语言模型的应用和实际操作过程。最后，介绍如何从零开始微调大语言模型，辅以代码示例，帮助读者更好地应用这些技术。

通过阅读本书，读者可以获得全面且深入的大语言模型的知识框架。无论您是研究人员、工程师，还是产品经理，都能从中获得有价值的知识。

《解构大语言模型》，从模型发展史的角度，带你在技术层面上了解大模型是如何从最简单的线性回归模型发展为如今的大语言模型的，精细解读了模型架构与代码实现，有助于打好基本功，对大模型有更深的理解和认识！

▊**《解构大语言模型：从线性回归到通用人工智能（全彩）》**

唐亘著

从模型结构和数据基础两大角度解构大语言模型
详解经典模型的核心结构及实现过程，夯实基础
模型开发与调优，重构ChatGPT，GitHub配套代码
融合统计分析/机器学习/经济学等知识，全彩印刷

本书从模型的结构和数据基础两个方面解构大语言模型，以便帮助读者理解和搭建类似ChatGPT的系统。在模型的结构方面，大语言模型属于深度神经网络，其设计核心是注意力机制，因此，本书涵盖了多层感知器、卷积神经网络和循环神经网络等经典模型。在模型的数据基础方面，本书既涉及模型训练的工程基础，如反向传播，又涉及数据的使用方式，如迁移学习、强化学习，以及传统的监督学习和无监督学习。此外，本书还阐述了如何从计量经济学和经典机器学习模型中汲取灵感，以提高模型的稳定性和可解释性。

本书既适用于希望深入了解大语言模型、通过人工智能技术解决实际问题的读者，也适合作为高等院校计算机及相关专业的师生参考用书。

《大语言模型应用指南》，这本书更侧重于对大模型的使用，从如何使用ChatGPT到如何基于大模型进行二次开发、创建GPTs、Agent系统分析等，由浅入深，带你了解大模型应用的一切！小白读者也可以读懂~~

**▊《**大语言模型应用指南：以ChatGPT为起点，从入门到精通的AI实践教程（全彩）》

万俊著

大语言模型的应用与二次开发
探索智能前沿，驾驭模型力量，对人工智能或编程技术小白读者友好
技术点包含提示工程、长短期记忆、GPTs、Agent系统、微调与安全技术、GPT-4V与Gemini、尺度定律与压缩即智能等

本书是一本对人工智能小白读者非常友好的大语言模型应用指南，有两大特点：一是以通俗易懂的方式解释复杂概念，通过实例和案例讲解大语言模型的工作原理和工作流程、基本使用方法，包括大语言模型常用的三种交互格式、提示工程、工作记忆与长短期记忆，以及外部工具等，使读者能够全面了解和掌握这一先进技术的应用和二次开发；二是紧跟当前大语言模型技术的更新动态，介绍GPTs的创建，以GPT-4V和Gemini为例讲述多模态模型的应用，还包括无梯度优化、自主Agent系统、大语言模型微调、RAG框架微调、大语言模型安全技术等。

无论是学术研究者、工程师，还是对大语言模型感兴趣的普通读者，都可以通过本书获得大语言模型的前沿研究成果、技术进展和应用案例，从而更好地应用大语言模型解决实际问题。

多模态大模型

了解了以上大模型的基础内容，再来看看如今已经实现了文本-图像-语音-视频“大统一”的多模态大模型！

两本《多模态大模型》，该怎么选呢？

想要系统全面地了解多模态大模型的技术理论知识及应用，就选这本**《多模态大模型：新一代人工智能技术范式》**。

▊《多模态大模型：新一代人工智能技术范式（全彩）》

刘阳林倞著

多模态大模型基础、核心、模型详细剖析
AIGC、具身智能、视觉问答等典型应用案例，
因果推理、世界模型、Sora、AGI Agent等前沿技术探究

本书以深入浅出的方式介绍多模态大模型的技术方法、开源平台和应用场景，并详细阐述因果推理、世界模型及多智能体与具身智能等前沿技术领域，有助于读者全面了解多模态大模型的特点及发展方向，对新一代人工智能技术范式和通用人工智能的发展起到重要推动作用。

本书内容共5章，第1章引领读者深入探索最具代表性的大模型结构，包括BERT、Chat-GPT 和ChatGLM等，为建立对多模态大模型的全面认知打下基础。第2章深度剖析多模态大模型的核心技术，如提示学习、上下文学习、思维链和人类反馈强化学习等，揭示多模态大模型的独特之处和引人入胜的技术内涵。第3章介绍多个具有代表性的多模态基础模型，如CLIP、LLaMA、SAM和PaLM-E等，为读者呈现多样和广泛的技术解决方案。第4章深入分析视觉问答、AIGC和具身智能这三个典型应用，展示多模态大模型在实际场景中的强大能力。第5章探讨实现AGI的可行思路，包括因果推理、世界模型、超级智能体与具身智能等前沿技术方向。

本书不仅适合高校相关专业高年级本科生和研究生作为教材使用，更是各类IT从业者的必备参考之作。

想要从模型的发展脉络及实践的角度了解的话，就选这本**《多模态大模型：技术原理与实战》**。

**▊《**多模态大模型：技术原理与实战》

彭勇，彭旋，郑志军，茹炳晟著

读懂ChatGPT的核心技术、GPT的进化史和创新点
详述多模态大模型的核心技术和应用场景
让中小公司可以从0到1部署多模态大模型，打开通往通用人工智能的大门

本书详细介绍了大语言模型和多模态大模型的发展历史、技术原理和亮点、主要的开源框架、配套工具、部署细则和实战案例。为了让读者更好地进行大模型的应用实战，本书还详细介绍了使用大模型为商业赋能的3个应用案例。期望本书能够帮助读者打开通往大模型尤其是多模态大模型的学习、实战和商业成功之路。

扩散模型

想要了解各种AI生成背后的秘密，就看看这本**《扩散模型》**吧~~

**▊《**扩散模型：生成式AI模型的理论、应用与代码实践》

杨灵，张至隆，张文涛，崔斌著

本书作者团队来自著名学府，且与国际知名研究机构、院校有众多交流，其提供的内容具有权威性，并获得众多专家、学者认可
本书从理论和实践两个方面进行了细致介绍。阅读本书的读者，即可获得学术收益，又可进行实践应用
为方便进行理论实践，本书提供了可配套运行的代码文件，读者可以进行下载

本书深入浅出地介绍了扩散模型的知识，案例丰富，讲解细致。第1章介绍AIGC与相关技术，第2章从三个视角介绍扩散模型的基本理论、算法，此外介绍了扩散模型的神经网络架构和代码实现。第3章、第4章、第5章分别从高效采样、似然优化、数据结构三个方面系统介绍了扩散模型的特点，以及后续的改进工作。第6章讨论了扩散模型与其他生成模型的关联，包括变分自编码器、生成对抗网络、归一化流、自回归模型和基于能量的模型。第7章介绍了扩散模型的应用，包括计算机视觉、自然语言处理、时间数据建模、多模态学习、鲁棒学习和跨学科应用。第8章讨论了扩散模型的未来，以及与GPT和大模型的关联。

本书适合高等院校计算机科学、人工智能和医学、生物学等交叉学科专业的师生，以及相关人工智能应用程序的开发人员阅读。

大模型压缩

而如果你意识到，随着大模型规模的增长，模型的算力与可用资源之间的矛盾也在日益加剧，那就一定要读一读这本**《高效深度学习：模型压缩与设计》**，看看如何降低大模型应用成本！

**▊《**高效深度学习：模型压缩与设计（全彩）》

汪玉宁雪妃著

高效模型压缩与设计，释放大模型潜能，赋能千行百业
清华大学电子工程系汪玉宁雪妃作品
权威：出自芯片领域著名专家之手
系统：系统梳理模型压缩与设计关键技术
经验：提供实践中总结的分析思路和经验

本书系统地介绍了高效模型压缩和模型设计的方法，在编写上兼顾理论和实践。本书主体部分详细介绍了模型压缩的方法论，包括高效模块设计、模型剪枝、模型量化、模型二值化、神经网络架构搜索、知识蒸馏几大部分。另外，简要介绍了定制化硬件加速器的设计及大语言模型的加速和压缩。

开源大模型

想要从大模型中挑一个具体研究？Llama是个不错的选择！可以看看这本**《Llama大模型实践指南》**。

▊《Llama大模型实践指南》

张俊祺，曲东奇，张正，占冰强等著

全面介绍Llama的入门指南；实用案例和示例代码助你快速上手；本书配套AI助手答疑解惑

本书共包括7章，涵盖了从基础理论到实际应用的全方位内容。第1章深入探讨了大模型的基础理论。第2章和第3章专注于Llama 2大模型的部署和微调，提供了一系列实用的代码示例、案例分析和最佳实践。第4章介绍了多轮对话难题，这是许多大模型开发者和研究人员面临的一大挑战。第5章探讨了如何基于Llama 2定制行业大模型，以满足特定业务需求。第6章介绍了如何利用Llama 2和LangChain构建高效的文档问答模型。第7章展示了多语言大模型的技术细节和应用场景。本书既适合刚入门的学生和研究人员阅读，也适合有多年研究经验的专家和工程师阅读。

通过阅读本书，读者不仅能掌握Llama 2大模型的核心概念和技术，还能学会如何将这些知识应用于实际问题，从而在这一快速发展的领域中取得优势。

LangChain

当你想要基于大模型进行应用程序开发时，怎么能少得了LangChain这个强大的开发框架呢？

全面系统地学习LangChain，这本由LangChain中文网联合创始人编著的**《LangChian入门指南》**一定是不二之选！

**▊《**LangChain入门指南：构建高可复用、可扩展的LLM应用程序》

李特丽康轶文著

全面介绍LangChain技术
逐步构建自己的LLM应用程序
内容注重高可复用性和可扩展性
实用案例和示例代码助你快速上手
与社区互动，共享经验与解决难题

本书由LangChain中文网联合创始人李特丽与创始人康轶文共同编著！

本书专门为那些对自然语言处理技术感兴趣的读者提供了系统的LLM应用开发指南。全书分为11章，从LLM基础知识开始，通过LangChain这个开源框架为读者解读整个LLM应用开发流程。第1~2章概述LLM技术的发展背景和LangChain框架的设计理念。从第3章开始，分章深入介绍LangChain的6大模块，包括模型I/O、数据增强、链、记忆等，通过大量代码示例让读者了解其原理和用法。第9章通过构建PDF问答程序，帮助读者将之前学习的知识应用于实践。第10章则介绍集成，可拓宽LangChain的用途。第11章为初学者简要解析LLM的基础理论，如Transformer模型等。

本书以LangChain这个让人熟悉的框架为主线，引导读者一步一步掌握LLM应用开发流程，适合对大语言模型感兴趣的开发者、AI应用程序开发者阅读。

如果想要快速地对LangChain有个了解，那就可以看一下这本书如其名的**《LangChain简明讲义》**，主打简明和快！

**▊《**LangChain简明讲义：从0到1构建LLM应用程序》

刘伟舟张婉平著

揭秘大语言模型和 LangChain，由浅入深讲解基础概念和实践案例

本书的结构由浅入深，第1章和第2章介绍大语言模型和LangChain的基础知识，使读者能够对本书内容有整体的认识，并完成运行环境的安装配置，为后续实践奠定基础。第3章至第8章详细介绍LangChain的重要模块，包括模型调用、链、智能体等，深入浅出地介绍了各模块的原理和使用方式。第9章至第11章涉及实践项目，包括对话机器人、代码理解、检索增强生成，通过这些项目，读者能更好地理解如何基于LangChain构建自己的大语言模型应用系统。

本书适合AI应用程序开发者、对大语言模型感兴趣的开发者，以及对大语言模型感兴趣的高等院校学生阅读。

想要更多从实战角度学习LangChain，**《LangChain实战》和《LangChain技术解密》**两本书都配套了可拿来即用的源代码，有丰富的案例供大家实践~~

《LangChain实战》基于稳定版本，还免费提供了讲解视频，可以说非常贴心了！

▊《LangChain实战：从原型到生产，动手打造 LLM 应用》

张海立曹士圯郭祖龙著

基于Langchain0.1长期维护版本
全方位展现从原型到生产LLM应用开发全流程
8位产学研界专家赞誉力荐

本书是专为初学者和对LangChain应用及大语言模型（LLM）应用感兴趣的开发者而编写的。本书以LangChain团队于2024年1月发布的长期维护版本0.1为基础，重点介绍了多个核心应用场景，并且深入探讨了LCEL的应用方式。同时，本书围绕LangChain生态系统的概念，详细探讨LangChain、LangServe和LangSmith，帮助读者全面了解LangChain团队在生成式人工智能领域的布局。此外，本书还介绍了开源模型运行工具，为读者引入本地免费的实验环境，让读者能够亲自动手进行实际操作。

通过本书，读者可以真正体验到LangChain在从原型到生产的LLM应用开发和上线闭环体验方面的优势，全面了解LangChain的概念、原理和应用，并且获得实际开发LangChain应用的经验。本书示例丰富，内容通俗易懂，既可作入门教程，也可供相关技术人员参考。

▊《LangChain技术解密：构建大模型应用的全景指南》

王浩帆编著

内容全面：包含Langchain的新版本、新动态及全新表达式语言
系统深入：书中融入了LangGraph、Langsmith等核心组件，讲解细致入微
结构流畅：章节设计自然衔接，有助于读者掌握Langchain的运行逻辑
深度拓展：深入讲解了Langchain的隐私与安全、数据评估等高级主题
实战性强：提供了丰富的代码实例和结果截图，读者可快速上手实践
源码开放：在作者的GitHub中提供了各章节源码，读者可独立运行学习

本书共10章，分别介绍了LangChain的开发环境搭建、模型、提示、数据连接、链、记忆、代理、回调及周边生态等内容，并用三个案例，即基于Streamlit实现聊天机器人、基于Chainlit实现PDF问答机器人、零代码AI应用构建平台Flowise，将前面大语言模型的内容学以致用。通过本书，读者既能提升自身的技术素养，又能拓展自己解决实际难题的能力。

本书适合刚入门或想加入AI行业的技术从业者、需要结合大语言模型相关技术为业务赋能的产品经理、计算机相关专业的学生，以及AI爱好者和自学者。

在这里插入图片描述