【新书】构建大型语言模型，370页pdf

时间：2024-10-22 11:50:01浏览次数：3

学习如何从零开始创建、训练和调整大型语言模型（LLMs）

在《从零构建大型语言模型》一书中，畅销书作者塞巴斯蒂安·拉什卡（Sebastian Raschka）将一步步指导你创建自己的LLM。每个阶段都有清晰的文字、图表和示例解释。从最初的设计和创建，到基于通用语料库的预训练，再到为特定任务进行微调，你将全面掌握每个步骤。

《从零构建大型语言模型》教你如何：

规划和编写LLM的所有组件代码
准备适合LLM训练的数据集
为文本分类及自有数据微调LLM
使用人类反馈确保LLM遵循指令
将预训练的权重加载到LLM中

《从零构建大型语言模型》将带你深入AI的“黑箱”，让你调整生成式AI的内部系统。在LLM创建的每个关键阶段，你将深入理解LLM的工作原理、它们的局限性以及它们的定制方法。你可以在普通笔记本电脑上开发LLM，并将其用作个人助手。

关于技术

据说物理学家理查德·费曼（Richard P. Feynman）曾表示：“我无法理解任何我不能自己构建的东西。”基于这一强大的原则，畅销书作者塞巴斯蒂安·拉什卡将引导你逐步构建一个GPT风格的LLM，它可以在你的笔记本电脑上运行。这是一本引人入胜的书籍，涵盖了从规划、编码到训练和微调的每个阶段。

关于本书

《从零构建大型语言模型》是一段充满实践性和成就感的动手旅程，深入探索生成式AI的基础。在不依赖任何现有LLM库的情况下，你将编写一个基础模型，将其发展为文本分类器，最终创建一个可以按照对话指令进行交互的聊天机器人。而且你会真正理解它，因为你是自己构建的！

书中内容

规划并编写一个与GPT-2相当的LLM
加载预训练权重
构建完整的训练管道
为文本分类微调LLM
开发遵循人类指令的LLM

读者对象

读者需要具备中级的Python技能和一些机器学习知识。你所创建的LLM可以在任何现代笔记本电脑上运行，并且可以选择使用GPU。

作者简介

塞巴斯蒂安·拉什卡（Sebastian Raschka）是Lightning AI的研究工程师，专注于LLM研究并开发开源软件。

本书的技术编辑是大卫·卡斯韦尔（David Caswell）。

了解大型语言模型
处理文本数据
编写注意力机制
从零实现GPT模型生成文本
在无标签数据上进行预训练
为分类进行微调
为遵循指令进行微调
附录A PyTorch简介
附录B 参考文献和延伸阅读
附录C 习题答案
附录D 为训练循环增加附加功能
附录E 使用LoRA进行参数高效微调

作者简介

塞巴斯蒂安·拉什卡从事机器学习和AI领域已有十多年。他于2022年加入Lightning AI，专注于AI和LLM研究，开发开源软件，并创作教育材料。在此之前，塞巴斯蒂安曾在威斯康星大学麦迪逊分校统计系担任助理教授，专注于深度学习和机器学习的研究。他对教育充满热情，以其畅销的开源软件机器学习书籍闻名。

如何学习AI大模型？

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型！

标签：构建,训练,AI,模型,学习,新书,LLM,370,pdf
From： https://blog.csdn.net/xiangxueerfei/article/details/143144914

怎么提取PDF文件中的文字内容–免费工具分享
序言目前市面上有关pdf处理的工具有很多，不过绝大多数的PDF处理工具都需要付费使用，且很多厂商甚至连试用的机会也不给用户，有试用的，也是限制在几页内，这样就导致用户还没有办法确认你的软件是否满足需要，就要先付费购买会员或者授权，跟强买强卖有什么区别？ 96缔盟pdf版式文件处理......
怎么将多个PDF文件合并成一个文件-免费工具分享
序言目前市面上有关pdf处理的工具有很多，不过绝大多数的PDF处理工具都需要付费使用，且很多厂商甚至连试用的机会也不给用户，有试用的，也是限制在几页内，这样就导致用户还没有办法确认你的软件是否满足需要，就要先付费购买会员或者授权，跟强买强卖有什么区别？ ......
1990-2024历年高考真题pdf合集(高清重绘文字去水印版)，轻松备考!
高考，对于无数学子来说，是人生中的一场大考，是一次决定未来的重要转折。面对日益激烈的竞争，你是否也在为如何高效备考而苦恼？是不是想找一份全面、权威、分类清晰的高考真题资料，却苦于市面上的资源杂乱无章、价格高昂？今天，我要为你推荐一份值得收藏的“宝藏资源”——1990年到2024......
python PyPDF2 切割PDF文件
pythonPyPDF2切割PDF文件fromPyPDF2importPdfReader,PdfWriterdefsplit_pdf(in_file,out_file,orientation="vertical",percent=0.5):""":paramin_file:待拆分的pdf文件:paramout_path:拆分成单页的pdf文件的存储路径:paramorientation......
新书图阁ptcms小说源码(附带最新4个可用采集规则)
源码简介新书图阁小说源码ptcms(附带最新4个可用ptcms采集规则)，自己花了点时间研究了下采集，写了4个可直接使用的采集规则，推荐采集时配合socks5代理一起使用。全新开发，新版UI，添加原创专区，新闻发布，书单发布，采集日志，百度推送，神马推送，推送日志功能。前端高仿起点小说网，自适应模......
.netcore 使用PdfSharpCore生成pdf
想实现的功能是pdf+签名图片合并起来，后面看到了免费开源的PdfSharpCore. 先安装 publicstaticclassPdfSharpCoreHelper{privatestaticstringGetOutFilePath(stringname){stringOutputDirName=@".";return......
《日语红宝书N1-N5文字词汇详解白金版》PDF 文字词汇分级全覆盖
《超值白金版红宝书大全集：新日本语能力考试N1-N5文字词汇详解》N1-N5文字词汇全覆盖，一册在手，备考无忧！适合N1-N5各个级别的日语学习者，全面满足读者的备考需求。全书涵盖N1-N5各级别必须掌握的核心词条，帮考生完全掌握各个阶段的重点词汇。下载地址：《日语红宝书N1-N5文字词汇详......
探索Adobe Acrobat Reader的高级功能：提升PDF文档处理效率
探索AdobeAcrobatReader的高级功能：提升PDF文档处理效率AdobeAcrobatReader，作为Adobe系列中的一款PDF阅读器，早已超越了传统阅读器的范畴，成为了一款功能强大的PDF文档处理工具。无论是商务人士、学生还是科研人员，都可以利用AcrobatReader中的高级功能，提升文档处理效率，实......
ASP.NET Core PDF viewers components Crack
ASP.NETCorePDFviewerscomponentsCrackASP.NETCorePDFviewerscomponentswithformfillingsupportletusersdirectlycomplete,edit,andsubmitdatawithinPDFforms.TheabilitytoreadandwriteformfieldsinaPDFviewercomponenten......
C - Word Ladder （Toyota Programming Contest 2024#9 (AtCoder Beginner Contest 370)
题目链接：C-WordLadder题目：样例：分析：不要被题目所吓到，一切长题目都是纸老虎。题目大意就是给你两个字符串s和t，一次只能更换一个字母，求s变到t更换的次数，并输出每次更换一个字母后的最小字典序字符串。题意好理解，可以直接暴力，大力出奇迹。但是有没有更好的方法呢？既然问了......

【新书】构建大型语言模型，370页pdf

学习如何从零开始创建、训练和调整大型语言模型（LLMs）

关于技术

关于本书

书中内容

读者对象

作者简介

目录

作者简介

如何学习AI大模型？

相关文章

赞助商

阅读排行