自 ChatGPT 发布以来,大型语言模型(LLM)已经成为推动人工智能发展的关键技术。
近期,机器学习和 AI 研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 又写了一本新书 ——《Build a Large Language Model (From Scratch)》,旨在讲解从头开始构建大型语言模型的整个过程,包括如何创建、训练和调整大型语言模型。
对GPT大模型感兴趣的有福了!这本书的名字叫 《Build a Large Language Model (From Scratch)》 也就是 从零开始构建大语言模型!
虽然这是一本英文书、而且还没正式出版,但是他真的可以帮你使用python从零构建一个自己的大模型!
为了加强读者的动手能力,这本书主要使用的是 pytorch 框架,而不是依靠各种库。通过这种方法,加上大量的图表和插图让大家可以彻底了解llm的工作原理。
《Build a Large Language Model (From Scratch)》用清晰的文字、图表和示例解释每个阶段,从最初的设计和创建,到采用通用语料库进行预训练,一直到针对特定任务进行微调。
具体来说,新书和项目讲解了如何:
-
规划和编码 LLM 的所有部分;
-
准备适合 LLM 训练的数据集;
-
使用自己的数据微调 LLM;
-
应用指令调整方法来确保 LLM 遵循指令;
-
将预训练权重加载到 LLM 中。
大家了解过llm的应该都知道,大模型就意味着大算力,但是这本书的作者考虑到很多同学算力有限,所以这本书的一切操作都是可以在笔记本上实现的(而且不用花很长时间),不说了1050直接申请出战!!!
这本书的作者Sebastian是Lightning AI的创始人,之前是威斯康辛大学麦迪逊分校的助理教授
值得一提的是这本机器学习神书也是他写的。
这本大模型《Build a Large Language Model (From Scratch)》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
PDF书籍: 完整版本链接获取
标签:20.3,Language,标星,模型,Large,Build,LLM,Model From: https://blog.csdn.net/qkh1234567/article/details/143791112