首页 > 其他分享 >先到先得!字节内疯传的380页《从零开始大模型开发与微调基于PyTorch与ChatGLM》大模型必备书籍!

先到先得!字节内疯传的380页《从零开始大模型开发与微调基于PyTorch与ChatGLM》大模型必备书籍!

时间:2024-10-14 13:48:04浏览次数:3  
标签:实战 内疯传 卷积 模型 神经网络 380 PyTorch 详解

大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch 2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。

实战案例丰富

  • 基于PyTorch卷积层的MNIST分类实战
  • PyTorch数据处理与模型展示
  • ResNet实战
  • 有趣的词嵌入
  • 基于PyTorch循环神经网络的中文情感分类实战
  • 自然语言处理的编码器
  • 预训练模型BERT
  • 自然语言处理的解码器
  • 强化学习实战
  • 只具有解码器的GPT2模型
  • 实战训练自己的ChatGPT
  • 开源大模型ChatGLM使用详解ChatGLM高级定制化应用实战
  • 对ChatGLM进行高级微调

在这里插入图片描述

有需要的朋友可以可以微信扫描下方二维码免费领取!
## 目录

第1章 新时代的曙光——人工智能与大模型

  • 人工智能:思维与实践的融合.

    • 人工智能的历史与未来
    • 深度学习与人工智能
    • 选择PyTorch 2.0 实战框架
  • 大模型开启人工智能的新时代

    • 大模型带来的变革
    • 最强的中文大模型–清华大学 Cha1GLM介绍
    • 近在咫尺的未来–大模型的应用前景
  • 本章小结

img

第2章 PyTorh2.0深度学习环境建

  • 环境搭建1:安装 python

    • Minioondn的下载与安装
    • PyCharm 的下载与安装
    • Python 代码小练习:计算Sofimax函数
  • 环境搭建2:安装 PyTorch 2.0

    • Nvidin 10120/30/40 系列显卡选择的 GPU版本
    • PyTorch2.0GPUNvidia运行库的安装
    • PyTorch2.0小练习:Hello PyTorch
  • 生成式模型实战:古诗词的生成

  • 图像降噪:手把手实战第一个深度学习模型

    • MNIST 数据集的准备
    • MNIST数据集的特征和标签介绍
    • 模型的准备和介绍
    • 对目标的远近–模型的损失画数与优化函数
    • 基于深度学习的模型训练
  • 本章小结
    在这里插入图片描述

第3章 从零开始学习PyTorch2.0

  • 实战MNIST 手写体识别

    • 数据图像的获取与标签的说明
    • 实战基于 PyTorch2.0的手写体识别模型
    • 基于Nctron 库的 PyTorch 2.0 模型可视化
  • 自定义经网络框架的基本设计

    • 神经网络框架的抽象实現
    • 自定又神经网络福架的具体实现
  • 本章小结
    img

第4章 一学就会的深度学习基础算法详解

  • 反向传播神经网络的前身历史

  • 反向传指神经网络两个基础算法详解

    • 最小二泉法详解
    • 梯度下降算法
    • 最小二来法的梯度下降算法及其 Python 实现
  • 反馈抻经网络反向传播算法介绍

    • 深度学习基础
    • 链式求导法则
    • 反馈神经网络的原理与公式推导
    • 反馈神经网络原理的激活函数
    • 反馈神经网络原理的Pyihon 实现
  • 本章小结

img

第5章 基于PyTOrch卷积层的MNIST分类实战

  • 卷积运算的基本概念

    • 基本卷积运算示例
    • PyTorch 中的卷积函数实现详解
    • 池化运算
    • Sofmmax 激活函数
    • 卷积神经网络的原理
  • 实战:基于卷积的 MNIST手写体分类

    • 数据的准备
    • 模型的设计
    • 基子卷积的 MNIST 分类模型
  • PyTorch 的深度可分离膨胀卷积详解

    • 深度可分离卷积的定义
    • 深度的定义以及不同计算层特训练参数的比较
    • 膨胀卷积详解
    • 实战:基于深度可分离膨胀卷积的 MNIST手写体识别
  • 本章小结
    在这里插入图片描述

第6章 可视化的PyTorch数据处理与模型展示

  • 用于自定文数据集的 torch.urils,data 工具使用详解

    • 使用 torch.utils,datn Dataset对装自定义数据集
    • 改变数据类型的 Dataset 类中的 translonmm 的使用
    • 批量输出数据的 DataLosder 英详解
  • 实战:基于tensorboardx的训练可视化展示

    • 可视化组件 tensorboanix 的简介与安装
    • tensorboindx可视化组件的使用
    • tensorboardx对模型训炼过程的展示
  • 本章小结

在这里插入图片描述

第7童 ResNet实战
第8章 有趣的词嵌入
第9章 基于循环神经网络的中文情感分类实战
第10章 从零开始学习自然语言处理的编码器
第11章 站在巨人膀上的预训练模型BERT
第12章 从1开始自然语言处理的解码器
第13章 基于PyTorch2.0的强化学习实战
第14章 ChatGPT前身–只具有解码器的 GPT-2模型
第15章 实战训练自己的ChatGPT
第16章 开源大型ChaGLM使用详解
第17章 开源大模型 ChalGLM 高级定制化应用实战
第18章 对训练成本上亿美元的ChatGLM进行高级微调

篇幅有限,这里就不一一展示了,有需要的朋友可以可以微信扫描下方二维码免费领取!

标签:实战,内疯传,卷积,模型,神经网络,380,PyTorch,详解
From: https://blog.csdn.net/xxue345678/article/details/142916662

相关文章

  • 斯坦福大学人工智能图书馆收藏的这本大模型黑书到底有何魔力?
    给大家送福利啦!内行人都在学的大模型黑书,外网爆火的LLM应用手册,由清华大学出版社出版的《大模型应用解决方案——基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理》我已将这本大模型黑书免费分享出来,需要的小伙伴可以扫取。Transformer模型介绍Transformer......
  • 到底大模型有什么用呢?一文了解什么是大模型?
    大模型是指具有大规模参数和复杂计算结构的机器学习模型。本文从大模型的基本概念出发,对大模型领域容易混淆的相关概念进行区分,并就大模型的发展历程、特点和分类、泛化与微调进行了详细解读,供大家在了解大模型基本知识的过程中起到一定参考作用。本文目录如下:1、大模型......
  • 大模型微调
    大模型微调指令微调指令微调对齐微调高效微调适配器微调(adaptertuning)前缀微调(prefixtuning)提示微调(prompttuning)低秩适配(LoRA)对齐微调高效微调适配器微调(adaptertuning)前缀微调(prefixtuning)提示微调(prompttuning)低秩适配(LoRA)【论文速读】LoRA:Low-rankadapt......
  • 大模型驱动企业革新:论大模型赋能企业,大模型的潜力超乎你的想象
    如今,大模型的种类繁多,涵盖面广,但如何把它们应用到企业自身的业务当中,提升企业的技术水平和市场竞争力,却需要考虑到一个非常关键的问题:如何将大模型落地?这需要我们深入探讨大模型的投入成本和收益是否值得,并寻找有效的应用领域。如果我们没有思考清楚这些问题,企业要么盲目跟......
  • 什么是大模型?(超详细)大模型从入门到精通,看这一篇就够了!
    大模型的定义大模型是指具有数千万甚至数亿参数的深度学习模型。近年来,随着计算机技术和大数据的快速发展,深度学习在各个领域取得了显著的成果,如自然语言处理,图片生成,工业数字化等。为了提高模型的性能,研究者们不断尝试增加模型的参数数量,从而诞生了大模型这一概念。大模......
  • 【火山引擎】调用火山大模型的方法 | SDK安装 | 配置 | 客户端初始化 | 设置
    豆包(Doubao)是字节跳动研发的大规模预训练语言模型。目录1安装2配置访问凭证3客户端初始化4设置地域和访问域名5设置超时/重试次数1安装通过pip安装PYTHONSDK。pipinstall'volcengine-python-sdk[ark]'2配置访问凭证获取APIKey访问凭证具体步骤......
  • 大模型与生成式AI结合:HelpLook引领零售增长新篇章
    近年来,零售行业在数字化、技术革新、经济波动及消费者需求多变的挑战下,展现出强大的适应性和创新力。AI技术的深度融合,正引领零售、电商、教育等领域,尤其是零售业步入一个生产力飞跃、客户至上的全新时代。企业亟需挖掘客户与产品数据的潜力,利用统一的知识管理平台与差异化战......
  • 分布式事务之Seata的AT模型
    在Seata的事务管理中有三个重要的角色:TC(TransactionCoordinator)-事务协调者:维护全局和分支事务的状态,协调全局事务提交或回滚。TM(TransactionManager)-事务管理器:定义全局事务的范围、开始全局事务、提交或回滚全局事务。RM(ResourceManager)-资源管理器:管理分......
  • Seata的AT模型
    什么是seataSeata(SimpleExtensibleAutonomousTransactionArchitecture)是一个开源的分布式事务解决方案,它主要用于解决微服务架构下分布式事务问题。Seata提供了多种分布式事务解决方案,适用于不同场景,以下是其几种主要的解决方案:1.AT模式(AutomaticTransaction)特点:AT模......
  • openvino 大模型qwen2.5推理案例
    参看:https://github.com/openvinotoolkit/openvino.genai/releases/tag/2024.4.0.0https://github.com/TommyZihao/openvino_tonypi/blob/main/OpenVINO-0911/AIPC%E4%BB%A3%E7%A0%81/%E3%80%90B1%E3%80%91%E4%B8%89%E8%A1%8C%E4%BB%A3%E7%A0%81%E5%BC%80%E5%90%AF%E5%A4%......