• 2024-10-01深度学习(计算数据集均值标准差)
      深度学习中有些数据集可能不符合imagenet计算出的均值和标准差,需要根据自己的数据集单独计算。下面这个脚本能够计算当前数据集均值和标准差。 importtorchimportosfromPILimportImagefromtorchvisionimporttransforms#trans=transforms.Compose([#
  • 2024-09-30【机器学习】揭秘反向传播:深度学习中神经网络训练的奥秘
      目录
  • 2024-09-30NLP任务之预测最后一个词
    目录 1.加载预训练模型2  从本地加载数据集 3.数据集处理  4.下游任务模型5.测试代码 6.训练代码 7.保存训练好的模型 8. 加载保存的模型  1.加载预训练模型#加载预训练模型fromtransformersimportAutoTokenizer#预训练模型:distilgpt2#use_f
  • 2024-09-30nlp任务之预测中间词-huggingface
    目录1.加载编码器1.1编码试算 2.加载数据集 3.数据集处理 3.1map映射:只对数据集中的'sentence'数据进行编码3.2用filter()过滤 单词太少的句子过滤掉3.3截断句子 4.创建数据加载器Dataloader 5. 下游任务模型 6.测试预测代码 7.训练代码 8.保存与加载模
  • 2024-09-25旋转位置编码
    参考自RoPE旋转位置编码深度解析:理论推导、代码实现、长度外推-知乎(zhihu.com)位置编码:1.绝对,直接加到输入中.2.相对,加在Attn的内积之前,外推性能强。 ROPE:对Attn的K和V矩阵做ROPE二维场景: 对于一个二维向量: 偶数维的可以用拆成若干个2维的向量,对这些向量分
  • 2024-09-24日新月异 PyTorch - pytorch 基础: 张量的基础操作
    源码https://github.com/webabcd/PytorchDemo作者webabcd日新月异PyTorch-pytorch基础:张量的基础操作示例如下:basic\demo01.py#本例用于演示torch张量的基础操作,其操作与numpy基本相同(注:看本例之前先要把numpy弄懂)#torch可以支持在gpu上运算,而numpy
  • 2024-09-24日新月异 PyTorch - pytorch 基础: 自动求导
    源码https://github.com/webabcd/PytorchDemo作者webabcd日新月异PyTorch-pytorch基础:自动求导示例如下:basic\demo02.pyimporttorchimportmath#自动求导的简单说明defsample1():#requires_grad用于表示是否需要自动求导k=torch.tensor(1.23
  • 2024-09-23d2l-ai深度学习日记之预备知识(一)
     引言        笔者目前在大三阶段,想跟着研究生老师学习,以便创造更多的深造机会,故学习深度学习.我使用教材d2l-zh进行学习.这篇文章主要是学习预备知识.在此之前,我已经有了python等语言的基本基础.这个博客《d2l-ai深度学习日记》将记录我在深度学习领域的学习与
  • 2024-09-21【已解决 含代码调试分析】pytorch的维度,为什么计算loss是0维度的,0维度是是什么?作用是什么?
    嘿,你能搜索到这个问题,说明你说一个认真学习的同学,这个问题的细节值得思考。欢迎收藏,会持续更新。请仔细看后面的调试界面。三维维度很好理解,就是只管的认为是长宽高,你能看出下面的计算结果吗?importtorchdim_3=torch.randn(1,2,3)dim_2=torch.randn(1,2)dim_1
  • 2024-09-18PyTorch:快速了解Tensor的连续性
    目录1、引言2、底层数据的存储3、按行优先一维展开1、引言Tensor的连续性是指其底层一维数组元素的存储顺序与按行优先一维展开的元素顺序是否一致。2、底层数据的存储  Tensor的底层数据在内存上是连续存储的,通过代码说明如下:用到的python函数与方法x.data_ptr
  • 2024-09-16一个使用 PyTorch 实现的中文聊天机器人对话生成模型916
    这是一个使用PyTorch实现的中文聊天机器人对话生成模型。1数据准备代码假设有两个文件:questions.txt和answers.txt,它们分别包含输入和输出序列。load_data函数读取这些文件并返回一个句子列表。build_vocab函数通过遍历句子来构建词汇表字典word2index和index2
  • 2024-09-12PyTorch----模型运维与实战
    一、PyTorch是什么PyTorch由Facebook开源的神经网络框架,专门针对GPU加速的深度神经网络(DNN)编程。二、PyTorch安装首先确保你已经安装了GPU环境,即Anaconda、CUDA和CUDNN随后进入Pytorch官网​​​​​​PyTorch官网会自动显示符合你电脑配置的Pytorch版本,复制指令到cuda
  • 2024-09-09nn.Sequential 和 nn.ModuleList()的联系与区别
    nn.Sequential和nn.ModuleList()是PyTorch中用于管理神经网络模型中的子模块的两种不同的方式。nn.Sequential是一个用于构建顺序模型的容器类。它允许按照给定的顺序添加一系列的子模块,并将它们串联在一起形成一个顺序的网络结构。nn.Sequential可以简化模型的定义和前向传
  • 2024-09-08PyTorch--Tensor拼接、切分、置换
    目录1、拼接torch.cat()torch.stacks()2、切分torch.chunk()torch.split() 3、置换1、拼接torch.cat()torch.cat(tensors,dim=0,out=None):将张量按照dim维度进行拼接torch.stacks()torch.stacks(tensors,dim=0,out=None):将张量在新创建的dim维度上进行拼接(te
  • 2024-09-07Pytorch相关(第四篇)
    Pytorch自动梯度法完整例子下面是一个使用PyTorch自动梯度法的完整例子。这个例子展示了如何训练一个简单的线性回归模型来拟合一组数据。我们将从头到尾覆盖所有步骤,包括数据准备、模型定义、训练过程以及评估。1.安装PyTorch确保你已经安装了PyTorch。如果没有,请先安
  • 2024-09-07PyTorch--Tensor的索引和切片
    importtorch#tensor索引和切片a=torch.tensor([[1,2,3],[4,5,6],[7,8,9]])b=torch.tensor([[10,10,10],[10,10,10],[10,10,10]])print("a的值:\n",a)#a的值:#tensor([[1,2,3],#[4,5,6],#[7,8,9]])#--------
  • 2024-09-06基于Python的机器学习系列(28):PyTorch中的张量基础
            在本篇中,我们将介绍PyTorch中的张量基础,包括如何将NumPy数组转换为PyTorch张量、创建张量、以及进行基本的张量操作。确认PyTorch版本        首先,确认您使用的PyTorch版本:importtorchprint(torch.__version__)将NumPy数组转换为PyTorch张量 
  • 2024-09-05FLUX 源码解析(全)
    .\flux\demo_gr.py#导入操作系统相关模块importos#导入时间相关模块importtime#从io模块导入BytesIO类fromioimportBytesIO#导入UUID生成模块importuuid#导入PyTorch库importtorch#导入Gradio库importgradioasgr#导入NumPy库importn
  • 2024-09-04【稀疏矩阵】使用torch.sparse模块
    @目录稀疏矩阵的格式coocsrcscConstructionofSparseCOOtensorsConstructionofCSRtensorsLinearAlgebraoperations(稀疏与稠密之间混合运算)Tensormethodsandsparse(与稀疏有关的tensor成员函数)coo张量可用的tensor成员函数(经实测,csr也有一些可以用,比如dim())Torchfunctio
  • 2024-09-04【稀疏矩阵】使用torch.sparse模块
    (文章目录)稀疏矩阵的格式目前,torch.sparse和scipy.sparse模块比较支持的主流的稀疏矩阵格式有coo格式、csr格式和csc格式,这三种格式中可供使用的API也最多。coo将矩阵中非零元素的坐标和值分开存储在3个数组中,3个数组长度必须相同,表示有n个非零元素。csr分IndexPointers
  • 2024-09-02PyTorch从入门到放弃之张量模块
    目录张量的数据类型torch.rand()函数torch.randn()函数torch.normal()函数torch.linspace()函数torch.manual_seed()函数torch.ones()、torch.zeros()、torch.eye()张量的基本操作增加和删除维度交换维度拼接和分割堆叠和分解索引和切片基本数学运算元素求和按索引求和元素乘积求
  • 2024-08-31PyTorch~Tensor
    为什么深度学习中要用Tensor,而不是直接用numpy?发现很多人没有说到重点,首先,数学上的tensor和编程上的(pytorch)内的tensor是两个概念。数学上的tensor是用来研究高维矩阵之间的一些表达方式和运算性质的(比如高维空间的度量如何更加通用的定义),pytorch里面的tensor是一个数据
  • 2024-08-29ggml 简介
    ggml是一个用C和C++编写、专注于Transformer架构模型推理的机器学习库。该项目完全开源,处于活跃的开发阶段,开发社区也在不断壮大。ggml和PyTorch、TensorFlow等机器学习库比较相似,但由于目前处于开发的早期阶段,一些底层设计仍在不断改进中。相比于llama.cpp和whispe
  • 2024-08-29负对数似然(NLL)和困惑度(PPL)
    让我们通过一个简单的例子来演示这段代码的计算过程,包括负对数似然(NLL)和困惑度(PPL)的计算。为了简化,我们将假设一个非常小的模型输出和数据。假设:我们有两个样本(即batchsize为2)。每个样本有3个可能的类别,S_logits是模型输出的logits。smask是一个掩码,假设全部为True
  • 2024-08-28深度学习-pytorch-basic-003
    1.环境配置1.1anconda配置环境condacreate-nDL_pytorchpython=3.11condaacticvateDL_pytorchcondadeactivatecondaenvlistcondaremove-nDL_pytorch--all1.2torchCPU环境配置pipinstalltorch==1.10.0-ihttps://pypi.tuna.tsinghua.edu.cn/simplecond