• 2024-09-12深度学习|模型训练:手写 SimpleNet
    文章目录引言SimpleNet网络结构激活函数损失函数梯度计算SimpleNet类权重参数模型推理损失计算梯度计算SimpleNet概览模型训练数据准备训练过程结语引言从前文「深度学习|梯度下降法:误差最小化的权重参数」,我们知道了神经网络的学习就是“找寻使损失函数的值尽
  • 2024-09-10线性回归
    1.配置导入模块。查看代码#generalimportio#dataimportnumpyasnpimportpandasaspd#machinelearningimportkeras#datavisualizationimportplotly.expressaspxfromplotly.subplotsimportmake_subplotsimportplotly.graph_objectsasgoimpor
  • 2024-09-10第J3周:DenseNet算法实战与解析(TensorFlow版)
    >-**
  • 2024-09-09torch.bmm释义
    torch.bmm是PyTorch中的一个函数,用于执行批量矩阵相乘(batchmatrixmultiplication)的操作。它用于计算两个具有相同批次大小的三维张量的矩阵乘法。在矩阵乘法中,两个矩阵的维度必须满足一定的条件。对于torch.bmm函数,它要求输入的两个张量都具有三个维度,形状分别为(batch_siz
  • 2024-09-0907 Windows批处理之文件操作
    如果你问一个对批处理不太熟悉的程序员它的主要用途,他们的回答可能会提到移动文件。批处理可以做更多的事情,但毫无疑问,它的主要用途之一是文件移动。在本文中,我们将探索不同的命令和可用的技术。您还将了解如何创建空文件,以及合并、移动、重命名和删除文件的方法。我将介绍文件掩码
  • 2024-09-0907 Windows批处理之文件操作
    如果你问一个对批处理不太熟悉的程序员它的主要用途,他们的回答可能会提到移动文件。批处理可以做更多的事情,但毫无疑问,它的主要用途之一是文件移动。在本文中,我们将探索不同的命令和可用的技术。您还将了解如何创建空文件,以及合并、移动、重命名和删除文件的方法。我将介绍文件掩
  • 2024-09-07使用Blip的预训练好的imageEncoder并替换其textDecoder
    fromtransformersimportBlipProcessor,BlipTextConfigfromtransformers.models.blip.modeling_blip_textimportBlipTextLMHeadModelfromtransformersimportAutoTokenizermodel=BlipForConditionalGeneration.from_pretrained("huggingface.co/Salesforc
  • 2024-09-01保存模型 & 记录参数
    保存的模型在你提供的代码中,模型保存的条件如下:验证阶段(_valid_epoch方法):在每个epoch结束后,模型会进行验证,即使用验证数据集(self.valid_loader)计算验证指标(valid_metric)。通过self.valid_step方法计算每个batch的验证指标,最终将这些指标的平均值保存在valid_metric
  • 2024-09-01天工开物|征程 6 启航新章:量化流程PTQ篇
    01 概论:PTQ基础目前在GPU上训练的模型大部分都是浮点模型,即参数使用的是float类型存储。而地平线BPU架构的计算平台使用的是int8的计算精度(业内计算平台的通用精度),能运行定点量化模型。地平线征程6算法工具链(以下简称工具链)作为专业量化工具,是一套完整的边缘计算平
  • 2024-08-31【NLP修炼系列之Bert】Bert多分类&多标签文本分类实战(附源码)
    引言今天我们就要用Bert做项目实战,实现文本多分类任务和我在实际公司业务中的多标签文本分类任务。通过本篇文章,可以让想实际入手Bert的NLP学习者迅速上手Bert实战项目。1项目介绍本文是Bert文本多分类和多标签文本分类实战,其中多分类项目是借鉴github中被引用次数比较
  • 2024-08-31Jax 快速上工指南——实现一个 Jax.fit
    前言本文适用对象:任何接触过TensorFlow,Pytorch,Keras并且已经开始了解或尝鲜Jax的人群。如果是没有接触过任何深度学习框架的人群,这篇文章可能不适合你。在开始学习之前,你应该对PyTorch或TensorFlow有一定的了解。Jax可能是一个比较难学的库,但值得一学。为什么使用Jax
  • 2024-08-28兴业证券基于Apache DolphinScheduler的应用实践
    文/兴业证券股份有限公司 刘洋 石良生 柳君 李致琪本文来源于网络,如有侵权,请联系删除任务调度平台,扮演着自动执行预设任务的重要角色,是业务开展过程中不可或缺的一环。随着业务规模的不断扩展,兴业证券每日需要进行数以万计的任务调度,因此,优化和提升任务调度平台的性
  • 2024-08-27limu|P28|Batch Normalization批量规范化
    目录为什么需要批量规范化困难原因需求如何实现批量规范化公式使用部位为什么卷积层的通道维相当于全连接层的特征维?补充:为什么1*1卷积层相当于逐像素全连接层?深入思考BN的作用代码实现Q&ABatchNorm和LayerNorm的解释与对比为什么需要批量规范化困难训练深层神经网络并使其在较
  • 2024-08-223-线性回归从零实现
    1、注意=和-=在梯度更新时的区别defminbatch_sgd(params,lr,batch_size):withtorch.no_grad():forparaminparams:param=param-lr*param.grad/batch_sizeparam.grad.zero_()这段代码是错误的,应该改成param-=lr*param.grad/batch_size原因如下:import
  • 2024-08-19Vulnhub靶机:AI-WEB-1.0
    一.网站查询二.扫描当前网站目录 扫出有http://172.16.1.88/robots.txt继续扫这个刚扫出来的,然后得出 我们再访问m3dinfo/info.php和 /se3reTdir777/这俩目录 得到如上图所示三.进行sql注入1.判断是否有sql注入 /有结果,有报错 2.利用burp抓包进行注入
  • 2024-08-19记一次完整的SpringBatch批处理数据流程
    记一次完整的SpringBatch批处理数据流程需求从400多行数据的Excel表格中批量读取数据,根据读取的数据再去调用api,拿到关键返回数据后整合写入新Excel文件。excel表格仅第一列数据手机号为有效数据,需要读取。通过手机号调用api,获取手机号对应的学生信息-学院,班级,姓名,手机号
  • 2024-08-16第三章:线性神经网络
    3.1线性回归3.1.1基本元素训练数据集/样本/标签/特征3.1.1.1线性模型一个线性模型有权重,偏移量,权重决定特征对预测值的影响,偏移量则是当特征为0时说明预测值为多少3.1.1.2损失函数损失函数能够量化目标的实际值与预测值之间的差距(损失函数以及部分函数前面的二分之一用
  • 2024-08-14一个单机多卡训练模型的例子
    """Mydemotrainscript."""importargparseimportloggingimportosimportrandomimporttimeimportnumpyasnpimporttorchfromtorchimportnn,optim,Tensorfromtorch.utils.dataimportDataLoader,Datasetdefparse
  • 2024-08-11一步一步微调小模型
    本文记录一下,使用自顶向下的编程法一步步编写微调小语言模型的代码。微调一个语言模型,本质上是把一个已经预训练过的语言模型在一个新的数据集上继续训练。那么一次微调模型的任务,可以分为下面三个大个步骤(不包含evaluation):加载已经预训练好的模型和新的数据集预处理模型和
  • 2024-08-10命名张量的解释
    importtorch把3个颜色grb通道合并为一个灰度通道定义变量,用随机数模拟img_t=torch.randn(3,5,5)batch_t=torch.randn(2,3,5,5)weights=torch.randn(3)朴素的求法以channels通道的平均数为灰度值img_gray_naive=img_t.mean(-3)batch_gray_naive=batch
  • 2024-08-09limu|P8-9|线性回归、softmax回归
    线性回归模型:\(y=Xw+b+\epsilon\)1、如何衡量模型质量?lossfunction损失函数——量化实际值和预测值之间的差距可证:在高斯噪声的假设下,线性模型的最大似然估计等价于最小化均方误差(MSE)。证明在另一篇里写过:https://www.cnblogs.com/xjl-ultrasound/p/18305000平方误差:
  • 2024-08-09onnx转engine工具(包含量化) python脚本
    量化工具在网上搜索五花八门,很多文章没有说明使用的版本导致无法复现,这里参考了一些写法实现量化,并转为engine。具体实现代码见下方,欢迎各位小伙伴批评指正。tensorrt安装参考windows11下安装TensorRT,并在conda虚拟环境下使用_tensorrt免费吗-CSDN博客pycuda安装参考GPU
  • 2024-08-08传知代码-动态键值记忆网络解决知识追踪(论文复现)
    代码以及视频讲解本文所涉及所有资源均在传知代码平台可获取1.论文概述复现论文:DynamicKey-ValueMemoryNetworksforKnowledgeTracing(DKVMN)知识追踪(KT)是追踪学生在一系列学习活动中知识状态演变的任务。其目的是个性化地指导学生的学习,帮助他们高效地掌握知识概
  • 2024-08-07梯度累计讲解-支持更大的batch
    在对比学习(ContrastiveLearning)中,梯度累计(GradientAccumulation)是一种技术,用于在内存有限的情况下实现大批量(LargeBatch)训练。这个操作通过将多个小批次的梯度累加起来,再进行一次权重更新,从而模拟大批次训练的效果。以下是梯度累计的基本操作步骤:初始化:在训练开始时,初始化
  • 2024-08-03门控循环单元GRU
    目录一、GRU提出的背景:1.RNN存在的问题:2.GRU的思想:二、更新门和重置门:三、GRU网络架构:1.更新门和重置门如何发挥作用:1.1候选隐藏状态H~t:1.2隐藏状态Ht:2.GRU:四、训练过程举例******:五、预测过程举例******:六、底层源码:七、Pytorch版代码:一、GRU提出的背景:1.RNN存