• 2024-07-02焦点损失:深度学习中的目标检测优化神器
  • 2024-07-02【打卡】003 p3 Pytorch实现天气识别
    打卡~555我的环境:●语言环境:Python ●编译器:jupyternotebook●深度学习环境:Pytorch>-**
  • 2024-07-011-3.文本数据建模流程范例
    文章最前:我是Octopus,这个名字来源于我的中文名–章鱼;我热爱编程、热爱算法、热爱开源。所有源码在我的个人github;这博客是记录我学习的点点滴滴,如果您对Python、Java、AI、算法有兴趣,可以关注我的动态,一起学习,共同进步。importos#mac系统上pytorch和matplotlib在ju
  • 2024-07-01【打卡】002 p2 CIFAR10彩色图片识别
    打卡~555我的环境:●语言环境:Python●编译器:jupyternotebook●深度学习环境:Pytorch>-**
  • 2024-07-01量子机器学习原理与代码实战案例讲解
    量子机器学习原理与代码实战案例讲解作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词:量子机器学习,QML,量子计算,量子算法,机器学习,Python编程,TensorFlowQuantum库1.背景介绍1.1问题的由来随着数据量的爆炸增长以及对更高效决
  • 2024-06-30(六)大模型RLHF:PPO原理与源码解读
    大模型RLHF:PPO原理与源码解读原文链接:图解大模型RLHF系列之:人人都能看懂的PPO原理与源码解读本文直接从一个RLHF开源项目源码入手(deepspeed-chat),根据源码的实现细节,给出尽可能丰富的训练流程图,并对所有的公式给出直观的解释。希望可以帮助大家更具象地感受RLHF的训练流程。关
  • 2024-06-30深度学习实战之找最大数字
    文章目录前言问题描述生成训练集定义神经网络进行训练模型评估预测前言之前学习了深度学习的概念与基本过程,今天用一个简单的深度学习框架实现最大数字的找寻,理解深度学习的的基本流程。问题描述假设有一个5维数组,
  • 2024-06-23goldfish loss:减少训练数据泄漏,提高大语言模型输出的多样性
    LLMs(大型语言模型)能够记忆并重复它们的训练数据,这可能会带来隐私和版权风险。为了减轻记忆现象,论文作者引入了一种名为"goldfishloss"的微妙修改,在训练过程中,随机抽样的一部分标记被排除在损失计算之外。这些被舍弃的标记不会被模型记忆,从而防止模型完整复制训练集中的一整
  • 2024-06-22【深度学习】python之人工智能应用篇——图像生成技术(二)
    说明:两篇文章根据应用场景代码示例区分,其他内容相同。图像生成技术(一):包含游戏角色项目实例代码、图像编辑和修复任务的示例代码和图像分类的Python代码示例图像生成技术(二):包含简化伪代码示例、使用GAN生成医学图像代码示例和使用GAN生成产品展示图代码示例图像生成是
  • 2024-06-21PyTorch(一)模型训练过程
    PyTorch(一)模型训练过程#c总结实践总结该实践从「数据处理」开始到最后利用训练好的「模型」预测,感受到了整个模型的训练过程。其中也有部分知识点,例如定义神经网络,只是初步的模仿,有一个比较浅的认识,还需要继续学习原理。整个流程:「准备数据」,「创建数据加载器」,「选择
  • 2024-06-21PyTorch+CNN进行猫狗识别项目
    任务介绍数据结构为:big_data  ├──train  │ └──cat  │    └──XXX.jpg(每个文件夹含若干张图像)  │ └──dog  │    └──XXX.jpg(每个文件夹含若干张图像)  ├──val  │ └──cat  │
  • 2024-06-20昇思25天学习打卡营第1天 | 快速入门
    官网完整版代码详解题外话:这几天人工智能实训,在学深度学习,我觉得蛮像的过程理解:1.数据预处理1.1load数据集1.2查看数据集对象的结构和类型1.3数据变换MindSpore的dataset使用数据处理流水线(DataProcessingPipeline),需指定map、batch、shuffle等操作。使用map对图像数据
  • 2024-06-19在AMD GPUs上构建解码器Transformer模型
    BuildingadecodertransformermodelonAMDGPU(s)—ROCmBlogs在这篇博客中,我们展示了如何使用PyTorch2.0和ROCm在单个节点上的单个和多个AMDGPU上运行AndrejKarpathy精美的PyTorch重新实现的GPT。我们使用莎士比亚的作品来训练我们的模型,然后进行推理,看看我们的模
  • 2024-06-18[论文速览] Small-scale proxies for large-scale Transformer training instabilities
    Pretitle:Small-scaleproxiesforlarge-scaleTransformertraininginstabilitiessource:ICLR2024paper:https://arxiv.org/abs/2309.14322code:ref:小尺度Transformer如何ScaleIdea这篇文章想通过小模型来研究大模型(Transformer)训练不稳定的原因Method(Model)图
  • 2024-06-18monocular 3D detection小结
    smoke参考https://zhuanlan.zhihu.com/p/452676265monodle通过大量密集实验(逐步用gt替换预测值测试),localizationerror是3d检测的关键。提出三点策略:1.重新思考了2d中心和3d中心的不对齐影响(用3dcenter替换2dcenter能提高性能,且2d检测能作为辅助任务帮助3d检测)2.去除较远
  • 2024-06-17无监督学习实用指南-全-
    无监督学习实用指南(全)原文:annas-archive.org/md5/5d48074db68aa41a4c5eb547fcbf1a69译者:飞龙协议:CCBY-NC-SA4.0序言机器学习的简要历史机器学习是人工智能的一个子领域,计算机通过数据学习,通常是为了在某些狭义定义的任务上提高性能,而无需显式编程。机器学习这个术语早
  • 2024-06-17手把手教NLP小白如何用PyTorch构建和训练一个简单的情感分类神经网络
        在当今的深度学习领域,神经网络已经成为解决各种复杂问题的强大工具。本文将通过一个实际案例——对Yelp餐厅评论进行情感分类,来介绍如何使用PyTorch构建和训练一个简单的神经网络模型。我们将逐步讲解神经网络的基础概念,如激活函数、损失函数和优化器,并最终实现一
  • 2024-06-16PyTorch学习9:卷积神经网络
    文章目录前言一、说明二、具体实例1.程序说明2.代码示例总结前言介绍卷积神经网络的基本概念及具体实例一、说明1.如果一个网络由线性形式串联起来,那么就是一个全连接的网络。2.全连接会丧失图像的一些空间信息,因为是按照一维结构保存。CNN是按照图像原始结构进
  • 2024-06-15深度学习 - RNN训练过程推演
    1.数据准备字符序列“hello”转换为one-hot编码表示:输入:[‘h’,‘e’,‘l’,‘l’]输出:[‘e’,‘l’,‘l’,‘o’]2.初始化参数假设我们使用一个单层的RNN,隐藏层大小为2。初始参数如下:W
  • 2024-06-14第十周:使用PyTorch实现车牌识别
  • 2024-06-14河道漂浮物识别 YOLOv8
    河道漂浮物识别根据智能视频分析,河道漂浮物识别自动分析识别视频图像信息内容,不用人工干涉;河道漂浮物识别监控区域里的河面漂浮物,出现异常状况时更快开展预警信息,真真正正完成预警信息、正常的检验、规范化管理,合理帮助管理者最大限度地降低乱报和少报;还能够查询视频录像,便捷过
  • 2024-06-14【课程总结】Day8(上):深度学习基本流程
    前言在上一篇课程《【课程总结】Day7:深度学习概述》中,我们了解到:模型训练过程→本质上是固定w和b参数的过程;让模型更好→本质上就是让模型的损失值loss变小;让loss变小→本质上就是求loss函数的最小值;本篇文章,我们将继续深入了解深度学习的项目流程,包括:批量化打包数据、模
  • 2024-06-13用GAN网络生成彩票号码
    1.前言生成对抗网络(GAN,GenerativeAdversarialNetwork)是由IanGoodfellow等人在2014年提出的一种深度学习模型,用于学习和生成与真实数据分布相似的数据。GAN由生成器(Generator)和判别器(Discriminator)两个部分组成,通过相互对抗的方式进行训练。生成器接受随机噪声并生成假
  • 2024-06-13用于NLP的Python:使用Keras的多标签文本LSTM神经网络分类|附代码数据
    全文下载链接:http://tecdat.cn/?p=8640在本文中,我们将看到如何开发具有多个输出的文本分类模型。我们开发一个文本分类模型,该模型可分析文本注释并预测与该注释关联的多个标签。多标签分类问题实际上是多个输出模型的子集。在本文结尾,您将能够对数据执行多标签文本分类。数据集
  • 2024-06-13matplotlib作图不显示3D图,怎么办?
    大家好,我是Python进阶者。一、前言前几天在Python白银交流群【Kim】问了一个Python作图的问题,问题如下:他不显示3D图咋办?代码如下:from sklearn.linear_model import LogisticRegressionimport numpy as npfrom matplotlib import pyplot as pltfrom mpl_toolkit