显存

2025-01-07防坑指南，搞深度学习小白必备的服务器装机知识
很多时候，我们想要跑大模型，但是实验室的算力资源有限，分到每一个同学身上就更少了，有的同学可能会选择去租赁算力，但是时间长了就不是很划算了，有时候导师会给我们一笔钱让我们去组装一台用于深度学习的服务器，那么究竟知道哪些必要知识能让我们装机的时候少被商家坑呢？首先明确一个
2025-01-03深度学习基础理论————训练加速（单/半/混合精度训练）/显存优化（gradient-checkpoint）
主要介绍单精度/半精度/混合精度训练，以及部分框架（DeepSpeed/Apex）不同精度训练单精度训练（single-precision）指的是用32位浮点数（FP32）表示所有的参数、激活值和梯度半精度训练（half-precision）指的是用16位浮点数（FP16或BF16）表示数据。（FP16是IEEE标准，BF16是一种更适合AI计算的
2025-01-02大语言模型【基础】（二）微调需要多少算力？
微调模型需要多少的GPU显存？一、模型【训练】占用显存【QWen2.5-32B为例】模型配置情况如下所示方法一：较为精确估计全量微调占用情况结论根据模型配置和假设的batchsize、序列长度：总显存需求：约388GB所需卡数：至少13张昇腾910B卡才能满足显存需求，推荐使用1
2024-12-24最新Stable Diffusion整合包安装，全新加速、解压即用、防爆显存三分钟入门
StableDiffusion出来已经很长一段时间了，网上其实已经有很多很多教程教如何安装了，但是由于网上太多的教程，也不知道哪个更好，且有的伙伴可能也是没找到合适的，也有的伙伴暂时还没找到。在StableDiffusion刚出来不久，我也尝试了多种安装方式，也有试过google、腾讯云一键安装脚本
2024-12-22一文搞懂 Google不同型号TPU显存
起因：最近在做具身智能相关的工作，看的多是google的文章，里面频繁出现类似WetrainourpoliciesonaTPUv38x8pod(64TPUv3chips)，网上没有找到很清晰地关于不同型号TPU显存大小的说明，于是自己参考前辈的文章和官方文档总结了一份，有错误希望大家及时指出。
2024-12-20深度学习模型 DeepSeek-VL2 及其消费级显卡需求分析
DeepSeek-VL2是由DeepSeek团队开发的一款先进的视觉语言模型，采用了混合专家（MoE）架构，旨在提升多模态理解能力。该模型包括三个版本：DeepSeek-VL2-Tiny、DeepSeek-VL2-Small和DeepSeek-VL2。每个版本具有不同的模型规模和计算需求，运行这些模型时对硬件的要求也有所不同，尤其
2024-12-14如何知道一个大模型在推理和训练时需要多少显存？
视频地址：https://www.youtube.com/watch?v=Z9eV9mbB6uY相关地址：https://huggingface.co/spaces/hf-accelerate/model-memory-usage详细内容：https://techdiylife.github.io/blog/topic.html?category2=t05&blogid=00312开发环境Transformers4.38.1Accelerate0.27
2024-12-13H100、L4、A6000 等 9 款 GPU 横评，告诉你哪些适合模型训练，哪些适合AI 推理
在AI领域，有两大场景对GPU的需求最大，一个是模型训练，另一个是AI推理任务。但是很多人多可能在最开始为自己的项目做GPU选型时，都很难判断哪些GPU适合做模型训练，哪些GPU更适合去做推理任务。所以我们通过这篇文章将基于GPU指标来帮助大家对比分析NVIDIA的H100、A1
2024-12-07详细介绍 NVIDIA GeForce RTX 系列，各显卡配置参数（长期更新 - 2024.12）
NVIDIAGeForceRTX系列是NVIDIA面向消费级市场的高性能GPU产品线，注重提供高性能的图形处理能力和游戏特性。主要面向游戏玩家和普通用户，同时也被广泛用于深度学习推理和训练等计算密集型任务。主要GPU产品有：50Series、40Series、30Series、20Series、10Seri
2024-11-30大模型推理和训练所占用的显存怎么估算？
大模型推理和训练所占用的显存怎么估算？原创安泰Rolling AI有温度 2024年11月14日00:00 上海AI因你而升温，记得加个星标哦！在当前开源大模型中，我们可以观察到一个普遍的现象：开源可下载模型的参数规模都集中在7B、13B、65B等特定的数值上，那这种现象背后有着怎样的原因呢
2024-11-27CUDA：out of memory的解决方法（实测有效）
一、问题概述 1.问题分析 CUDAoutofmemory问题通常发生在深度学习训练过程中，当GPU的显存不足以容纳模型、输入数据以及中间计算结果时就会触发。这个问题可能由几个因素引起：模型和数据规模：深度学习模型尤其是大型模型，如Transformer或大型CNN，拥有
2024-12-13《python基于图像的信息隐藏技术》毕业设计项目
大家好，我是俊星学长，一名在Java圈辛勤劳作的码农。今日，要和大家分享的是一款《python基于图像的信息隐藏技术》毕业设计项目。项目源码以及部署相关事宜，请联系俊星学长，文末会附上联系信息哦。
2024-12-12恶补英语初级第21天，《讨论天气变化》
对话What’stheweatherlikeinspring?It’softenwindyinMarch.It’salwayswarminAprilandMay,butitrainssometimes.What’sitlikeinsummer?It’salwayshotinJune,JulyandAugust.Thesunshineseveryday.Isitcoldorwarminautum
2024-12-09【学习笔记】树分治
点分治普通的分治在一段子段\([l,r]\)中处理和\(mid\)有关的信息然后递归处理\([l,mid)\)和\((mid,r]\)。由于中点的优秀性质这种看似暴力的做法实际复杂度是\(O(n\logn)\)的。点分治是一种把分治思想运用到树上解决问题的算法（但是其实更多人愿意称其为数据结构？）。它一
2024-12-08Thread基本功能解析
start//同步方法publicsynchronizedvoidstart(){//检查线程状态if(threadStatus!=0)thrownewIllegalThreadStateException();//添加到指定线程组，thread默认使用调用线程的线程组group.add(this);booleanstarted=fals
2024-12-04多类型房款利息还款计算API集成指南
多类型房款利息还款计算API集成指南引言随着房地产市场的不断发展，越来越多的人选择通过贷款购买房产。为了帮助购房者更好地理解和规划他们的财务支出，这个API它能够处理多种类型的贷款计算，并为用户提供详细的还款分析。快速开始注册与认证1.注册起零API服务平台（http
2024-12-04【NZH原创】UNO小游戏（Linux版）
作者第一次发代码，可能写的不太好，不喜勿喷希望大佬给点意见QWQ这是Linux版的，Window版的过几天发（转向还没写好）#include<bits/stdc++.h>#include<sys/types.h>#include<sys/wait.h>#include<iostream>#include<unistd.h>#include<stdio.h>usingnamespacestd;
2024-12-03国内npm源镜像（npm加速下载）指定npm镜像
指定npm镜像npm官方原始镜像网址是：https://registry.npmjs.org/淘宝NPM镜像：http://registry.npmmirror.com阿里云NPM镜像：https://npm.aliyun.com腾讯云NPM镜像：https://mirrors.cloud.tencent.com/npm/华为云NPM镜像：https://mirrors.huaweicloud.com/repository/npm/网
2024-12-01Ubuntu Linux用户与组的管理
UbuntuLinux操作系统-第一弹由猪猪侠开启Linux操作系统的学习文章目录前言Linux操作系统的发展Linux版本Linux用户账户及其类型超级用户系统用户普通用户Ubuntu超级用户权限与管理员Linux的超级用户权限解决方案Ubuntu管理员sudo命令su命令Ubuntu启用root登录
2024-12-01vim编辑过程中断，恢复时出现警告
1.使用vim编辑时，vim会在被编辑的目录下新建一个名为.filename.swp的隐形文件。如遇到意外情况中断vim编辑，可以利用这个隐形文件救援。2.上图为编辑vim过程中意外断开后再次编辑文件时系统给的提示，系统已列出两种主要的问题和解决方案。执行“O、E、R、D、Q、A”可进行相应的挽救
2024-12-01[2024NOIP 躺平记] 彻底反思 CSP2024
在此向退役的WEAK101高二学长致敬。CSP2024游记昨天考完了NOIP（虽然我没考），今天来机房再次沉浸在CSPT2简单小贪心没做出来的悲痛中。那么我们需要思考几个问题：为什么T2的贪心没有想出来为什么T2没想出来会导致总分只有160pts为什么这么久了仍旧沉浸在过去而不
2024-12-01Java毕设之基于Uniapp+ssm基于微信小程序的社区团购购购物商城
《[含文档+PPT+源码等]精品微信小程序基于Uniapp+ssm基于微信小程序的社区团购》该项目含有源码、文档、PPT、配套开发软件、软件安装教程、项目发布教程、包运行成功以及课程答疑与微信售后交流群、送查重系统不限次数免费查重等福利！软件开发环境及开发工具：开发语言：Java后
2024-12-01学霸带你游戏化 Bash 数组提升编程效率
数组在Bash脚本中的重要性在现代编程中，数组的灵活性和高效性使其成为处理数据的核心工具之一。尤其是在Bash脚本中，数组能够帮助开发者以简洁的方式管理和操作多个数据项。在游戏开发、系统管理等领域，数组的应用无处不在。从定义和初始化，到元素访问和操作，每一个环节都至关
2024-11-30AI编程助手（插件）
1前言基于AI大模型，在vscode等编程工具中使用一些插件能提供代码智能生成与补全、代码与思路问答、代码优化、代码解释等功能这一篇主要以阿里的通义灵码为例进行说明2通义灵码在vscode中辅助编程1文档及安装项目文档：https://help.aliyun.com/zh/lingma/product-overview/i
2024-11-25GaussDB的行存表与列存表的选择
一、前言行存表和列存表是数据库中两种常见的数据存储方式。随着信息技术的飞速发展，数据存储和管理以及如何高效地存储和处理大量的数据已经成为了我们的一大挑战。为了解决这个问题，行存表与列存表应运而生，它们以其独特的优势在各个场景得到了高效的应用。GaussDB支持行、列存储