首页 > 其他分享 >关于使用gpu解码图片的一些想法

关于使用gpu解码图片的一些想法

时间:2023-01-11 19:12:33浏览次数:31  
标签:解码 想法 使用 gpu 拷贝到 cpu 图片

最近在使用gpu解码数据,数据是base64编码的图片,或者是二进制编码的图片

以前都是使用cpu进行解码,也导致cpu使用率比较高

使用gpu解码以后存在的问题就是:以yolov5为例,使用pgu解码以后,解码线程为4,显存增加了800M,这也太多了,也导致我一张显卡可以开的实例数变少了,整体单卡速度反而下降了,

而且使用gpu解码以后,后面环节的优化没有跟上,导致整体流程变成了:接收数据到cpu上-cpu拷贝到gpu上-gpu解码-解码数据拷贝到cpu上-cpu预处理resize等操作-拷贝到gpu上-推理-后处理,整个过程多了两次数据拷贝,整体耗时就拉跨了,毕竟数据拷贝是最耗时的。后面应该优化把解码后的环节全部放到gpu上操作,这样才能真正提高速度。

标签:解码,想法,使用,gpu,拷贝到,cpu,图片
From: https://www.cnblogs.com/chentiao/p/17044687.html

相关文章

  • 琐碎的想法(五)for 的前世今生
    for起因记得大学上C语言的课,第一次遇到的问题就是循环结构里面的for。选择结构的if非常易懂,和日常生活的判断没有区别。循环结构的while同样比较好理解。本质上......
  • 【记录】一些想法
    有人总说,阴暗的社会才是真相,对人的冷漠才是理智。仔细想想,这可能吗?这不就是在说,人类迄今为止的道德都是废话,都是一些应该丢进垃圾桶的糟粕。但是,历史证明,道德在不断发展,人......
  • Pytorch GPU 环境搭建
    之前⼀直使⽤Tensorflow训练模型,第⼀次训练Pytorch模型的时候,发现速度很慢,仔细观察,发现GPU内存占⽤为0,基本没有使⽤GPU。AssertionError:CUDAunavailable,invaliddev......
  • 394. 字符串解码
    问题链接https://leetcode.cn/problems/decode-string/description/解题思路这题一看就是个典型的递归题目,典型的递归函数的定义就是递归函数的解。我们首先定义递归函......
  • GPU笔记
    图形流水线内存里面专门开了一块空间用来存储即将显示到显示器上的【像素】们。用你家显示器分辨率乘积的结果就可以算出你家的显示器可以显示多少个像素。每个像素用RGB2......
  • [H264编解码] 第一章 NAL Unit 解析部分
    包装类型:AnnexB和avcCAnnexBAnnexB格式的原理非常简单,就是在一个NALU前面加上三个或者四个字节,这些字节的内容是0001或者001。当我们读取一个H264流的时......
  • YOLOv5多GPU训练
    一、准备安装yolov5依赖,要求Python>=3.8以及PyTorch>=1.7gitclonehttps://github.com/ultralytics/yolov5#clonerepocdyolov5pipinstall-rrequirements.txt123二......
  • pytorch中查看gpu信息、选择使用gpu(转)
    转自:https://blog.csdn.net/pearl8899/article/details/109503803pytorch中查看gpu信息、选择使用gpu前提:安装好Python3.6+,torch(GPU),登录一台开发机。一、GPU基本信息......
  • CVPR2023审稿的经验和想法
    今年CVPR邀请我审稿,共审了4篇。拿到一篇稿子,第一遍,我首先粗略看一下这篇论文的motivation(有时候是assumption)是否牢靠;模型的技术创新怎么样;模型性能怎么样。如果......
  • 采用faiss-gpu实现比Sklearn中K紧邻分类器(K-NN)100倍以上加速
    最近使用sklearn跑一些机器学习的实验对比,发现许多算法随着数据集增大,训练时间呈几何增加,加之交叉验证、参数选择等,非常耗时。对此,已经有许多优化方案被提出。这里给出一......