trt
  • 2024-09-08TensorRT-For-YOLO-Series项目:实现yolov10模型的python-tensorrt推理(对比int8与fp16推理差异)
    项目地址:https://github.com/Linaom1214/TensorRT-For-YOLO-Series/tree/cuda-python算法支持状态:2024.6.16SupportYOLOv9,YOLOv10,changingtheTensorRTversionto10.02023.8.15Supportcuda-python2023.5.12Update2023.1.7supportYOLOv82022.11.29fixs
  • 2024-07-25量化基本知识点梳理-三种量化方式和量化框架以及trt
    这一文档介绍些基础概念吧,权当做一个阶段整理,后面也会慢慢完善。1.量化分类:根据谷歌量化白皮书中定义,分为PTQ和QAT两种,而PTQ又包括两种。3种量化方式:QAT,PTQDynamic,PTQStatic。1)量化感知训练(QuantAwareTraining,QAT):量化训练让模型感知量化运算对模型精度带来的
  • 2024-07-23__yolov5+deepsort+slowfast win部署
     运行程序报错:yolov5_trt_create...yolov5_trt_createcudaengine...yolov5_trt_createbuffer...yolov5_trt_createstream...yolov5_trt_createdone...createyolov5-trt,instance=000001AFB3B05EC0[07/19/2024-21:23:10][E][TRT]1:[stdArchiveRea
  • 2024-06-17AI模型-模型部署和推理
    模型部署模型部署是将训练好的模型部署到运行环境中进行推理的过程,模型部署的过程中需要解决训练模型到推理模型的转换,硬件资源对模型的限制,模型推理的时延、功耗、内存占用等指标对整个系统的影响以及模型的安全等一系列的问题模型部署到运行环境以后,保护模型
  • 2024-03-26塔尔科技 TRT
    塔尔科技,这个名字蕴含着丰富的美好含义和寓意。塔尔羊是一种生活在极端环境下的野生动物,展现出顽强的生存能力和适应力,这象征着我们公司的创立精神:在竞争激烈的科技领域中,我们拥有着不屈不挠的创新精神和坚韧不拔的活力。同时,塔尔羊通常是成群结队生活的动物,这象征着我们注重团队
  • 2023-11-10polygraphy介绍
    Polygraphy目录Polygraphy工具说明依赖&安装功能&Toolsrunloggingrunnermodelonnxtensorrtdataloadercomparator使用示例convertdebuginspectsurgeonruncomparisonmetricsgenerating_comparison_scriptcomparing_onnx&engine1comparing_onnx&engine2comparing_onnx&eng
  • 2023-10-09ControlNet-trt优化总结4:onnx图修改与重建
    ControlNet-trt优化总结4:onnx图修改与重建在这一节中,主要总结网络层面的优化,针对于算子插件优化,主要聚焦于以下几点:修改onnx图,添加不支持的算子插件增加前后处理部分,前后处理导出为onnx图onnx图surgeon原有的graph中存在大量的GN操作,正常fp32的时候没有问题,但是当使用fp16
  • 2023-10-08ControlNet-trt优化总结3:使用multi-stream和cuda-graph构建并行流水线
    ControlNet-trt优化总结3:使用multi-stream和cuda-graph构建并行流水线上节谈到使用TRT-API来构建网络,在这一节中总结一些trick来提升模型的运行效率,这些trick在所有的trt优化中均可使用,主要有以下几点:使用cuda_graph减少kernel间的启动间隙使用Mutil-stream增加异步cuda_gra
  • 2023-10-07ControlNet-trt优化总结2:使用TRT-API从零构建ControlNet网络
    ControlNet-trt优化总结2:使用TRT-API从零构建ControlNet网络在上节讲到,可以通过手动搭建trt网络的方式来重新构造controlnet网络,这样可以避免onnx中间转换过程中的精度损失,也可避免onnx中间转化时的算子被拆解的细碎的情况,对于不支持的算子,也可通过添加插件的方式添加不支持的算
  • 2023-04-21无代码调整聚类热图分支顺序
    聚类热图根据不同的聚类算法和距离计算方式,获得的热图分支结构会有一些不同。有时,我们也希望能在不改变分支结构的基础上,对热图分支的顺序进行一些调整,这就是推文聚类热图怎么按自己的意愿调整分支的顺序?的出发点。现在这个功能也搬到了BIC平台,具体怎么做呢?采用之前的绘图数据采用
  • 2023-03-21【Unity3D】卷轴特效
    1原理​当一个圆在地面上沿直线匀速滚动时,圆上固定点的运动轨迹称为旋轮线(或摆线、圆滚线)。本文实现的卷轴特效使用了旋轮线相关理论。​以下是卷轴特效原理及
  • 2023-02-17onvif规范的实现:成功实现ONVIF协议RTSP-Video-Stream与OnvifDeviceManager的视频对接
    onvif规范的实现:成功实现ONVIF协议RTSP-Video-Stream与OnvifDeviceManager的视频对接.有了前几篇的基础,现在可以正式开始onvif的实现工作,其中一项非常重要的部分就是视频
  • 2022-10-08VideoPipe可视化视频结构化框架开源了!
    完成多路视频并行接入、解码、多级推理、结构化数据分析、上报、编码推流等过程,插件式/pipe式编程风格,功能上类似英伟达的deepstream和华为的mxvision,但底层核心不依赖复
  • 2022-08-20深度学习 之 模型部署【2】-TensorRT 入门
    TensorRT简介TensorRT是英伟达公司根据自己的硬件设备面向AI工作者推出的一种模型部署方案;同时可以对网络进行压缩、优化,它通过combineslayers、kernel优