• 2024-11-19YOLO11:TensorRT模型加速与部署
    视频链接:YOLO11:TensorRT模型加速与部署_哔哩哔哩_bilibili《YOLO11:TensorRT模型加速与部署》课程致力于帮助学生实战YOLO11目标检测算法的TensorRT加速部署。常心老师将手把手带领大家从0开始搭建YOLO11-TensorRT环境,带领大家排坑、避坑、填坑。本课程将进行环境搭建、模型转
  • 2024-11-13Serverless GPU:助力 AI 推理加速
    本文整理自2024云栖大会,阿里云智能集团高级技术专家聂大鹏、NVIDIA解决方案架构师金国强演讲议题《ServerlessGPU:助力AI推理加速》近年来,AI技术发展迅猛,企业纷纷寻求将AI能力转化为商业价值,然而,在部署AI模型推理服务时,却遭遇成本高昂、弹性不足及运维复杂等挑战。本文
  • 2024-11-09使用 PyTorch 实现并测试 AlexNet 模型,并使用 TensorRT 进行推理加速
    本篇文章详细介绍了如何使用PyTorch实现经典卷积神经网络AlexNet,并利用Fashion-MNIST数据集进行训练与测试。在训练完成后,通过TensorRT进行推理加速,以提升模型的推理效率。本文全部代码链接:全部代码下载环境配置为了保证代码在GPU环境下顺利运行,我们将安装兼容
  • 2024-11-09RT DETR v2 TensorRT C++ 部署详解
    RT-DETRv2TensorRTC++部署详解概述随着深度学习技术的发展,目标检测算法在各种应用场景下展现出了卓越的表现。RT-DETRv2(Real-TimeDetectionTransformerv2)作为一款高效的实时目标检测模型,其结合了Transformer架构的优势与传统卷积神经网络(CNNs)的速度,为开发者提供了在
  • 2024-09-25阿里云函数计算 x NVIDIA 加速企业 AI 应用落地
    前言阿里云函数计算(FunctionCompute,FC)是一种无服务器(Serverless)计算服务,允许用户在无需管理底层基础设施的情况下,直接运行代码。与传统的计算架构相比,函数计算具有高灵活性和弹性扩展的特点,用户只需专注于业务逻辑的开发,系统自动处理计算资源的分配、扩展和维护。同时,函数计算
  • 2024-09-24阿里云函数计算 x NVIDIA 加速企业 AI 应用落地
    作者:付宇轩前言阿里云函数计算(FunctionCompute,FC)是一种无服务器(Serverless)计算服务,允许用户在无需管理底层基础设施的情况下,直接运行代码。与传统的计算架构相比,函数计算具有高灵活性和弹性扩展的特点,用户只需专注于业务逻辑的开发,系统自动处理计算资源的分配、扩展和维护。
  • 2024-09-18YOLOV8 det 多batch TensorRT 推理(python )
    由于我当前的项目需求是推理四张,所以,demo部分也是基于4张进行演示的,不过基于此套路,可以实现NCHW的任意尺度推理,推理代码如下:importnumpyasnpfromnumpyimportndarrayfromtypingimportList,Tuple,UnionfrommodelsimportTRTModule#isort:skipimportar
  • 2024-09-05TensorRT量化模型分析(耗时分布可视化等)
    文章目录TensorRT量化模型分析一背景二准备工作1.代码准备2.依赖环境三分析过程1.导出模型2.模型形态比对3.转tensorrt序列化文件4.tensorrt序列化文件(即tensorrt模型)分析四其他TIPSTensorRT量化模型分析一背景​在TensorRT模型量化
  • 2024-08-10以DenseNet为例进行AI算法部署集成
    以DenseNet为例进行AI算法部署集成AI越用越广,但落地使用的时候各种bug多多,这里提供一些离线集成的导引方便大家学习,后面也会尝试更新一些webapi的集成方式,请期待后续的博客简单性能表格下列表格为一些简单的部署数据搜集,通过部署器进行离线集成,可以看到可以大大降低资源
  • 2024-07-28解决yolo使用engine模型推理报错AttributeError: “NoneType’cbject has no attribute ‘create_execution_context‘
    目录起因分析两种解决方案方法一:卸载生产服务器的tensorrt,下载与训练服务器相同版本方法二:将训练服务器训练的pt模型下载出来到生产服务器导出起因在做yolo模型训练时使用了训练服务器,训练结束把模型转换成了.engine模型,在训练服务器上可以正常使用,但把模型放到生成服
  • 2024-07-25将 PyTorch ONNX 模型转换为 TensorRT 引擎 - Jetson Orin Nano
    我正在尝试从JetsonOrinNano上的ViT-B/32UNICOM存储库转换VisionTransformer模型。该模型的VisionTransformer类和源代码在此处我使用以下代码将模型转换为ONNX:importtorchimportonnximportonnxruntimefromunicom.vision_trans
  • 2024-07-16Win10+Docker配置TensorRT环境
    1.Docker下载和安装        Docker下载:InstallDockerDesktoponWindows          Docker安装:勾选直接下一步就行,安装完成后需要电脑重启。         重启后,选择Accept—>Continuewithoutsigningin—>skipsurvey.         可
  • 2024-07-15模型部署 - TensorRT - NVIDIA 讲 TensorRT - 8.6.1版本 - 性能优化
                                                   
  • 2024-07-14模型部署 - TensorRT - NVIDIA 讲 TensorRT - 8.6.1版本 - 高级话题
                                
  • 2024-07-14模型部署 - TensorRT - NVIDIA 讲 TensorRT - 8.6.1版本 -Plugin
                          
  • 2024-07-14模型部署 - TensorRT - NVIDIA 讲 TensorRT - 8.6.1版本 - 5种工具
                                          
  • 2024-07-14模型部署 - TensorRT - NVIDIA 讲 TensorRT - 8.6.1版本
                                           
  • 2024-07-14Tensor-LLM简单介绍
    最近体验了一下英伟达的TensorRT-LLM的最新版本,写个简单介绍,给大家参考。TensorRT-LLM是专门用于大语言模型推理和部署的产品,同类型产品还有来自UC-Berkley的vLLM,上海人工实验室的LMDeploy,英特尔的OpenVINO。英特尔的OpenVINO,可以查看我另一篇文章:如何使用OpenVINO进行A
  • 2024-07-13模型部署 - TensorRT - C++版本与Python版本应如何选择
    从性能角度来看,TensorRTC++版本和Python版本之间确实存在一些差异:C++版本性能更优:TensorRTC++版本使用了更底层的API,可以更好地利用硬件特性,进行更深层的优化。C++版本在内存管理、CPU-GPU数据传输等方面更加高效,这些都可以带来更好的推理性能。Python版本更易
  • 2024-07-13模型部署 - TensorRT & Triton 学习
    先介绍TensorRT、Triton的关系和区别:TensorRT:为inference(推理)为生,是NVIDIA研发的一款针对深度学习模型在GPU上的计算,显著提高GPU上的模型推理性能。即一种专门针对高性能推理的模型框架,也可以解析其他框架的模型如tensorflow、torch。主要优化手段如下: Triton:类似于TensorFlo
  • 2024-07-13模型部署 - TensorRT 简介及人脸推理简单示例
       TensorRT是Nvidia开发的一个高性能深度学习推理引擎。它主要用于优化和部署已经训练好的深度学习模型,提高模型在NVIDIAGPU硬件上的推理性能。 TensorRT的主要功能和特点包括:  1.模型优化    TensorRT提供了一系列优化技术,包括层融合,张量格式化,kern
  • 2024-07-13模型部署 - TensorRT、OpenVINO 和 triton 之间的关系
    1.共同目标-深度学习模型部署优化   这三者都是用于优化和部署深度学习模型的工具和框架,目标是提高模型在服务端的推理性能。2.技术侧重点不同TensorRT侧重于针对NvidiaGPU硬件进行深度学习模型的优化与加速。OpenVINO则针对InterCPU和FPGA等硬件进行模拟优化。
  • 2024-07-11【ZhangQian AI模型部署】目标检测、SAM、3D目标检测、旋转目标检测、人脸检测、检测分割、关键点、分割、深度估计、车牌识别、车道线识别
    目标检测【yolov10部署rknn、地平线、tensorRT、C++】【yoloworld部署rknn、地平线、tensorRT、C++】【yolov9部署rknn、地平线、tensorRT、C++】【yolov8部署rknn、地平线、tensorRT、C++】【yolov7部署rknn、地平线、tensorRT】【yolov6部署rknn、地平
  • 2024-07-07autoware.universe源码略读(3.4)--perception:tensorrt_yolox
    autoware.universe源码略读3.4--perception:tensorrt_yoloxOverview结构体预定义TrtYoloXpreprocessdoInferencefeedforwardfeedforwardAndDecodedecodeOutputstensorrt_yolox_nodeyolox_single_image_inference_node总结Overview可以看到,其实在最新版本的autoware
  • 2024-06-23四. TensorRT模型部署优化-quantization(calibration)
    目录前言0.简述1.校准2.calibrationdataset3.calibrationalgorithm4.如何选择calibrationalgorithm5.calibrationdataset与batchsize的关系总结参考前言自动驾驶之心推出的《CUDA与TensorRT部署实战课程》,链接。记录下个人学习笔记,仅供自己参考本次课