PyTorch 2.0 推理速度测试：与 TensorRT 、ONNX Runtime 进行对比

时间：2023-01-01 11:44:47浏览次数：69

标签：2.0 ONNX TensorRT PyTorch Runtime 推理

PyTorch 2.0 于 2022 年 12 月上旬在 NeurIPS 2022 上发布，它新增的 torch.compile 组件引起了广泛关注，因为该组件声称比 PyTorch 的先前版本带来更大的计算速度提升。

这对我们来说是一个好消息，训练时间改进的结果令人印象深刻。PyTorch 团队在发布新闻稿和 PyTorch GitHub 上没有提到的是 PyTorch 2.0 推理性能。所以我们来对推理的速度做一个简单的研究，这样可以了解 PyTorch 2.0 如何与其他推理加速器（如 Nvidia TensorRT 和 ONNX Runtime）是否还有差距。

我们使用 Nebuly 的开源库 Speedster 运行了一些推理测试，对于这个我们这个测试，Speedster 允许我们运行 TensorRT、ONNX Runtime，并将它们与 16 位和 8 位动态和静态量化相结合（仅用 2 行代码）。在测试期间，我们还使用 Speedster 收集有关顶级策略的性能信息，以减少推理延迟。

https://avoid.overfit.cn/post/0db857b606044b1db30210e32ca071af

标签：2.0,ONNX,TensorRT,PyTorch,Runtime,推理
From： https://www.cnblogs.com/deephub/p/17017893.html

pytorch模型onnx部署（python版本，c++版本）
转载：实践演练BERTPytorch模型转ONNX模型及预测-知乎(zhihu.com)使用bRPC和ONNXRuntime把BERT模型服务化-知乎(zhihu.com)1.安装anaconda一般有图形界面的个人电......
Chrome extension异常 chrome.runtime.sendMessage() called from a webpage must spe
UncaughtTypeError:Errorininvocationofruntime.sendMessage(optionalstringextensionId,anymessage,optionalobjectoptions,optionalfunctioncallback):......
启科量子或将开源环境部署工具Runtime
截至2022年底，启科量子已完成开源多款量子计算软件产品，包括Qutrunk、QuBranch以及QuSprout等等。开源产品的行为旨在让更多的开发者、专家学者或爱好者参与到量子技术......
Multi-Runtime多运行时架构
概念Multi-RuntimeMulti-Runtime是一种服务端架构思路，把应用里的所有中间件挪到Sidecar里，使得“业务运行时”和“技术运行时”分离开。首先来看ServiceMesh，和传统......
failed to create shim task: OCI runtime create failed
报错[root@master1coredns]#kubectl-nkube-systemdescribepodcalico-kube-controllers-798cc86c47-kz9rr.... ....Events:TypeReason......
编辑ONNX模型的python代码
参考：(8条消息)编辑ONNX模型的python代码_Alexa2077的博客-CSDN博客编辑ONNX的python代码一、ONNX模型的基本操作1，加载ONNX模型2，保存ONNX模型3，OP节点列表4，输入节点名称5，输......
环境搭建-RuntimeError: CUDA error: device-size assert triggered
报错如下图后经测试，发现是因为启用了混合精度训练，导致了这种异常。去掉混合精度训练的参数，--fp16就可以了。混合精度训练需要显卡支持，30X系列的显卡会支持，显卡......
windows上用vs2017静态编译onnxruntime-gpu CUDA cuDNN TensorRT的坎坷之路
因为工作业务需求的关系，需编译onnxruntime引入项目中使用，主项目exe是使用的vs2017+qt5.12。onnxruntime就不用介绍是啥了撒，在优化和加速AI机器学习推理和训练这块赫赫有名......
The Windows Native Ribbon Part 2: Setting Ribbon Properties at Runtime
TheWindowsNativeRibbonPart2:SettingRibbonPropertiesatRuntime Downloaddemoapp:1.27MBContentsIntroductionCommandPropertiesSetti......
NVIDIA TensorRT 安装包下载分享和基础安装
版权:本文由【墨理学AI】原创、首发、各位大佬、敬请查阅、禁止转载声明:作为全网AI领域干货最多的博主之一，❤️不负光阴不负卿❤️友情提示:关注【墨理学AI】❤️为大......

PyTorch 2.0 推理速度测试：与 TensorRT 、ONNX Runtime 进行对比

相关文章

赞助商

阅读排行