首页 > 其他分享 >升级到PyTorch 2.0的技巧总结

升级到PyTorch 2.0的技巧总结

时间:2023-05-23 10:57:56浏览次数:49  
标签:技巧 torch compile 编译 PyTorch API 2.0

PyTorch 2.0 发布也有一段时间了,大家是不是已经开始用了呢? PyTorch 2.0 通过引入 torch.compile,可以显着提高训练和推理速度。 与 eagerly 模式相反,编译 API 将模型转换为中间计算图(FX graph),然后以某种方式将其编译为低级计算内核,这样可以提高运行速度。

对于PyTorch 2.0 而言,你看到的可能是:

“只是用 torch.compile 调用包装它们就可以提高运行速度”

但是其实有许多因素会干扰计算图编译和/或达到所需的性能改进。 所以需要调整模型和达到最佳性能可能需要重新设计项目或修改一些编码习惯。

在本文中,我们将演示这个新功能的使用,以及介绍在使用它时可能遇到的一些问题。 我们将分享在调整 torch.compile API 时遇到的问题的几个例子。这些例子并不全面,再实际运用是很可能会遇到此处未提及的问题,并且还要 torch.compile 仍在积极开发中,还有改进的空间。

Torch 编译背后有许多创新技术,包括 TorchDynamo、FX Graph、TorchInductor、Triton 等。 我们不会在这篇文章中深入探讨不同的组件,如果你对这些感兴趣,可以查看PyTorch 文档,里面介绍的非常详细。

https://avoid.overfit.cn/post/dfea563957fc43a19f1aaf7733888031

标签:技巧,torch,compile,编译,PyTorch,API,2.0
From: https://www.cnblogs.com/deephub/p/17422633.html

相关文章

  • Xcode 使用技巧 —— 快捷键
    Command+Click跳源码,Option+Click显示帮助Command+Enter显示代码提示注:需要移除所有冲突的旧快捷键showeditoronlyshift+BackSpace删除当前行shift+Enter换行编辑这个文件,添加下面几行,用于添加快捷指令sudovim/Applications/Xcode.app/Con......
  • python 问题修复ImportError: urllib3 v2.0 only supports OpenSSL 1.1.1+
    目录python问题修复ImportError:urllib3v2.0onlysupportsOpenSSL1.1.1+升级openssl版本降低urllib版本python问题修复ImportError:urllib3v2.0onlysupportsOpenSSL1.1.1+这个问题时python版本安装的urllib3版本过高,而openssl版本太低导致的解决无非两种方法,降低......
  • idea中jdk11用maven编译失败 Fatal error compiling: tools.jar not found: XX\Java
    ideamaven编译需要用到jdk的lib包里面的tools.jar文件,但是jdk1.8之后就没有tools.jar了。我这里用的是graalvm的jdk11,编译一直报错,网上也查不到。解决办法: 根据对应路径创建一个lib包,并把jdk1.8的lib下面的tools.jar复制一个放到这个包下面,让这个路径有这个包就行了。我......
  • 记录--九个超级好用的 Javascript 技巧
    这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助前言在实际的开发工作过程中,积累了一些常见又超级好用的Javascript技巧和代码片段,包括整理的其他大神的JS使用技巧,今天筛选了9个,以供大家参考。1、动态加载JS文件在一些特殊的场景下,特别是一些库和框架......
  • API技巧集(一)
    一、拖动无标题窗体:包含头文件:#include$#@60;winuser.h$#@62;在窗体或组件的OnMouseDown事件中加入以下代码:if(Button==mbLeft){ReleaseCapture();SendMessage(Handle,WM_NCLBUTTONDOWN,HTCAPTION,0);}二、弹出和关闭光驱:包含头文件:#include$#@60;mmsystem.......
  • PotPlayer使用技巧
    PotPlayer是一款强大的本地视频播放器,可以实现逐帧播放,显示/隐藏字幕,快捷键截图,视频旋转,音频/视频滤镜,硬件解码,多窗口同时播放,等功能。1.基本设置(1)取消以关键帧为移动单位取消右键-->播放-->定位-->以关键帧定位有些版本设置路径变为:右键-->播放-->时间跨度--......
  • API技巧集(二)
    (一)不规则窗口Windows提供的只是标准的矩形窗口,要想建立一个不规则的窗口就需要调用API函数来实现。建立一个不规则的窗口,一般是先用创建区域的API函数建立一个不规则的区域,再用API函数SetWindowRgn改变窗口的区域。这些API函数在C++Builder中包含在头文件wingdi.h和winuser.......
  • < Python全景系列-3 > Python控制流程盘点及高级用法、神秘技巧大揭秘!
    欢迎来到我们的系列博客《Python全景系列》!在这个系列中,我们将带领你从Python的基础知识开始,一步步深入到高级话题,帮助你掌握这门强大而灵活的编程语法。无论你是编程新手,还是有一定基础的开发者,这个系列都将提供你需要的知识和技能。这是系列第三篇,在这篇文章中我们将全面深入地......
  • 人像摄影的美姿和构图技巧
    2007年07月31日星期二下午09:242007年07月09日星期一17:351:“美姿”应该注意技巧(一)对于相貌较难看者,应当尽量避免拍摄特写和近照。(二)对于脸型较胖者,可以适当采用头纱手或者其他小饰物来遮挡,同时也可以提高相机机位。(三)大小眼睛的拍摄,应该调整被......
  • ABAP DEBUG技巧(持续更新)
    1.根据消息号查找WatchPoint  2.updatetast需要打开调试器的更新模式断点有时候打开也进不去需要watchpoint强制打进去函数或者程序的断点 执行程序前/H 打一个函数断点再执行update的函数 ......