首页 > 其他分享 >Py的Taichi模块

Py的Taichi模块

时间:2023-08-10 10:00:44浏览次数:35  
标签:uv Taichi cen Py 网格 模块 ti phase

众所周知,Python的简单和易读性是靠牺牲性能为代价的——

尤其是在计算密集的情况下,比如多重for循环。

不过现在,大佬胡渊鸣说了:

只需import 一个叫做“Taichi”的库,就可以把代码速度提升100倍

不信?

来看三个例子。

计算素数的个数,速度x120

第一个例子非常非常简单,求所有小于给定正整数N的素数。

标准答案如下:

Py的Taichi模块_Python

我们将上面的代码保存,运行。

当N为100万时,需要2.235s得到结果:

Py的Taichi模块_Python_02

现在,我们开始施魔法。

不用更改任何函数体,import“taichi”库,然后再加两个装饰器:

Py的Taichi模块_Python_03

Bingo!同样的结果只要0.363s,快了将近6倍。

Py的Taichi模块_运维开发_04

如果N=1000万,则只要0.8s;要知道,不加它可是55s,一下子又快了70倍

不止如此,我们还可以在ti.init()中加个参数变为ti.init(arch=ti.gpu) ,让taich在GPU上进行计算。

那么此时,计算所有小于1000万的素数就只耗时0.45s了,与原来的Python代码相比速度就提高了120倍

厉不厉害?

什么?你觉得这个例子太简单了,说服力不够?我们再来看一个稍微复杂一点的。

动态规划,速度x500

动态规划不用多说,作为一种优化算法,通过动态存储中间计算结果来减少计算时间。

我们以经典教材《算法导论》中的经典动态规划案例“最长公共子序列问题(LCS)”为例。

比如对于序列a = [0, 1, 0, 2, 4, 3, 1, 2, 1]和序列b = [4, 0, 1, 4, 5, 3, 1, 2],它们的LCS就是:

LCS(a, b) = [0, 1, 4, 3, 1, 2]。

用动态规划的思路计算LCS,就是先求解序列a的前i个元素和序列b的前j个元素的最长公共子序列的长度,然后逐步增加i或j的值,重复过程,得到结果。

我们用f[i, j]来指代这个子序列的长度,即LCS((prefix(a, i), prefix(b, j)。其中prefix(a, i) 表示序列a的前i个元素,即a[0], a[1], …, a[i - 1],得到如下递归关系:

Py的Taichi模块_Python_05

完整代码如下:

Py的Taichi模块_Python_06

现在,我们用Taichi来加速:

Py的Taichi模块_Python_07

结果如下:

Py的Taichi模块_运维开发_08

胡渊鸣电脑上的程序最快做到了0.9秒内完成,而换成用NumPy来实现,则需要476秒,差异达到了超500倍!

最后,我们再来一个不一样的例子。

反应 - 扩散方程,效果惊人

自然界中,总有一些动物身上长着一些看起来无序但实则并非完全随机的花纹。

Py的Taichi模块_Python_09

图灵机的发明者艾伦·图灵是第一个提出模型来描述这种现象的人。

在该模型中,两种化学物质(U和V)来模拟图案的生成。这两者之间的关系类似于猎物和捕食者,它们自行移动并有交互:

  1. 最初,U和V随机分布在一个域上;
  2. 在每个时间步,它们逐渐扩散到邻近空间;
  3. 当U和V相遇时,一部分U被V吞噬。因此,V的浓度增加;
  4. 为了避免U被V根除,我们在每个时间步添加一定百分比 (f) 的U并删除一定百分比 (k) 的V。

上面这个过程被概述为“反应-扩散方程”:

Py的Taichi模块_Python_10

其中有四个关键参数:Du(U的扩散速度),Dv(V的扩散速度),f(feed的缩写,控制U的加入)和k(kill的缩写,控制V的去除)。

如果Taichi中实现这个方程,首先创建网格来表示域,用vec2表示每个网格中U, V的浓度值。

拉普拉斯算子数值的计算需要访问相邻网格。为了避免在同一循环中更新和读取数据,我们应该创建两个形状相同的网格W×H×2。

每次从一个网格访问数据时,我们将更新的数据写入另一个网格,然后切换下一个网格。那么数据结构设计就是这样:


一开始,我们将U在网格中的浓度设置为 1,并将V放置在50个随机选择的位置:

Py的Taichi模块_Linux运维_11

那么实际计算就可以用不到10行代码完成:

@ti.kernel
def compute(phase: int):
    for i, j in ti.ndrange(W, H):
        cen = uv[phase, i, j]
        lapl = uv[phase, i + 1, j] + uv[phase, i, j + 1] + uv[phase, i - 1, j] + uv[phase, i, j - 1] - 4.0 * cen
        du = Du * lapl[0] - cen[0] * cen[1] * cen[1] + feed * (1 - cen[0])
        dv = Dv * lapl[1] + cen[0] * cen[1] * cen[1] - (feed + kill) * cen[1]
        val = cen + 0.5 * tm.vec2(du, dv)
        uv[1 - phase, i, j] = val

在这里,我们使用整数相位(0或1)来控制我们从哪个网格读取数据。

最后一步就是根据V的浓度对结果进行染色,就可以得到这样一个效果惊人的图案

Py的Taichi模块_Linux运维_12

有趣的是,胡渊鸣介绍,即使V的初始浓度是随机设置的,但每次都可以得到相似的结果。

而且和只能达到30fps左右的Numba实现比起来,Taichi实现由于可以选择GPU作为后端,轻松超过了 300fps。

pip install即可安装

看完上面三个例子,你这下相信了吧?

其实,Taichi就是一个嵌入在Python中的DSL(动态脚本语言),它通过自己的编译器将被 @ti.kernel 装饰的函数编译到各种硬件上,包括CPU和GPU,然后进行高性能计算。

有了它,你无需再羡慕C++/CUDA的性能。

正如其名,Taichi就出自太极图形胡渊鸣的团队,现在你只需要用pip install就能安装这个库,并与其他Python库进行交互,包括NumPy、Matplotlib和PyTorch等等。

标签:uv,Taichi,cen,Py,网格,模块,ti,phase
From: https://blog.51cto.com/jowin/7031265

相关文章

  • PHP提薪模块
    在使用es搜索的时候需要注意以下这几点文档(Document)与索引(Index):在ES中,文档是最小的数据单元,类似于数据库中的一行记录。文档组织在索引中,索引类似于数据库中的表。了解如何创建索引和插入文档是基本的操作。分布式架构:ES是分布式的,数据被分片存储在不同的节点上。学习节点之间......
  • 【OpenAI】Python: 基于 Gym-CarRacing 的自动驾驶项目(2)| 车道检测功能的实现 | 边缘
        猛戳,跟哥们一起玩蛇啊! ......
  • 智能空调解决方案:8266+红外控制模块
    前言炎炎夏日,你是否有这样的困惑:睡觉时,并不觉得热,然而后半夜被热醒,然后在极其不爽的情绪下,开启空调继续谁?睡觉时,空调温度刚刚好,然而后半夜下雨了,被冻醒?看完我们今天的内容,我相信以上两个问题都能被解决,而且方法绝对简单,好了,废话少说,让我们直接开始吧。智能空调解决方案准......
  • numpy-常用函数总结
    numpy-常用函数总结目录numpy-常用函数总结1.Axis理解1.1Axis维度1.2三维及多维数组1.3总结2.创建数组2.1使用np.array创建2.2使用np.arange创建2.3np.random.random2.4np.random.randint2.5特殊函数2.5.1np.zeros2.5.2np.ones2.5.3np.full2.5.4np.eye2.6.注意3.......
  • opencv-python 图像修复
    opencv中的图像修复很简单,用相邻像素替换这些坏标记,使其看起来跟周围颜色一样。图像修复函数是:inpaint(src,inpaintmask,inpaintradius,flags)参数说明:inpaintmask:图像掩码,单通道图像,大小和原图像一致,inpaintmask图像上除了需要修复的部分,其他地方全是0。inpaintradius:每个点......
  • 利用Python批量替换多个word文档中的指定
    需求最近有一个项目方案,涉及到2000多个文档。之前公司有相关案例,但是需要将2000多个文档中的特殊名称改成现有项目,单独操作需要打开每个文档区搜索替换,费事费力。通过python中对文档的操作进行批量替换。方案思路1.获取所有需要替换的word文件路径defgetdocreplace(path):......
  • Python基础知识总结
     前言     本总结所观看视频如下:变量,数字,字符串,注释_哔哩哔哩_bilibili【Python】3小时不挂_哔哩哔哩_bilibili目录前言一、基本命令 二、基本计算语句 三、字符串操作 四、官方文档的使用五、列表与元组 六、字典 七、集合 八、值类型变量与引用类型变量 九、pr......
  • 外设移除区别/终端记录/重设密码/python测试/数据拷贝最大限度
    1.1【卸载】【弹出】【安全移除驱动器】区别【卸载】只是解除挂载(可以直接重新挂载)【弹出】弹出读卡器里面的存储卡(需要重新插入存储卡)【安全移除驱动器】断掉设备电源,移除设备(需要重新插入设备)1.2记录你的终端操作──script   (点击详细)如果过程不是很长,一屏以内的话一......
  • python虚拟环境
    为不同的项目创建隔离的Python虚拟环境来帮助保持不同项目所需的依赖关系。1.什么是Python环境系统环境变量PATH,当我们在命令行中运行程序时,系统会根据PATH配置的路径列表依次查寻是否有可执行文件python如果在所有路径列表中都查找不到,就会报报错:'python'不是内部或外部命令,也......
  • opencv-python 单应性矩阵的应用
    单应性(Homography)变换:可以简单的理解为它用来描述物体在世界坐标系和像素坐标系之间的位置映射关系。对应的变换矩阵称为单应性矩阵。单应性矩阵在 图像校正、图像拼接、相机位姿估计、视觉SLAM等都有应用。单应性矩阵主要涉及两个函数:1  findHomography(srcPoints,dstPoin......