今天抽空测试了一下3403跑yolov8的速度,源码还没改完,后处理还是先用CPU来跑了,这样速度会拖慢一点,先看看效果。
实际用的是4T算力的,里面是有两个NPU,一个叫SVP_NNN,一个叫NNN,用的方式还不一样,分别用SVP_ACL接口和ACL接口。我是没有时间去研究ACL,用的SVP_ACL的方式 。
下面是对比。引擎2就是SVP_NNN。有用过NNN的可以交流交流,感觉像是从昇腾里抠出来的一块塞进去的。
纯用SVP_NNN,后处理CPU运行的速度结果如下。
SD3403/SS928 | min耗时 | max耗时 | 主要分布 | 平均耗时 |
yolov8s | 22.5ms | 28.96ms | 22.7~23.5ms | 23ms |
并没有比hi3519dv500快多少,后处理部分花点时间改完再试试吧。
还是有空间提升。
标签:NNN,SS928,ACL,ms,yolov8,SD3403,SVP From: https://blog.csdn.net/kwdx2/article/details/139779262