首页 > 其他分享 >[Contest]2022 sti2百度搜索首届技术创新挑战赛赛道二比赛复盘总结

[Contest]2022 sti2百度搜索首届技术创新挑战赛赛道二比赛复盘总结

时间:2022-12-26 00:11:15浏览次数:33  
标签:赛道 比赛 Contest onnx 2022 消融 sti2 复盘

2022 sti2 比赛复盘总结

前期进行了PaddleInference的配置探索,后期经过了Paddleslim的transformer裁剪+蒸馏的策略上分。
侥幸进入了决赛,感觉还是偏运气,感觉自己在比赛技术上还是没有太多长进。

比赛中遇到的问题

  1. 每次提交需要清楚地记录,提交的配置是什么,对应的得分是什么,以便后面进行比赛复盘和消融实验,最好用git做版本控制。

  2. 需要有一个清晰的计划,有一个好的节奏。先有一个清晰的baseline,然后想想这个baseline可以从那些角度进行优化,要总体把控那些可行那些不可行,不熟悉的领域要把控好节奏,比如2-3天还没啥进展,那就可以暂时先放一放想想其他方法。本次就是在PaddleInference的编译上硬磕了太久,但是对比赛的帮助也没有很大。其次是在onnx上探索,没想明白onnx是将embedding算子拆开来算的,所以怎么优化onnx都不会比Paddle模型更好,前期陷入到这个坑里,后面跟一大哥聊也印证了这个事情。

  3. 多去八一八前面比赛的代码,前面其实有NVIDIA Hackthon的比赛开源方案,本次比赛也是有很多前一个比赛大佬,类似的方案会比直接开脑洞靠谱的多。

  4. 不能有畏难情绪,后半场一直想去手写custom kernel,但畏难+偷懒+拖延就一直没进行下去,其实也不难猜测,有些上分点都能想到,和别人的差距就是人家真实去认真做了而且做的很完备,在细节上就会立马体现出来。

答辩中遇到的问题

  1. 被问及到怎么做的消融实验?

其实有一点关于PadlleInference的消融时间,PPT也把每个配置有效的提分点给讲了出来,有两方面的原因需要改进,一是确实懒没有做太多消融实验,没货可讲。二是下次画的时候可以使用折线图,这样表现更清晰一些。

  1. 被问到模型的加速比是什么?

后续有性能比赛、精度比赛,应该把每次关键点,比如精度提升百分多少,性能提升给测一下,这样拿出去也好看。

  1. PPT准备的不太充分,很快就讲完了,后面陷入了专家没话可问的状态

尽量有一个win或mac的机器,wps下做ppt word之类的还是不太行。

后续技术上需要提升的点

  1. FasterTransformer

加速思想是了解了,重点看看怎么用起来,以及怎么适配到一个新的类似的模型上

  1. trt8的手写custom kernel

这部分要撸代码了,前期也看了TensorrtX的一些代码,不能再偷懒只看不写了。

  1. Nsight profile工具的使用

还是不会性能分析,这类比赛的一个特点就是,你得准确地知道哪里是瓶颈,那部分还有性能提升,要不然以后碰到类似的比赛还是瞎打。

  1. 模型压缩

复杂模型的压缩还是不太熟练,虽然前期熟悉了一些但还不够,没法一次调通,后续考虑写写相关的博客练练手。

标签:赛道,比赛,Contest,onnx,2022,消融,sti2,复盘
From: https://www.cnblogs.com/wildkid1024/p/17004873.html

相关文章

  • 考研数学练习题-2022年12月25日
    数量:10......
  • the fourth—2022.12.25
    整数(int):计算机以二进制储存整数 在8字节中00000111=716位的int的取值范围-32768~32767,当大于取值范围时,会从取值范围的第一个重新开始取值。即输入32768,则会输出-32768......
  • 20221414徐鹿鸣的实验八-Web部署
    过程与老师博客基本相同。(之前卡崩了导致没截图)遇到的问题和解决过程1.如何退出MariaDBexit2.如何退出编辑Apache的配置文件以nano开头编辑文件的,则要退出,按【Ctr......
  • 20221321杨渝第八次试验
    实验配置实验相关知识背景LAMP是指一组通常一起使用来运行动态网站或者服务器的自由软件名称首字母缩写:Linux,操作系统,openEuler就是一种Linux发行版Apache,Web服务器......
  • 2022~2023
    新年快乐  我用什么才能留住你?  我给你贫穷的街道、绝望的日落、破败郊区的月亮。  我给你一个久久地望着孤月的人的悲哀。——博尔赫斯   ......
  • 游记 | 20221225 · 赤霞广场 · 五龙潭
    这是一个意识流的游记草稿,写的全是些random东西。等我稍微有时间,再整理成能看的样子吧。记于壬寅年壬子月壬子日,圣诞节。——·——回到家后我复盘:本次出游的动......
  • 2022.12.18 ~ 2022.12.24 一周学习记录
    2022.12.18模拟退火学习模拟退火是一种常用的随机化算法,当答案是一个连续的函数时,我们就可以考虑用模拟退火进行求解。注意调参数(看rp)伪代码:voidSA()//模拟退火{......
  • AtCoder Beginner Contest 283(A~F)
    Aa,b=map(int,input().split())print(pow(a,b))Bn=int(input())a=list(map(int,input().split()))q=int(input())foriinrange(q):op=list(map(int,input()......
  • C++面向对象程序设计实训(实习)[2022-12-25]
    C++面向对象程序设计实训(实习)[2022-12-25]面向对象程序设计实训(实习)PracticalTrainingofObject-OrientedProgramming1、实习基本要求(1)学生自由组1人小组按照以下要......
  • AT_joi2022_yo1a_d 箱と鍵 (Boxes and Keys) 题解
    题目传送门题目大意给定一个长度为\(n\)的数组\(a\)和一个长度为\(m\)的数组\(b\),求\(a\)中有多少个数在\(b\)中出现过。解题思路数据比较小,可以直接暴力:......