首页 > 其他分享 >模型部署_模型量化、优化、编译、仿真、部署

模型部署_模型量化、优化、编译、仿真、部署

时间:2023-07-04 10:15:33浏览次数:54  
标签:仿真 训练 部署 模型 浮点 X3 量化 RDK

两种思路

探路--由目前技术看未来-能做什么 ? 
造路--由目标而开始构建-要做什么 ?

板子

新唐NuMicro™Nano系列为32 位单片机

地平线旭日X3派RDK系列(Horizon Robotics Developer Kits,简称RDK)基于RDK X3(旭日X3派
   TogetheROS.Bot机器人操作系统(简称TROS.B)
   —RDK X3 Module,模组化设计,高度集成,在尺寸、接口上兼容树莓派CM4系列,市场售价319元起
  
地平线征程5(也称Journey5、J5
    算法工具链	  模型算法处理 和 嵌入式模型预测库
	                提供PTQ训练后量化方案和QAT量化感知训练方案- 转换后得到的定点模型配合模型编译工具处理后就可以在地平线计算平台上执行
					 嵌入式模型预测库提供利用定点模型完成推理的系列支持接口
					模型训练/转换、部署、验证、推理等关键步骤 
		OE是Open Explorer的缩写简称,中文名为天工开物(以下简称OE)
    部署:模型量化、优化、编译、仿真、部署、调试
	   训练后量化(PTQ) 和 量化感知训练(QAT)
	   PTQ,即训练后量化方案,先训练浮点模型,然后使用校准图片计算量化参数,将浮点模型转为量化模型的量化方法。
       QAT,即量化感知训练方案,在浮点训练的时候,就先对浮点模型结构进行干预,使得模型能够感知到量化带来的损失,减少量化损失精度的方案
	 模型转换:
       01.原始浮点模型(文中部分地方也称为浮点模型)是指通过TensorFlow/PyTorch等等DL框架训练得到的可用模型,这个模型的计算精度为float32
	     一般是使用float32类型来存储的,每一个权重数据需要占用4个字节,这样才能精确地降loss。
       02.地平线混合异构模型
         地平线BPU架构的计算平台使用的是int8的计算精度(业内计算平台的通用精度),能运行定点量化模型	
         那么从训练出的浮点精度转为定点模型的过程,我们称之为量化。 同时模型量化后能够有效减少模型大小,加速深度学习推理的速度			 
	 ONNX目前主要支持的opset版本是opset10和opset11  
	BPU加速:是指模型在板端推理时,该算子可以通过BPU硬件进行量化加速

点云

目前状况
  center-base Centerpoint
  Voxel-Based(pillar-base) 例如 PointPillars,complex-yolo,VoxelNet
  point-base :PointNet/PointNet++/Point-RCNN

Centerpoint 点云目标检测模型- Centerpoint 
   paper:《Center-based 3D Object Detection and Tracking》(2021CVPR)
   体素化 体素特征提取 中间特征提取 主干网络特征提取 neck特征拼接 多个head

 OpenPCDet系列 |  PointPillars 算法
 BEVDet和BEVFormer里,使用了各种3D detection head(BEVDet用了centerpoint,BEVFormer用了deformable detr)
   
mmdetection   商汤科技(2018 COCO 目标检测挑战赛冠军)和香港中文大学最近开源了一个基于Pytorch实现的深度学习目标检测工具箱mmdetection 
    https://github.com/mit-han-lab/bevfusion	   

参考

https://github.com/HorizonRDK	   

标签:仿真,训练,部署,模型,浮点,X3,量化,RDK
From: https://www.cnblogs.com/ytwang/p/17524894.html

相关文章

  • Jenkins+Docker 实现一键自动化部署项目
    Jenkins+Docker实现一键自动化部署项目!步骤齐全,少走坑路!JAVA编程Linux学习 2023-07-0108:10 发表于山东收录于合集#docker4个#Jenkins1个本文章实现最简单全面的Jenkins+docker+springboot一键自动部署项目,步骤齐全,少走坑路。环境:centos7+git(gitee)简述实现......
  • ChatGLM-6B阿里云服务器部署及微调笔记
    1、ChatGLM-6B阿里云服务器部署整体参考零基础,零成本,部署一个属于你的大模型https://blog.csdn.net/qqxx6661/article/details/130311311?ops_request_misc=&request_id=&biz_id=102&utm_term=阿里云chatglm&utm_medium=distribute.pc_search_result.none-task-blog-2allsobaid......
  • nacos部署
    1.jdk配置#安装jdkyuminstalljava-y#配置环境变量whichjava#找到jdk位置/usr/bin/javall/usr/bin/javavim/etc/pfrofileexportJAVA_HOME="/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.362.b08-1.el7_9.x86_64/jre"exportJRE_HOME=$JAVA_HOME/jreexportCLASSP......
  • 中国大模型时间发展机会在企业级市场
    《构建“安全可信可控易用”的企业级AI大模型》尊敬的各位领导、各位嘉宾,大家下午好!由于时间有限,下面我分享一些对人工智能大模型的应用前景。前几个月大家都在讨论OpenAI和中国什么时候能够做出自己的大模型,这几个月大模型层出不穷,我看到很多投资人开始急了。前两天朱啸虎和付......
  • 大型语言模型与知识图谱协同研究综述
    大型语言模型(LLM)已经很强了,但还可以更强。通过结合知识图谱,LLM有望解决缺乏事实知识、幻觉和可解释性等诸多问题;而反过来LLM也能助益知识图谱,让其具备强大的文本和语言理解能力。而如果能将两者充分融合,我们也许还能得到更加全能的人工智能。今天我们将介绍一篇综述LLM与知......
  • m基于simulink的PID控制器,模糊PID控制器以及MPC控制器性能对比仿真
    1.算法仿真效果matlab2022a仿真结果如下:        从图仿真结果可知,PID控制器,其超调较大,且控制器进入收敛状态时间也最长,。对于模糊PID控制器,其超调小于PID控制器,且收敛速度也较快,因此其性能优于传统的PID控制器。对于MPC控制器,其超调最小,控制器进入稳定状态速度也最快,......
  • m基于MOEA算法的无线传感器网络最优部署matlab仿真
    1.算法仿真效果matlab2022a仿真结果如下:     2.算法涉及理论知识概要       无线传感器网络(WirelessSensorNetwork,WSN)是一种分布式传感器网络,由大量的无线传感器节点组成,它们可以自组织、自适应、自愈合,通过无线通信协同完成任务。WSN应用广泛,如环境监......
  • Python信贷风控模型:Adaboost,XGBoost,SGD, SVC,随机森林, KNN预测信贷违约支付|附代码
    要求撰写关于信贷风控模型的研究报告,包括一些图形和统计输出。在此数据集中,我们必须预测信贷的违约支付,并找出哪些变量是违约支付的最强预测因子?以及不同人口统计学变量的类别,拖欠还款的概率如何变化?有25个变量:ID: 每个客户的IDLIMIT_BAL: 金额SEX: 性别(1=男,2=女)4.教育程......
  • m基于MOEA算法的无线传感器网络最优部署matlab仿真
    1.算法仿真效果matlab2022a仿真结果如下:2.算法涉及理论知识概要无线传感器网络(WirelessSensorNetwork,WSN)是一种分布式传感器网络,由大量的无线传感器节点组成,它们可以自组织、自适应、自愈合,通过无线通信协同完成任务。WSN应用广泛,如环境监测、农业、医疗等领域。在WSN中,传感......
  • m基于matlab的无线自组网性能仿真,包括端到端时延,吞吐量,初入网时间,迟入网时间,网络
    1.算法仿真效果matlab2022a仿真结果如下:      2.算法涉及理论知识概要        无线自组网(WirelessAdHocNetwork,简称WANET)是一种无需基础设施支持的网络,它由一组移动的无线节点组成,这些节点可以自组织形成一个网络,实现数据的传输和共享。由于WANET是......