点云分割网络---Point Transformer V2

时间：2024-07-03 21:08:42浏览次数：27

PDF: 《Point Transformer V2: Grouped Vector Attention and Partition-based Pooling》
CODE: https://github.com/Gofinge/PointTransformerV2

一、大体内容

前面一篇文章介绍了Point Transformer，这一篇在其基础上进行改进，提出了强大且高效的Point Transformer V2模型，考虑到原先的效率问题，提出了组向量注意力并继承了可学习权重编码和多头注意力的优点，提出一种新的分组权重编码层的分组向量注意力，来提升模型效率；通过额外的位置编码乘法器来增强位置信息；设计了一套新颖且轻量的分区池化方法，更好地实现了空间对齐和高效采样。通过实验表明在几个具有挑战性的3D点云场景理解基准上达到了最先进的水平，包括ScanNet v2和S3DIS上的3D点云和ModelNet40上的三维点云分类。
如下图可以看出V1和V2的差异点：

其分割网络结构还是类似V1呈Encoder-Decoder形式。

二、贡献点

提出一个高效的分组向量注意力（GVA），其具有新颖的权重编码层，使得能够在关注组内和关注组之间进行有效的信息交换。
引入一种改进的位置编码方案，可以更好地利用点云坐标，进一步提高模型空间推理能力
设计基于分区的池化策略，实现更高效、空间上更好的信息聚合

三、细节

3.1 分组向量注意力（GVA）

把向量拆分成不同的组，每个组里面共享权重，达到减少参数量的效果，进而提升效率

注意输入输出，V1输入和输出都是\(\mathbb{R}^c\)，但分组后由于只有\(g\)个组，所以输出是\(\mathbb{R}^g\)
更加直观的理解就是原先的向量注意力（VA）是每个向量之间密集连接，分组向量注意力（GVA）组内共享权重，组之间才进行密集连接。
还有其他两种设计，如不同组之间不进行连接（GVA-MSA）, 直接在组内用MLP进行连接（GVA-Grouped Linear）。

3.2 位置编码

对比下公式大家就清晰了，
原先V1采用的是

V2采用

3.3 分区池化

这个看图很明显，V1要通过KNN来查找最近邻，然后再做插值，这个计算量比较多，V2直接进行网格划分，同一个网格里面的点进行Pooling 和 Unpooling。

Pooling
还是采用最大池化，即同一个网格里面的点的特征进行最大池化操作，点进行平均池化
Unpooling
直接对同一个网格内的点进行特征复制

四、效果

4.1 分割

4.2 分类

标签：Transformer,Point,---,V2,池化,点云,向量
From： https://www.cnblogs.com/xiaxuexiaoab/p/18264336

从GPT-1看Transformer的崛起
要深入理解大语言模型（LLM）的内部工作机制，不妨先从GPT-1模型开始。一、发展历程2017年，Google推出了Transformer模型，这一架构因其在性能上的显著优势迅速吸引了OpenAI团队的注意。《AttentionIsAllYouNeed》https://arxiv.org/abs/1706.03762OpenAI随后将研发重点转移到Tra......
CVD-Risk-Prevent 个性化心血管健康推荐系统：基于医学指南的规则框架与 LLM 的结合
CVD-Risk-Prevent个性化心血管健康推荐系统：基于医学指南的规则框架与LLM的结合提出背景推荐算法的选择选择疑问健康指标管理心血管风险因素目标设定实现目标的计划推荐的多维性算法关键点：如何将心血管健康指标转换为多维推荐？确定风险因素和类别生成多维推荐CVD-Ri......
比赛获奖的武林秘籍：00 学科竞赛-工科类大学生绕不开的话题，你了解多少？
原文链接电子计算机类比赛获奖的秘籍，可点击这里：电子计算机类比赛的“武林秘籍”-电赛光电设计大赛计算机设计大赛嵌入式芯片与系统设计竞赛，你要的都在这里！正文看到一些刚进入大学的小伙伴，对是否要今早参加比赛？参加比赛对我到底有什么样的好处？如何获得相应的比赛信息？哪些......
Docker系列-Docker镜像分层原理
Docker镜像的分层原理是其实现高效、灵活和可复用性的关键。以下是对Docker镜像分层原理的详细说明：一、基本概念Docker镜像是一种轻量级、可执行的独立软件包，它包含运行某个软件所需要的所有内容，如代码、运行时库、环境变量和配置文件等。镜像通过Dockerfile定义并构建，最终形......
比赛获奖的武林秘籍：00 学科竞赛-工科类大学生绕不开的话题，你了解多少？
比赛获奖的武林秘籍：00学科竞赛-工科类大学生绕不开的话题，你了解多少？原文链接电子计算机类比赛获奖的秘籍，可点击这里：电子计算机类比赛的“武林秘籍”-电赛光电设计大赛计算机设计大赛嵌入式芯片与系统设计竞赛，你要的都在这里！正文看到一些刚进入大学的小伙伴，对是否要今早参加......
k8s-核心组件
核心组件组成Kubernetes主要由以下几个核心组件组成:-etcd：保存整个集群的状态-APIServer：提供了资源操作的唯一入口，并提供认证、授权、访问控制、API注册和发现等机制-ControllerManager：负责维护集群的状态，如故障检测、自动扩展、滚动更新等-Scheduler：负责资源的调度......
【Java基础】--线程（包含面试题）
本章主要了解什么是进程？进程和线程有什么关系？有什么区别？以及创建线程的方式有哪些？1.什么是进程？简单的来说，进程是指在系统中正在运行的一个应用程序，每个进程之间是独立的，每个进程均运行在其专用的且受保护的内存。2.什么是线程？线程，又称轻量级进程（LightWeightProcess）。......
基于无线传感器网络的LC-DANSE波束形成算法matlab仿真
1.程序功能描述在无线传感器网络中，通过MATLAB对比LC-DANSE波束形成算法和LCMV波束形成算法。对比SNR，mse等指标。 2.测试软件版本以及运行结果展示MATLAB2022a版本运行 3.核心程序forIter=IterationIte......
车载测试之-CANoe创建仿真工程
在现代汽车工业中，车载测试是确保车辆电子系统可靠性和功能性的关键环节。而使用CANoe创建仿真工程，不仅能够模拟真实的车辆环境，还能大大提升测试效率和准确性。那么，CANoe是如何实现这些的呢？车载测试中，为什么选择使用CANoe创建仿真工程？它具备哪些独特的功能和优势，能够在复杂的车......
高项-组织通用管理
1、人力资源管理内容：规划、招聘、维护、提升、评价。2、工作分析的作用：招聘和选择员工、发展和评价员工、薪酬政策、组织与岗位设计。工作分析四个阶段(范围、确定方法、收集、评价):第一阶段：明确工作分析范围(1)确定工作分析的目的(2)确定工作分析的对象第二阶段：确......