中山企业网站推广公司,购物平台网站建设流程,广告公司广告设计,h5模板网站有哪些停更了好久终于回来了#xff08;其实是因为博主去备考期末了hh#xff09;
这一篇接着#xff08;五#xff09;的第七章开始讲述第八章的内容。第八章主要介绍的是三维目标检测的高效标签。 目录
第八章 三维目标检测高效标签
一、域适应
#xff08;一#xff09;…停更了好久终于回来了其实是因为博主去备考期末了hh
这一篇接着五的第七章开始讲述第八章的内容。第八章主要介绍的是三维目标检测的高效标签。 目录
第八章 三维目标检测高效标签
一、域适应
一问题和挑战
二跨传感器域适应
三跨天气域适应
四模拟现实域适应
二、弱监督3D目标检测
一问题和挑战
二弱监督三维目标检测
三、半监督3D目标检测
一问题和挑战
二半监督三维目标检测
四、自监督3D目标检测
一问题和挑战
二自监督三维目标检测 第八章 三维目标检测高效标签
在这个章节里我们介绍一些三维目标检测高效标签的方法。在前几个章节中我们通常假设三维检测器是在全监督下进行训练的且是在特定数据域和充足大量的上下文的情况下进行的。然而在现实世界的应用中三维目标检测方法不可避免地会遇到泛化能力差和缺少上下文的问题。为了解决这些问题高效标签化的技术就能够应用于三维目标检测包括三维目标检测的域适应第一节、弱监督学习第二节、半监督学习第三节和自监督学习第四节。我们将会在下面几个章节中介绍这些方法。
一、域适应
一问题和挑战
域间隙在数据收集过程中是普遍存在的。不同的传感器设置和放置不同的地理位置以及不同的天气都有可能得到完全不同的数据域。在大部分情况中在特定域中训练的三维目标检测器比在其他域中训练的检测器性能更差。人们提出了许多技术来解决三维目标检测中域适应的问题比如采用源和目标域的一致性以及在目标域中自训练。然而大部分方法仅仅注重解决某个特定的域转换问题。设计一个域适应方法这种方法可以应用于三维目标检测中任意一个域转换任务这将是一个有前途的研究方向。三维目标检测域适应方法阐述图如下 方法分类如下表 二跨传感器域适应
不同的数据集有着不同的传感器设置比如在nuScenes数据集上采用的32光束的激光雷达VS在KITTI数据集上采用的64光束的激光雷达 并且数据也在不同的地理位置收集比如KITTI数据集是在德国收集的而Waymo是在美国收集的。这些因素都会导致不同数据集间产生严重的域间隙并且在数据集上训练的检测器在其他数据集上测试时通常性能较差。Wang等人的一项开创性工作就是观察到了不同数据集之间的间隙并且引入了一种统计归一化的方法来处理这些间隙。下面许多工作也都采用了自训练的方法解决域适应的问题。在这些方法中在源数据集上预训练的检测器将为目标数据集引入伪标签并且会在带有伪标签的目标数据集上重新训练。这些方法主要在获取更高质量的伪标签上做出了改进比如Saltori提出了一种范围和检测策略Yang引入了一种记忆库Fruhwirth-Reisinger等人采用场景流应用以及You等人采用重放来增强伪标签的质量。除了自训练方法也存在一些论文在源和目标域之间建立对齐。域对齐通过规模意识和范围意识对齐策略这是Zhang等人提出的多级别一致性Luo等人提出以及对比性联合训练方案Yihan等人提出来建立。
除了数据集间的域间隙不同的传感器之间也能够产生不同特征的数据。一个32光束的激光雷达能产生比64光束激光雷达更稀疏的点云并且不同摄像机获取的图像也拥有不同的尺寸和内参。Rist等人提出了一种多任务学习模式来解决不同激光雷达传感器的域间隙并且Gu提出了不变位置的转换来解决不同相机间的域间隙。
三跨天气域适应
天气状况对数据的收集也会造成巨大的影响。在雨天的时候雨滴会改变目标表面特质以致于很少有激光雷达光束能够反射回来并检测到所以在雨天收集的点云比在干燥天气下收集的点云更加稀疏。除了反射更少之外下雨也会导致来自中空雨滴错误的正反射。Xu等人提出了跨天气域适应问题的一种新颖的语义点生成方案。
四模拟现实域适应
模拟数据已经被广泛应用于三维目标检测中因为现实世界收集的数据并不能覆盖所有的驾驶场景。然而合成数据与现实数据有着截然不同的特质这也就导致了模拟现实域适应的问题。人们提出了许多方法来解决这个问题例如Zhu等人提出的基于训练的GAN并引入一种对抗的鉴别器来区分现实和合成数据。
二、弱监督3D目标检测
一问题和挑战
现存的三维目标检测方法都高度依赖大量人工标签的三维边界框上的训练但是给这些三维边界框添加注释是非常耗时费力和昂贵的。弱监督学习可能成为这个问题的一个解决方案因为弱监督信号例如更少昂贵的二维注释已经被应用于三维目标检测模型中。若监督三维目标检测不需要那么多人工数据注释但是在弱监督和全监督方法中仍存在不可忽视的性能间隙。弱监督三维目标检测方法阐述如下图 二弱监督三维目标检测
弱监督方法采用弱监督而非全监督注释三维边界框来训练三维目标检测器。弱监督包括二维图像边界框一个预训练的图像检测器BEV目标中心和车辆实例。这些方法通常设计出新颖的学习机制来跳过三维框监督并通过从弱信号中最小化有用的信息来学习如何检测三维目标。
三、半监督3D目标检测
一问题和挑战
在现实世界应用中数据注释需要的人力比数据收集更多。通常一个数据获取车一天之内能够收集十万多帧点云然而一个熟练的人类注释者一天仅能注释一百到一千帧。这就不可避免的会导致大量增长的未标签化的数据。因此如何从大范围未标签的数据中最小化有用的信息就成为了研究界和工业界一个严峻的挑战。半监督学习是一个有希望的方向它采用少部分标签化数据和大量未标签化的数据来联合训练一个更强大的模型。将半监督学习方法结合到三维目标检测中去能够增强检测性能。半监督三维目标检测方法阐述如下 二半监督三维目标检测
半监督三维目标检测主要有两种方法伪图像标签和教师-学生学习。伪图像标签方法Caine等人提出首先采用标签化的数据训练了一个三维目标检测器然后使用三维检测器为那些未标签化的数据产生伪图像标签。最终三维目标检测器在未标签化的域内用伪图像标签重新训练。教师-学硕方法Zheng等人提出在三维目标检测中采用平均教师训练范式。具体而言一个教师检测器首先在标签化域中训练然后通过鼓励两种检测模型间的输出一致性来指导学生检测器在未标签化域中训练。
四、自监督3D目标检测
一问题和挑战
自监督预训练已经成为一个强大的工具当大量未标签化数据和限制性的标签数据存在时。在自监督学习中模型首先在大范围的未标签化的数据中预训练之后在标签化的数据集上微调以获得更好的性能。在自动驾驶场景中三维目标检测的自监督预训练还未探索许多。现存方法仍尝试适应自监督方法例如对比性学习相对于三维目标检测问题但是多模态数据中丰富的语义信息还未被很好地利用起来。如何在预训练高效三维目标检测器时有效处理这些原始点云和图像仍是一项开放性的挑战。自监督三维目标检测方法阐述如下 二自监督三维目标检测
自监督方法通常将对比性学习技术应用到三维目标检测中。具体而言输入点云首先转换成增强的两种视角之后应用对比性学习来支持两种视角下相同三维位置的特征一致性。最终采用对比学习预训练的三维检测器进一步在标签化数据集上微调以获得更好的性能。PointContrastXie等人提出首次在三维目标检测中引入对比学习范式并且以下文章中通过采用深度信息和聚合改进了这个范式。除了点云检测器的自监督学习还有一些工作尝试为自监督三维检测同时采用点云和图像例如Li提出了一种基于多模态输入的模型内和模型间的对比学习模式。