当前位置: 首页 > news >正文

网站短时间怎么做权重外贸网站建设步骤

网站短时间怎么做权重,外贸网站建设步骤,wordpress适应浏,婚纱摄影网页引言 论文链接#xff1a;https://arxiv.org/abs/2307.11077 项目地址#xff1a;https://github.com/liming-ai/AlignDet 这篇论文主要研究目标检测领域的自监督预训练方法。作者首先指出#xff0c;当前主流的预训练-微调框架在预训练和微调阶段存在数据、模型和任务上的…引言 论文链接https://arxiv.org/abs/2307.11077 项目地址https://github.com/liming-ai/AlignDet 这篇论文主要研究目标检测领域的自监督预训练方法。作者首先指出当前主流的预训练-微调框架在预训练和微调阶段存在数据、模型和任务上的不一致。具体来说 数据不一致预训练通常在分类数据集上进行如ImageNet而微调数据集像COCO包含多个目标物体。数据特征和域的差异会导致预训练偏离下游任务。 模型不一致当前预训练方法主要聚焦在模型的部分模块如骨干网络而检测器的其他关键模块如RPN和回归头没有进行预训练。 任务不一致现有预训练只将分类作为预训练任务没有学习到目标相关的位置上下文信息如proposal生成、目标分配和框回归。 这些不一致性可能导致目标检测性能的局限、泛化能力差和收敛速度慢的问题。为此作者提出AlignDet框架可以调适到不同检测器中以弥合预训练和微调中的差异。 AlignDet将预训练过程解耦为Image-domain预训练和Box-domain预训练两个阶段。Image-domain预训练优化检测网络的骨干提取高层语义特征Box-domain预训练则学习实例级语义和任务感知的概念来初始化骨干以外的模块。具体来说 在Image-domain预训练中可以用分类器对骨干网络进行监督预训练也可以用最近出现的自监督方法进行无监督预训练。 在Box-domain预训练中使用选择性搜索生成伪标签构建两视图进行对比学习和坐标回归损失计算以适应检测导向的任务。同时固定骨干网络避免过拟合噪声标签。 那么对于数据、模型和任务存在的不一致性AlignDet都是怎么解决的呢首先对于数据不一致性方面AlignDet通过Box-domain预训练直接在目标检测数据集上进行而不是仅在分类数据集上预训练。这使得预训练过程可以适应目标检测的数据分布 bridge the gap between pre-training and fine-tuning datasets。至于模型不一致性方面AlignDet可以预训练检测器中的所有模块而不仅仅是骨干网络。这确保了检测头等关键模块可以得到良好的初始化有利于迁移到下游任务。从任务不一致性的方面来看AlignDet构建了检测导向的预训练任务既包含分类也包含回归。这使得预训练不仅学习语义信息还学习物体的坐标信息更贴近目标检测的实际任务。进一步来说AlignDet通过Image-domain和Box-domain解耦设计可以充分利用现有预训练的骨干网络提升预训练效率。同时它也是第一个支持各种检测器完全自监督预训练的框架。 从实验结果来看AlignDet可以显著提升各种检测器在不同训练策略和数据量下的性能。例如在COCO上使用12个epoch预训练FCOS精度提升5.3 mAPMask R-CNN提升3.3 mAP。这充分验证了AlignDet可以有效解决目标检测预训练与微调中的差异并取得显著的性能改进。 方 法 这篇论文提出了AlignDet框架以解决目标检测中预训练和微调过程中的数据、模型和任务的不一致性问题。该框架包含Image-domain预训练提取语义特征和Box-domain预训练学习实例级语义的两个阶段。Box-domain预训练利用选择性搜索生成伪标签并通过对比学习和坐标回归任务进行检测导向的预训练。 2.1 Image-domain Pre-training 在AlignDet框架中Image-domain预训练主要针对骨干网络以提取语义特征。该过程可以使用监督或自监督方式进行。 以自监督预训练为例给定输入图像x可以通过数据增强构建两个视图x1和x2。然后骨干网络backbone可以学习到视角不变的表示: 具体而言可以使用对比学习方法SimSiam它通过预测器predictor和停 gradient阻断梯度反向传播最大化不同视图表示的相似性获得泛化能力更强的特征: 这里的predictor通常是一个小的MLPstopgrad表示停止梯度回传。 通过在大规模图像分类数据集上预训练骨干网络可以学到语义特征为后续的Box-domain预训练提供输入。这种监督或自监督的Image-domain预训练可以有效提取视角不变的特征表示是AlignDet框架的第一步。 2.2 Box-domain Pre-training AlignDet框架中的Box-domain预训练主要针对检测器中除骨干网络之外的模块以学习实例级语义和任务感知的先验知识。Box-domain预训练包含以下几个关键步骤: Box-domain Pre-trainingBox-domain Pre-training的目的是生成用于后续预训练的伪标签。它使用选择性搜索算法从图像中生成多个区域proposal作为预训练时的伪真值框标签。这可以提供多对象和不同位置、尺度的样本使预训练数据更贴近目标检测场景。实现方式是:对输入图像执行选择性搜索获得proposal集P。同时构建图像的两增强视图proposal集也做相应变换获得P1和P2。检测器的回归模块预测两视图的框坐标B1和B2。 给定输入图像x使用选择性搜索生成区域proposal集P {p1 p2 … pn}作为伪标签。对x进行数据增强构建两视图x1和x2proposal集也同时进行变换生成P1和P2。检测器的回归相关模块freg预测两视图的框坐标: 这里φ表示目标分配操作如计算IoU匹配。每视图的预测框坐标为b (x y w h l)。 2. Box-domain Contrastive Learning目的是学习实例级的语义特征表示。它利用预测的框坐标最大化同一proposal在两视图中特征的相似度实现对比学习。实现方式是:基于预测框B1和B2提取两视图的特征表示Z1和Z2。定义正负样本通过InfoNCE对比损失拉近正样本距离推远负样本距离。 基于预测的框坐标可以提取特征向量用于对比学习: 这里表示特征提取模块是投影头。通过最大化同一proposal在两视图中的特征相似度进行对比学习: 其中是查询框的特征是正样本特征集是负样本特征集是温度参数。 3. Overall LossBox-domain预训练的总损失为对比损失和坐标回归损失之和: 这里表示不同检测器的坐标回归损失。 实 验 从Table 2的实验结果可以看出AlignDet与只进行Image-domain预训练的方法相比在不同的检测器、训练策略和数据量设置下都获得了显著的性能提升。在数据量方面随着训练数据的减少AlignDet的提升越明显。例如在只有1%数据的情况下AlignDet分别为FCOS、RetinaNet、Faster R-CNN和Mask R-CNN带来了1.4、1.8、2.5和3.6 mAP的提升。这说明AlignDet学到的知识可以缓解数据不足的问题。 在训练策略方面在训练轮数较少(12k iters)的情况下AlignDet同样带来显著提升例如Mask R-CNN在12k iters下提升3.2 mAP。这证明AlignDet加速了模型收敛速度。 在检测器方面AlignDet对一阶段模型FCOS和RetinaNet、两阶段模型Faster R-CNN、query基础模型DETR都取得明显的效果提升。这展示了AlignDet的普适性。即使在充足数据(100% COCO)和充分训练迭代(90k iters)下AlignDet仍可带来约1.0 mAP的提升。这进一步证明了AlignDet的有效性。与其他方法相比AlignDet对各类检测器都获得显著且一致的效果改进尤其是在低数据量或训练迭代较少的困难设置下而其他方法的提升则相对较小且局限。这充分证明AlignDet可以有效地解决预训练和微调过程中的差异为各类检测方法提供强有力的预训练方案。 从Table 4的迁移学习结果可以看出AlignDet在COCO数据集上进行预训练后可以有效地迁移至Pascal VOC数据集并提升下游检测性能。具体来看:AlignDet在所有检测器上都获得了显著的AP提升特别是高阈值metric AP75的提升非常明显。例如Faster R-CNN的AP75提升了6.5。对于RetinaNet和FCOS等一阶段检测器而言AlignDet预训练主要增强了分类能力即AP50指标获得明显提升。这与一阶段检测器更依赖分类的特点一致。对于两阶段检测器Faster R-CNNAlignDet预训练主要提升了回归准确度即AP75指标明显增强。这与两阶段检测器同时优化分类和回归的流程吻合。而DETR这样的query基础检测器AlignDet在分类和回归两个指标上都取得显著提升。 也就是说AlignDet学到的知识能有效迁移到下游检测任务和数据集上提升不同检测器的分类和回归能力。这进一步证明了AlignDet学习到的语义和坐标信息对目标检测任务具有普适的优化作用。这表明AlignDet不仅适用于COCO等多对象检测也适用于VOC等较简单的少类检测。 讨 论 这篇论文的一大优点在于作者针对目标检测预训练与微调之间的数据、模型和任务不一致性难题提出了一套统一且全面的AlignDet框架进行检测导向的预训练。该框架通过分别解决数据、模型和任务上的差异成功地在有效性、效率和迁移能力上取得明显改进和突破。此外该方法的普适性也很强可以广泛应用于各类检测器和骨干网络。这可以说是一个具有重要意义的里程碑性工作。 但是这篇论文也存在一些可以改进的地方。比如Box-domain预训练目前需要依赖选择性搜索生成伪标签这可能会带来一定局限性我们可以探索端到端的无监督框检测方法来获得proposal。此外当前方法主要在COCO数据集验证可以考虑在更多检测数据集和场景下进行评估。 展望未来这项工作为目标检测的预训练研究打开了新的大门。我们可以基于该框架继续探索无监督、弱监督proposal生成和Box-domain预训练技术以进一步降低人工标注和计算成本。另一方面如何将该框架扩展到其他密集预测任务也是一个有趣的方向。总之这项工作为更好地解决预训练与下游任务的不一致提供了重要启发是目标检测和计算机视觉领域一个高质量的工作。 从表1可以看出,AlignDet与其他目标检测预训练方法的主要区别在于: 数据方面AlignDet不仅适用于单对象的数据集,也能够在多对象的数据集上进行预训练,更贴近下游任务。 模型方面AlignDet可以预训练检测模型中的所有模块,而不仅是骨干网络,确保各模块初始化良好。 任务方面AlignDet同时引入了分类和回归两种预训练任务,学习语义和坐标信息,更符合目标检测的需求。 效果方面AlignDet对各类检测器都能取得显著提升,展示了更强的普适性。 效率方面AlignDet只需要12个epoch在COCO上预训练即可取得稳定收益,训练时间上也更为高效。 创新方面AlignDet支持各类检测器的完全自监督预训练,是第一个实现这一目标的方法。 综上所述,AlignDet相比其他方法更充分地解决了预训练和微调过程中的数据、模型和任务差异,使检测器获得了显著和一致的性能改进。这说明了AlignDet的有效性、普适性以及创新性。 结 论 总结而言这篇题为“AlignDet: Aligning Pre-training and Fine-tuning for Object Detection”的论文研究了目标检测中预训练和微调过程中的数据、模型和任务不一致性问题。论文指出现有预训练范式存在上述三方面差异导致检测性能受限、泛化能力差且收敛速度慢。为解决这一问题论文提出了AlignDet框架可以适配各种检测器以弥合预训练和微调的差异。该框架分为Image-domain预训练提取语义特征和Box-domain预训练学习实例级语义与任务感知先验。实验结果展示AlignDet可以显著提升各类检测器在不同数据量、训练策略及迁移学习下的性能。例如在COCO上12轮预训练FCOS精度提升5.3 mAPMask R-CNN提升3.3 mAP。可以说AlignDet是第一个支持各类检测器完全自监督预训练的框架对推进目标检测预训练研究具有重要意义。总之本论文不仅指出了目标检测中存在的预训练与微调不一致性问题也设计了AlignDet框架进行有效的检测导向预训练为该领域的研究做出了重要贡献。
http://www.tj-hxxt.cn/news/135843.html

相关文章:

  • 网站对公司的作用是什么意思网络营销培训学院
  • 网站照片加水印门户网站建设会议纪要
  • 用asp做的网站如何发布西安网站seo技术
  • 展馆的科普网站建设上海装修公司排名前20
  • 网站建设的英语济南网站搭建公司
  • 怎么做免流网站创立公司最低多少钱
  • 江苏营销型网站建设沈阳黄页88企业名录
  • 即墨做网站优化大师网站
  • 工业设计专业介绍企业网站优化报告
  • 谷歌浏览器 安卓下载啥叫优化
  • 律师行业协会网站建设网站认证收费吗
  • 给领导发网站建设可行性方案邮件怎么写福州百度seo
  • 门户网站建设方案公司科技设计网站建设
  • 做设计素材网站有哪些网站开发意见书
  • 微商城网站建设信息网站开发神书
  • 注册网站的软件公司注册资金可以随便填吗
  • 企业网站制作找什么人旅游app用户人群分析
  • 恋月wordpress珠海关键词优化平台
  • 沈阳网站建设开发维护九里徐州网站开发
  • 现在最好的免费的建站平台长沙公司网站设计报价
  • 网贷网站建设仁寿县建设局网站
  • 如何建设一个购物网站建wap网站
  • jsp做网站用什么封装字符串遂宁移动网站建设
  • 如何创建网站?影楼ps后期修片的教程
  • 网络建设公司排行福州短视频seo服务
  • 网站基础建设英文翻译合肥网站建设pqiw
  • 高端网站设计品牌万网虚拟主机免费空间
  • 网站建站平台广告网站优化包括对什么优化
  • 如何查看网站的空间商四川网站开发制作
  • 南京 郑州网站建设公司 网络服务品牌vi设计内容