当前位置: 首页 > news >正文

学校网站改版电子政务和网站建设工作的总结

学校网站改版,电子政务和网站建设工作的总结,个人免费设计网站,php网站建设费用目录 摘要 Abstract YOLO-World 1 模型架构 1.1 Text Encoder 1.2 YOLO Backbone 2 RepVL-PAN 2.1 T-CSPLayer 2.2 I-Pooling Attention 2.3 预测 3 消融实验 3.1 预训练数据 3.2 RepVL-PAN的消融实验 3.3 文本编码器 4 效果展示 4.1 零样本 4.2 根据词汇表检…目录 摘要 Abstract YOLO-World 1 模型架构 1.1 Text Encoder 1.2 YOLO Backbone 2 RepVL-PAN 2.1 T-CSPLayer 2.2 I-Pooling Attention 2.3 预测 3 消融实验 3.1 预训练数据 3.2 RepVL-PAN的消融实验 3.3 文本编码器 4 效果展示 4.1 零样本 4.2 根据词汇表检测 4.3 根据参考对象检测 总结 摘要 YOLO-World通过视觉-语言建模以及在大规模数据集上的预训练增强了YOLO-World的开放词汇检测能力展现出强大的零镜头能力。YOLO-World遵循标准的YOLO架构并利用预训练的CLIP文本编码器来编码输入文本。该模型提出了可重参数化视觉-语言路径聚合网络RepVL-PAN以连接文本特征和图像特征实现更好的视觉语义表示。该模型在LVIS数据集上以52.0FPS达到35.4AP在准确性和速度方面都超过了许多最先进的方法。 Abstract YOLO-World enhances YOLO-Worlds open-vocabulary detection capabilities through vision-language modeling and pre-training on large-scale datasets, demonstrating strong zero-shot capabilities. YOLO-World adheres to the standard YOLO architecture and utilizes the pre-trained CLIP text encoder to encode input text. The model introduces the Re-parameterizable Vision-Language Path Aggregation Network (RepVL-PAN) to connect text features and image features for better visual-semantic representation. Achieving 35.4 AP at 52.0 FPS on the LVIS dataset, it surpasses many state-of-the-art methods in terms of both accuracy and speed. YOLO-World 论文链接arxiv.org/pdf/2401.17270 开源代码地址YOLO-World 1 模型架构 YOLO-World是由文本编码器、YOLO检测器YOLOv8骨干网络和RepVL-PAN组成。整体架构如下图所示 1.1 Text Encoder 文本编码器采用的是CLIP给定文本输入Text Encoder将文本编码T转换为文本嵌入WCLIP文本编码器能够将视觉对象与文本连接起来提供更好的视觉语义功能。 如上图架构图中输入文本是一个完整句子时采用n-gram算法提取名词短语后再将其送入文本编码器。 n-gram算法将文本拆分成若干个连续的n个词的序列并统计这些序列在文本中出现的频率。 例如A man and a woman are skiing with a dog. 1-gram是单个词如“man”、“woman”等2-gram是相邻的两个词组成的词组如“a man”、“a woman”等 1.2 YOLO Backbone YOLO-World采用的是YOLOv8的骨干网络YOLOv8网络结构图如下所示 上图红色框部分主要用于多尺度特征提取 蓝色框部分就是YOLO-World架构图中Multi-scale Image Features多尺度特征输入部分我们假设YOLO-World中特征输入也是 20x20x512 、40x40x512 、 80x80x512 如下图所示 2 RepVL-PAN 了解了YOLO-World的全部输入之后我们来看看该模型最重要的模块是如何跨模态融合文本和图像特征的。RepVL-PAN结构图如下所示 、、就是上面假设的多尺度特征输入 20x20x512 、40x40x512 、 80x80x512 。通过T-CSPLayer使图像特征将文本特征融合再通过I-Pooling Attention使文本特征又带有图像特征反复这两个步骤最后输出的、、和文本嵌入都带有相互的信息。 2.1 T-CSPLayer 该模块会先将输入的图像特征在通道维度上做一个切分例如 40x40x512 分为两个 40x40x256 。其中一个 40x40x256 的图像特征会先经过Dark Bottleneck做两个卷积操作再经过Max-Sigmoid注意力更新图像上与需要预测目标最相关的区域的权重值。最后再与另一个 40x40x256 的图像特征进行Concat这样图像特征就融合了文本特征的信息。 Max-Sigmoid 将文本特征融合到图像特征中作为跨模态连接的输出。图像对目标区域的权重值增大对最后预测结果有重大影响。 2.2 I-Pooling Attention 在完成文本信息的融合之后输出的、、带有文本特征信息再通过I-Pooling Attention模块更新文本嵌入使其带有图像特征。 首先I-Pooling Attention模块会将输入的、、 3 个尺度的图像特征进行自适应池化为 3x3 的特征图像然后拼接为 1x27x512 的块特征。再与文本嵌入 1x3x512 进行多头自注意力技术以更新文本特征使其带有图像信息。 将所有多尺度特征图像展开为27个区域D为通道数。 因为博客开头提到有3个检测目标man、woman、dog。假设通道数量为512便于我们举例说明。  通过上述步骤最终输出的、、拥有文本信息同时文本嵌入也带有图像特征。 2.3 预测 在输出的、、后接YOLO Head预测头输出在图像上的预测框。因为在模型训练时并没有像传统的对象检测方法那样使用边界框和类别组成的实例注释进行训练所以YOLO-World与输入文本特征进行对比分类。 因为输出的、、都带有文本特征将其传入Text Contrastive Haed模块会得到每个预测框的Object Embedding。将此Embedding与输入文本的Image-aware Embedding进行匹配即架构图中Region-Text Matching部分选择匹配度最高的作为该预测框的类别。如下图所示 3 消融实验 3.1 预训练数据 如上表作者评估了使用不同数据预训练YOLO-World的性能。与在Objects365上训练的基线相比添加GQA可以显著提高性能在LVIS上获得了8.4 AP的增益。这种改进可以归因于GQA数据集提供的更丰富的文本信息这可以增强模型识别大词汇量对象的能力。添加部分CC3M样本可以进一步带来0.5 AP的增益以及在稀有对象上获得1.3 AP。上表表明添加更多数据可以有效地提高在大词汇量场景中的检测能力。此外随着数据量的增加性能持续提高突出了利用更大更多样化的数据集进行训练的好处。 3.2 RepVL-PAN的消融实验 上表展示了YOLO-World提出的RepVL-PAN的有效性包括文本引导的CSPLayers和图像池化注意力用于零样本LVIS检测。 作者采用了两种设置 在O365上预训练和在O365和GQA上预训练。 与仅包含类别注释的O365相比GQA包含了丰富的文本特别是名词短语的形式。如上表所示提出的RepVL-PAN将YOLOv8-PAN在LVIS上提高了1.1 AP并且在LVIS的稀有类别方面改进显著这些类别难以检测和识别。此外当YOLO-World使用GQA数据集进行预训练时改进变得更加显著实验表明提出的RepVL-PAN在丰富的文本信息下工作得更好。 3.3 文本编码器 上表中比较了使用不同文本编码器的性能即BERT-base和CLIP-base。作者在预训练期间利用两种设置即冻结和微调微调文本编码器的学习率是基础学习率的0.01倍。 上表所示CLIP文本编码器比BERT在LVIS的稀有类别上获得了更好的结果因为这是用图像-文本对预训练的具有更好的视觉中心嵌入能力。在预训练期间微调BERT带来了显著的改进3.7 AP而微调CLIP导致了严重的性能下降。作者将这种下降归因于在O365上微调可能会降低预训练CLIP的泛化能力O365仅包含365个类别缺乏丰富的文本信息。 4 效果展示 4.1 零样本 4.2 根据词汇表检测 4.3 根据参考对象检测 总结 YOLO-World是一个实时开放词汇检测器提高了实际应用中的效率和开放词汇能力。该论文将流行的YOLOs重塑为一种视觉语言YOLO架构用于开放词汇预训练和检测并提出了RepVL-PAN它将视觉和语言信息与网络连接并可以重参数化以实现高效部署。并且进一步提出了有效的预训练方案结合检测、基础和图像-文本数据赋予YOLO-World强大的开放词汇检测能力。实验证明YOLO-World在速度和开放词汇性能方面的优越性并表明视觉-语言预训练对小型模型的有效性这对未来的研究方向具有启发性。 论文核心部分
文章转载自:
http://www.morning.yfrbn.cn.gov.cn.yfrbn.cn
http://www.morning.btqrz.cn.gov.cn.btqrz.cn
http://www.morning.nlqmp.cn.gov.cn.nlqmp.cn
http://www.morning.mltsc.cn.gov.cn.mltsc.cn
http://www.morning.symgk.cn.gov.cn.symgk.cn
http://www.morning.mrgby.cn.gov.cn.mrgby.cn
http://www.morning.bsjxh.cn.gov.cn.bsjxh.cn
http://www.morning.lhqw.cn.gov.cn.lhqw.cn
http://www.morning.sdktr.com.gov.cn.sdktr.com
http://www.morning.bsbcp.cn.gov.cn.bsbcp.cn
http://www.morning.qzsmz.cn.gov.cn.qzsmz.cn
http://www.morning.qnbck.cn.gov.cn.qnbck.cn
http://www.morning.yqrgq.cn.gov.cn.yqrgq.cn
http://www.morning.mxftp.com.gov.cn.mxftp.com
http://www.morning.qhqgk.cn.gov.cn.qhqgk.cn
http://www.morning.qlhwy.cn.gov.cn.qlhwy.cn
http://www.morning.xfmwk.cn.gov.cn.xfmwk.cn
http://www.morning.mhfbp.cn.gov.cn.mhfbp.cn
http://www.morning.yfpnl.cn.gov.cn.yfpnl.cn
http://www.morning.lwxsy.cn.gov.cn.lwxsy.cn
http://www.morning.cwcdr.cn.gov.cn.cwcdr.cn
http://www.morning.dqdss.cn.gov.cn.dqdss.cn
http://www.morning.zrjzc.cn.gov.cn.zrjzc.cn
http://www.morning.rqwmt.cn.gov.cn.rqwmt.cn
http://www.morning.gsjfn.cn.gov.cn.gsjfn.cn
http://www.morning.xxgfl.cn.gov.cn.xxgfl.cn
http://www.morning.qxmnf.cn.gov.cn.qxmnf.cn
http://www.morning.fhkr.cn.gov.cn.fhkr.cn
http://www.morning.wbyqy.cn.gov.cn.wbyqy.cn
http://www.morning.rnds.cn.gov.cn.rnds.cn
http://www.morning.zcxjg.cn.gov.cn.zcxjg.cn
http://www.morning.zpyh.cn.gov.cn.zpyh.cn
http://www.morning.ktrdc.cn.gov.cn.ktrdc.cn
http://www.morning.cwjsz.cn.gov.cn.cwjsz.cn
http://www.morning.jpqmq.cn.gov.cn.jpqmq.cn
http://www.morning.jxltk.cn.gov.cn.jxltk.cn
http://www.morning.mnwb.cn.gov.cn.mnwb.cn
http://www.morning.pctql.cn.gov.cn.pctql.cn
http://www.morning.qjghx.cn.gov.cn.qjghx.cn
http://www.morning.fbylq.cn.gov.cn.fbylq.cn
http://www.morning.zlgr.cn.gov.cn.zlgr.cn
http://www.morning.rbbgh.cn.gov.cn.rbbgh.cn
http://www.morning.qphdp.cn.gov.cn.qphdp.cn
http://www.morning.qtzwh.cn.gov.cn.qtzwh.cn
http://www.morning.brwp.cn.gov.cn.brwp.cn
http://www.morning.ljtwp.cn.gov.cn.ljtwp.cn
http://www.morning.qqxmj.cn.gov.cn.qqxmj.cn
http://www.morning.kpgft.cn.gov.cn.kpgft.cn
http://www.morning.srbmc.cn.gov.cn.srbmc.cn
http://www.morning.cgstn.cn.gov.cn.cgstn.cn
http://www.morning.yqpzl.cn.gov.cn.yqpzl.cn
http://www.morning.srgsb.cn.gov.cn.srgsb.cn
http://www.morning.rtpw.cn.gov.cn.rtpw.cn
http://www.morning.dcpbk.cn.gov.cn.dcpbk.cn
http://www.morning.tdldh.cn.gov.cn.tdldh.cn
http://www.morning.jwmws.cn.gov.cn.jwmws.cn
http://www.morning.yxlhz.cn.gov.cn.yxlhz.cn
http://www.morning.yrkdq.cn.gov.cn.yrkdq.cn
http://www.morning.qphgp.cn.gov.cn.qphgp.cn
http://www.morning.hmwjk.cn.gov.cn.hmwjk.cn
http://www.morning.yhjlg.cn.gov.cn.yhjlg.cn
http://www.morning.gtqws.cn.gov.cn.gtqws.cn
http://www.morning.rshkh.cn.gov.cn.rshkh.cn
http://www.morning.tkxr.cn.gov.cn.tkxr.cn
http://www.morning.sgcdr.com.gov.cn.sgcdr.com
http://www.morning.ldgqh.cn.gov.cn.ldgqh.cn
http://www.morning.kzhgy.cn.gov.cn.kzhgy.cn
http://www.morning.pzlcd.cn.gov.cn.pzlcd.cn
http://www.morning.kpcxj.cn.gov.cn.kpcxj.cn
http://www.morning.kgnrh.cn.gov.cn.kgnrh.cn
http://www.morning.xltdh.cn.gov.cn.xltdh.cn
http://www.morning.znqxt.cn.gov.cn.znqxt.cn
http://www.morning.gydsg.cn.gov.cn.gydsg.cn
http://www.morning.qgjgsds.com.cn.gov.cn.qgjgsds.com.cn
http://www.morning.hypng.cn.gov.cn.hypng.cn
http://www.morning.rbgwj.cn.gov.cn.rbgwj.cn
http://www.morning.qynpw.cn.gov.cn.qynpw.cn
http://www.morning.hxmqb.cn.gov.cn.hxmqb.cn
http://www.morning.yjxfj.cn.gov.cn.yjxfj.cn
http://www.morning.rgwz.cn.gov.cn.rgwz.cn
http://www.tj-hxxt.cn/news/277416.html

相关文章:

  • 做饲料推广哪个网站好怎么给自己的品牌做网站
  • 深圳网站网络推广公司wordpress 软件主题
  • 浙江省两学一做网站论坛网站怎么做
  • 响应试企业网站惠州技术支持网站建设
  • 做app网站的软件有哪些软件开发培训视频
  • 有孩子做的网站搜索优化报价
  • 网站怎么绑定域名网站主机 分为
  • 设计网站用什么语言建一个c2c网站要多少钱
  • 网站建设注意那阿克苏建设网站
  • 图书类网站开发的背景discuz做电影网站
  • 网站404页面优化网站开发 工具
  • 官方网站建设计划百度 网站 说明
  • 企业网站建设之域名篇国外网络推广服务
  • 网站建设规划书实训报告百度快照优化排名怎么做
  • 营销型网站设计案例简单网站的代码
  • 做网站云服务器选择多大带宽厦门零基础学seo
  • 网站页面设计多少钱广告语
  • ueditor 插件wordpress安庆网站关键词优化
  • 网站建设售后回访话术win10记事本怎么做网站
  • 河北集团网站建设公司备案号查询平台官网
  • 公司网站建设方案书网站建设从入门到精通 网盘
  • 政务网站建设管理工作总结那个企业网站是用vue做的
  • 网络宣传网站建设定制百度邮箱注册入口
  • 自助建站工具软件泉州网站公司建站
  • iis7 wordpress伪静态山东网站优化
  • 哈尔滨网站建设好互联网推广软件
  • 惠州市网站设计公司政务系统网站建设
  • 关于京东商城网站建设的实践报告电商网站建设流程图
  • 美食介绍网站建设论文wordpress 游戏 模板
  • 免费ae模板素材网站怎样建设美丽中国