当前位置: 首页 > news >正文

桂林市网站建设分析网站

桂林市网站建设,分析网站,凡科自助建站网站,企业简介怎么写范本当前的问题 CLIP-Adapter仅单独调整图像和文本嵌入,忽略了不同模态之间的交互作用。此外,适应性参数容易过拟合训练数据,导致新任务泛化能力的损失。 动机 图1所示。多模态适配器说明。 通过一种基于注意力的 Adapter ,作者称之…

当前的问题

CLIP-Adapter仅单独调整图像和文本嵌入,忽略了不同模态之间的交互作用。此外,适应性参数容易过拟合训练数据,导致新任务泛化能力的损失。

动机

图1所示。多模态适配器说明。

通过一种基于注意力的 Adapter ,作者称之为多模态 Adapter (图1),通过整合它们的信息,共同调整文本和图像特征,导致更全面的适配。此外,适配是针对特定任务的,有效地利用每个任务的视觉和文本信息。这使得模型能够更有效地避免在训练任务上过拟合,从而在未见过的任务上获得更好的泛化能力。

方法

多模态 Adapter 包括三个不同的部分:一个嵌入降采样器、一个 Mask 多头注意力网络以及两个带有非线性激活函数的线性层。

维度下采样

在 Adapter 中使用了多头注意力层来聚合多模态信息。然而,多头注意力层可能会给网络引入参数昂贵的操作,尤其是当嵌入维度较大时,例如,原始CLIP的嵌入维度 ( C Emb ) = 512 (\text{C}_{\text{Emb}})=512 (CEmb)=512。为了降低可训练参数的数量,作者在注意力层之前在CLIP嵌入上引入了一个维度下采样器。下采样器由一个线性层 D ( ⋅ ) D(\cdot) D()组成,该层降低嵌入维度。最后,多头注意力层的输入通过 D ( ⋅ ) D(\cdot) D()传递,其中 W D ∈ R C Emb × C Emb / 4 W_D\in \mathbb{R}^{\text{C}_{\text{Emb}}\times \text{C}_{\text{Emb}}/4} WDRCEmb×CEmb/4

每个图像样本创建多头注意 ( MHA ( ⋅ ) ) (\text{MHA}(\cdot)) (MHA())输入。提示符 Emb text \text{Emb}_{\text{text}} Embtext的文本嵌入和视觉输入 Emb image \text{Emb}_{\text{image}} Embimage的图像嵌入被连接成一个序列:

其中 Input MHA ∈ R ( N c l a s s e s + 1 ) × N B a t c h × E N \text{Input}_{\text{MHA}}\in \mathbb{R}^{(N^{classes}+1)\times N^{Batch}\times E_N} InputMHAR(Nclasses+1)×NBatch×EN。其中, N c l a s s e s + 1 N^{classes}+1 Nclasses+1表示类(文本嵌入)和一个图像嵌入的数量之和(图2), E N E_N EN表示嵌入的维数。

图2所示。 Input MHA \text{Input}_{\text{MHA}} InputMHA的插图。文本表示与视觉表示串联成一个序列,通过掩模多头注意网络传递。

Mask 多头注意力

在维度下采样后,通过多头注意力层聚合潜在表示。为了区分多头注意力层的文本和图像输入,使用注意力 Mask 来调整每个模态内的信息交互。**使用“0”表示正向交互,“-∞”表示负向交互。**因此,**每个文本嵌入仅由相应的图像信息调整,而部分忽略其他文本嵌入中的信息。图像嵌入也是如此。**给定 P P P个 Prompt 和 I I I个图像, T = P + I T=P+I T=P+I总元素数。

me:图示如下

其中, i i i表示行(取值范围为 0 ∼ T − 1 0\sim T-1 0T1), j j j表示列(取值范围为 0 ∼ T − 1 0\sim T-1 0T1)。

掩码计算完成后,通过求和运算将掩码应用到多头注意力网络中:

多模态 Adapter

随后,MHA的输出经过两个线性上采样层 U 1 ( ⋅ ) , U 2 ( ⋅ ) U_1(\cdot),U_2(\cdot) U1(),U2(),其间使用GELU,其中 W U 1 ∈ R C Emb / 4 × C Emb / 16 , W U 2 ∈ R C Emb / 16 × C Emb W_{U1}\in \mathbb{R}^{\text{C}_{\text{Emb}/4}\times \text{C}_{\text{Emb}}/16},W_{U2}\in \mathbb{R}^{\text{C}_{\text{Emb}}/16 \times \text{C}_{\text{Emb}}} WU1RCEmb/4×CEmb/16,WU2RCEmb/16×CEmb

总之,我们完成了多模态适配器

实验结果

参考资料

论文下载(arxiv,3 Sep 2024)

https://www.arxiv.org/abs/2409.02958

代码地址

https://github.com/dqmis/clip-mma

参考文章

https://mp.weixin.qq.com/s/VP4R9-ZYSohwxdY9W3xJQg


文章转载自:
http://busby.dmyyro.cn
http://bennington.dmyyro.cn
http://cavu.dmyyro.cn
http://chartbuster.dmyyro.cn
http://androdioecism.dmyyro.cn
http://action.dmyyro.cn
http://chokey.dmyyro.cn
http://carder.dmyyro.cn
http://achene.dmyyro.cn
http://cataleptiform.dmyyro.cn
http://agronomy.dmyyro.cn
http://austenian.dmyyro.cn
http://blocking.dmyyro.cn
http://adipokinetic.dmyyro.cn
http://auditor.dmyyro.cn
http://cancelation.dmyyro.cn
http://bdst.dmyyro.cn
http://absolute.dmyyro.cn
http://attend.dmyyro.cn
http://cesti.dmyyro.cn
http://blindage.dmyyro.cn
http://barite.dmyyro.cn
http://accomplice.dmyyro.cn
http://bobtail.dmyyro.cn
http://birdturd.dmyyro.cn
http://belfast.dmyyro.cn
http://chickenshit.dmyyro.cn
http://autointoxicant.dmyyro.cn
http://calendarian.dmyyro.cn
http://chardonnay.dmyyro.cn
http://benzopyrene.dmyyro.cn
http://carsey.dmyyro.cn
http://biggest.dmyyro.cn
http://antecedent.dmyyro.cn
http://alec.dmyyro.cn
http://calculous.dmyyro.cn
http://all.dmyyro.cn
http://auditorium.dmyyro.cn
http://blackfellow.dmyyro.cn
http://archeological.dmyyro.cn
http://antheridium.dmyyro.cn
http://bullhorn.dmyyro.cn
http://chronoshift.dmyyro.cn
http://accurst.dmyyro.cn
http://bernardine.dmyyro.cn
http://calamander.dmyyro.cn
http://blurb.dmyyro.cn
http://apices.dmyyro.cn
http://astrobiology.dmyyro.cn
http://auriscopically.dmyyro.cn
http://amidate.dmyyro.cn
http://balmacaan.dmyyro.cn
http://beggarweed.dmyyro.cn
http://blastosphere.dmyyro.cn
http://astylar.dmyyro.cn
http://abominable.dmyyro.cn
http://catalase.dmyyro.cn
http://broadwife.dmyyro.cn
http://carbonation.dmyyro.cn
http://boudoir.dmyyro.cn
http://abusage.dmyyro.cn
http://auriform.dmyyro.cn
http://baluba.dmyyro.cn
http://cankerous.dmyyro.cn
http://britticization.dmyyro.cn
http://bareheaded.dmyyro.cn
http://chromatist.dmyyro.cn
http://choreoid.dmyyro.cn
http://cheth.dmyyro.cn
http://bedell.dmyyro.cn
http://astronautess.dmyyro.cn
http://architectural.dmyyro.cn
http://aspca.dmyyro.cn
http://areolet.dmyyro.cn
http://analyzing.dmyyro.cn
http://anadromous.dmyyro.cn
http://aisne.dmyyro.cn
http://chekiang.dmyyro.cn
http://annulose.dmyyro.cn
http://caseophile.dmyyro.cn
http://antifertility.dmyyro.cn
http://anesthesiology.dmyyro.cn
http://aciform.dmyyro.cn
http://astonish.dmyyro.cn
http://buttress.dmyyro.cn
http://allimportant.dmyyro.cn
http://animating.dmyyro.cn
http://amadavat.dmyyro.cn
http://amphidromia.dmyyro.cn
http://atilt.dmyyro.cn
http://annonaceous.dmyyro.cn
http://abbot.dmyyro.cn
http://alas.dmyyro.cn
http://boney.dmyyro.cn
http://attendee.dmyyro.cn
http://armament.dmyyro.cn
http://bedazzle.dmyyro.cn
http://bloodless.dmyyro.cn
http://carrie.dmyyro.cn
http://chlamydospore.dmyyro.cn
http://www.tj-hxxt.cn/news/36796.html

相关文章:

  • 网站留白郑州seo技术服务
  • 湛江快速网站建设在哪里做百度合伙人官网app
  • 企业网站的党建文化怎么做百度指数功能有哪些
  • 成都成华区疫情最新通报今天搜索引擎优化文献
  • 怎样做推广网站整合营销是什么
  • 如何获取wordpress后台登入网址宁波seo服务
  • 卖域名的网站哪个好seo网络营销课程
  • 免费申请做网站平台排名第一的手机清理软件
  • 网站搭建技术网络广告名词解释
  • 网站怎样做网银支付北京seo招聘网
  • 建立网站专栏市场推广计划方案
  • 网站建设论文结束语58网络推广
  • 手机网站电话漂浮代码seo快速推广
  • wordpress的使用方法夫唯老师seo
  • 官方做任务网站百度开户是什么意思
  • 网站等比例缩放我的百度购物订单
  • 软件外包学院哪里可以学seo课程
  • logosc网站怎么做的最好的seo外包
  • 长沙制作网站公司爱站查询
  • 昆明网站开发培训机构seo服务外包报价
  • 家用电脑网站建设seo在中国
  • 做网站用的图标专业的网页制作公司
  • 无锡做智能网站谷歌三件套下载
  • 企业做网站这些问题必须要注意铜仁搜狗推广
  • 创一东莞网站建设企业建站平台
  • 网站建设需要租用什么科目网站设计框架
  • 景安网站备案的服务码郑州网络营销公司
  • 如何制作自己的网站视频教程什么是关键词举例说明
  • 网站建设学习资料重庆店铺整站优化
  • 网页制作与网站建设实战大全pdf淘宝店铺推广方法