当前位置: 首页 > news >正文

竞价单页网站制作seo知名公司

竞价单页网站制作,seo知名公司,大型旅游网站,wordpress企业主大开眼界?探索多模态模型种视觉编码器的缺陷。 论文中指出,上面这些VQA问题,人类可以瞬间给出正确的答案,但是多模态给出的结果却是错误的。是哪个环节出了问题呢?视觉编码器的问题?大语言模型出现了幻觉&…

大开眼界?探索多模态模型种视觉编码器的缺陷。
在这里插入图片描述
论文中指出,上面这些VQA问题,人类可以瞬间给出正确的答案,但是多模态给出的结果却是错误的。是哪个环节出了问题呢?视觉编码器的问题?大语言模型出现了幻觉?还是视觉特征与语言模型间的特征没有对齐?
作者将上述问题分成了9个类别(通过将涉及的问题和选项提供chatgpt,让chatgpt将这些问题归类)
在这里插入图片描述

  • 通过实验发现,增加模型规模/训练数据的数量,多模态模型仅在颜色/外观任务和物体状态/状况这两项任务上的表现有提升。
  • 通过实验发现,两张很相似的图片(如下图的两只蝴蝶),视觉编码器(CLIP)给出两张图片的相似度很高,但是自编码器(DINO)给出的相似度不是很高,作者定义这两幅图片为CLIP-blind pairs
    在这里插入图片描述
    clip和多模态模型在这9项任务上的表现
    在这里插入图片描述

通过增加自监督特征,多模态模型的能力有了提升
在这里插入图片描述
上图种左边是目前的多模态结构,中间部分是两部分特征线性相加,右边是交错混合的方式。
为了评价多模态模型在这些任务上的表现,建立了MMVP-VLM的测试集。
在这里插入图片描述
在这里插入图片描述

MMVP-VLM的建立过程
在这里插入图片描述

http://www.tj-hxxt.cn/news/89824.html

相关文章:

  • 沈阳做网站的百度竞价广告的位置
  • 简单个人网站制作流程百度竞价渠道户
  • 四川网站建设套餐销售网站排名
  • 做公司网站需要的资料互联网域名注册查询
  • wordpress阅读数作假成都关键词优化服务
  • 网站 备案 异地搜索引擎优化核心
  • 烟台网站建设科技信息流广告优秀案例
  • jsp b2c网站建设北京网站seowyhseo
  • 晋中公司做网站太原seo排名外包
  • 微信做购物网站怎么抽佣营销型网站建设易网拓
  • 如何把网站做跳转浏览器链接地址广州最新消息
  • 丹阳市制作网站建网站需要什么条件
  • 下模板做网站手机app免费下载
  • wordpress成品网站yunbuluo怎么办网站平台
  • 做自由行的网站软文广告经典案例800字
  • 做名片模板网站营销软件有哪些
  • 福州制作手机网站自媒体平台大全
  • 安康公司做网站营销方案案例
  • 做阿里网站卖东西赚钱网站seo优化方案策划书
  • 河北省建设信息中心网站搜外友链
  • 北京做机床的公司网站定制营销型网站建设
  • 广西网站建设智能优化新闻投稿平台有哪些
  • 做便宜网站千锋教育培训收费一览表
  • 没有logo可以做网站的设计吗百度官方平台
  • 鄂州做网站报价北京关键词排名推广
  • 自己做电影网站违法百度资源平台
  • 官方网站建设公上海seo优化外包公司
  • 自己做的产品在哪个网站上可从卖网络推广的工作内容
  • WordPress电影公司网站主题商丘关键词优化推广
  • 局域网站怎么做网络营销期末总结