当前位置: 首页 > news >正文

网络规划与设计实训总结网站搜索引擎优化方案

网络规划与设计实训总结,网站搜索引擎优化方案,做兼职网站赚钱吗,做一下网站博彩论文下载:https://openreview.net/pdf?idr1xMH1BtvB 另一篇分析文章:ELECTRA 详解 - 知乎 一、概述 对BERT的token mask 做了改进。结合了GAN生成对抗模型的思路,但是和GAN不同。 不是对选择的token直接用mask替代,而是替换为…

论文下载:https://openreview.net/pdf?id=r1xMH1BtvB

另一篇分析文章:ELECTRA 详解 - 知乎

一、概述

对BERT的token mask 做了改进。结合了GAN生成对抗模型的思路,但是和GAN不同。

不是对选择的token直接用mask替代,而是替换为一个生成器网络产生的token。

然后训练模型时并不是只被破坏的token,而是训练一个辨别模型来预测这些被破坏的输入的每一个token是否是被生成模型生成的样本替代的。因为将GANs应用于文本很困难,所以生成损坏token的生成器是以最大似然进行训练的。

小generator和大discriminator共同训练,但判别器的梯度不会传给生成器

fine-tuning 时丢弃generator,只使用discriminator

二、网络结构和训练

1、模型训练两个网络G和D。

        G:给定位置t,将该位置token替换为mask,输入到G,G输出一个概率,结合softmax层,来产生mask位置的xt,从而G产生损坏的输入。输出只在mask的token中计算分数,不是所有的token。

        D:给定位置t,D预测xt是否是真的。输出只在mask的token中预测是不是真的,不是所有的。

        对于给定一个随机位置序列,原始输入对应位置替换为[MASK] token,输入G,G学习恢复原始序列。D来分辨哪些token是被生成器产生的样本替换的。

文本损坏过程描述为:

2、损失函数为:

MLM损失的计算只计算m个,即m个被masked tokens

Disc损失 t的取值到 1..n,每个token都会更新参数

        在训练过程中,discriminator的loss不会反向传播到generator(因为generator的sampling的步骤导致),在pre-training之后,只使用discriminator进行fine-tuning.

http://www.tj-hxxt.cn/news/56702.html

相关文章:

  • 网站建设攵金手指专业网易游戏推广代理加盟
  • 品牌学习网站防疫管控优化措施
  • 怎样注册一个自己的网站seo流量增加软件
  • 网站百度显示绿色官网字如何做的网站排名监控工具
  • 网站软文得特点怎么宣传自己新开的店铺
  • 南宁会制作网站的技术人员上海已经开始二次感染了
  • 重庆网站建设公司联系方式深圳推广平台有哪些
  • 电影网站源码怎么做的网站推广线上推广
  • 网站灰色建设百度大数据
  • 睢宁建网站网站搜索引擎优化工具
  • 做视频网站用什么语言谷歌seo搜索
  • 广东东信润建设有限公司网站原画培训机构哪里好
  • 正在进入一站式服务平台公司网页
  • 鞍山哪里做网站nba最新排名
  • 在自己的网站里做讲课视频怎么推广公司网站
  • 即墨网站建设哪家好百度账号批发网
  • 外贸自建站收款通道个人网站模板建站
  • 做的比较好的二手交易网站优化关键词的方法正确的是
  • 做设计有哪些接私活的网站市场调研报告怎么做
  • 移动开发应用网站关键字优化软件
  • 福田商城网站建设哪家便宜百度站长提交网址
  • 安徽建设工程信息管理平台抖音关键词排名优化软件
  • 杭州疫情流调seo软件下载
  • 邢台太行中学简介北京优化靠谱的公司
  • 门户网站建设和运行保证的磋商文件镇江网站制作公司
  • 襄阳网站推广优化技巧搜索引擎营销的特点是
  • 做网站有陪标现象吗网络营销公司名字大全
  • 品质网站设做网络推广为什么会被抓
  • 自己怎么做免费网站空间杭州网站建设网页制作
  • 帮网站做推广赚钱淘宝关键词查询工具