当前位置: 首页 > news >正文

wordpress后台紧致谷歌字体谷歌优化推广

wordpress后台紧致谷歌字体,谷歌优化推广,做网站在哪个程序做,o2o平台排名引言 BERT预训练过程中包括两个主要任务:Masked Language Modeling(MLM) 和 Next Sentence Prediction(NSP)。 MLM损失函数: 在MLM任务中,模型需要根据上下文预测被MASK掉的词语。具体来说,输入序列中的一部分词语被随机MASK,模型需要依据未被MASK的词语来预测这些被MASK…

引言

       BERT预训练过程中包括两个主要任务:Masked Language Modeling(MLM) 和 Next Sentence Prediction(NSP)。

MLM损失函数:

       在MLM任务中,模型需要根据上下文预测被MASK掉的词语。具体来说,输入序列中的一部分词语被随机MASK,模型需要依据未被MASK的词语来预测这些被MASK的词语。

损失函数:

       MLM任务通常使用多类别交叉熵损失函数(Cross-Entropy Loss)。对于每一个被MASK的位置,计算模型预测的词与真实词之间的交叉熵损失。数学表达式为:

L MLM = − ∑ i ∈ M log ⁡ P ( w i ∣ C i ) L_{\text{MLM}} = -\sum_{i \in \mathcal{M}} \log P(w_i | C_i) LMLM=iMlogP(wiCi)

其中:

M \mathcal{M} M:被MASK的词语在序列中的位置集合。
w i

http://www.tj-hxxt.cn/news/48942.html

相关文章:

  • 银川网站制作公司如何营销
  • 优质作文网站网络服务商在哪咨询
  • 网站只能在vps里打开宁德seo
  • 网站如何做品牌宣传佐力药业股票
  • 东莞商城网站推广建设seo怎么优化武汉厂商
  • 南京做网站具体需要多少钱海南seo快速排名优化多少钱
  • 有关建筑网站建设方案免费外链生成器
  • 网站颜色搭配技巧alexa全球网站排名分析
  • 题库小程序源码郑州网站关键词优化公司
  • 网站怎么做成二维码新闻头条今天最新消息
  • css网站布局原码最有效的推广方式
  • wordpress集成vue优化seo是什么意思
  • 网站短信验证码怎么做关键词在线听免费
  • 中国住房和城乡建设部网站企业网站建设需求分析
  • 万泉河网站建设最近新闻内容
  • 做外贸必须建网站吗搜索引擎排名优化seo
  • 私人设计网站推荐网络营销策划方案ppt
  • 沈阳网站开发网站统计哪个好用
  • h5制作成品seo研究协会
  • htm网站制作网站seo诊断
  • 网站名字重复宁波seo网络推广推荐
  • 什么是手机网站完整的网页设计代码
  • wordpress热门标签调用seo人人网
  • 林州网站建设哪家便宜百度教育app
  • 找人做网站需要什么软件百度seo入驻
  • 网站建设服务器搭建百度商家平台客服电话
  • 网站改版设计要多久南宁网络推广软件
  • 网络工程师证书考取条件武汉网站营销seo方案
  • 南昌网站seo哪家公司好百度引擎入口官网
  • 今日头条新闻2022太原seo优化公司