当前位置: 首页 > news >正文

分销网站建设网易云课堂的网站建设特点

分销网站建设,网易云课堂的网站建设特点,专业营销团队公司,专业的企业智能建站制造厂家1.BERT-wwm 1-1 Whole Word Masking Whole Word Masking (wwm)是谷歌在2019年5月31日发布的一项BERT的升级版本#xff0c;主要更改了原预训练阶段的训练样本生成策略。 原有基于WordPiece的分词方式会把一个完整的词切分成若干个子词#xff0c;在生成训练样本时#xff…1.BERT-wwm 1-1 Whole Word Masking Whole Word Masking (wwm)是谷歌在2019年5月31日发布的一项BERT的升级版本主要更改了原预训练阶段的训练样本生成策略。  原有基于WordPiece的分词方式会把一个完整的词切分成若干个子词在生成训练样本时这些被分开的子词会随机被mask。 在Whole Word Masking (wwm)中如果一个完整的词的部分WordPiece子词被mask则同属该词的其他部分也会被mask。这缓解了在训练前 BERT 中屏蔽部分 Wordpiece 分词的缺点。 2.Chinese-BERT-wwm 2-1 中文BERT-WWM 2019年哈工大和科大讯飞联合发表中文BERT-WWM模型的论文使用中文文本对整个单词进行掩蔽即屏蔽整个单词而不是屏蔽汉字。由于谷歌官方发布的BERT中中文以字粒度进行切分没有考虑到传统NLP中的中文分词。 Chinese-BERT-wwm将 Whole Word Mask的方法应用在了中文中使用了中文维基百科包括简体和繁体进行训练并且使用了哈工大LTP作为分词工具即对组成同一个词的汉字全部进行Mask。 2-2 样例 3.总结 BERT-WWM对Bert的改进主要体现在mask的方式上使用全词mask。 其改进点如下BERT-WWM不仅仅是连续mask实体词和短语而是连续mask所有能组成中文词语的字。具体做法是针对中文如果一个完整的词的部分字被mask则同属该词的其他部分也会被mask即对组成同一个词的汉字全部进行Mask即为全词Mask。 这样做的目的是预训练过程中模型能够学习到词的语义信息训练完成后字的embedding就具有了词的语义信息了这对各类中文NLP任务都是友好的。
http://www.tj-hxxt.cn/news/142975.html

相关文章:

  • asp网站如何做伪静态河南省工程建设信息网一体化平台
  • 自己建立网站后怎么做淘客免费推广的方式
  • 外包网络推广公司怎么选长沙百家号seo
  • 临夏网站制作百度seo发包工具
  • 网站逻辑结构优化是指seo优化关键词
  • 域名抢注网站企业网页建设公司联系电话
  • 临海房产中介网站如何制作网站建设 制作公司
  • 张家港 网站制作网站建设流程包括哪些环节
  • 做t恤网站 一件也可以做网站建设项目可行性分析
  • 网站开发教育类网站广告js代码添加
  • 电商网站建设策划书小制作 简单 步骤
  • 做网站有哪些好公司域名出售网站
  • 设计网站栏目企业公示信息查询系统浙江
  • c#网站开发网易云课堂百度云下载天津关键词优化网站
  • 兴义市网站建设我做淘宝网站卖东西怎么激活
  • 中国银行网站建设wordpress返回html原理
  • 如何设计一个公司网站步骤自助网站建设哪家好
  • 专业下载网站源码网站设计怎么做一点首页就跳转
  • 求职网站开发开题报告株洲网站优化
  • 做宣传海报的网站图表生成网站
  • 做个网站要多少钱 一般网站开发设计需求文档
  • 公司网站介绍模板 html凌哥seo节点
  • 上海专业网站制作设计公司vultr安装wordpress
  • 天津做网站哪家好儿童影楼网站设计
  • 建设商城网站的难点网站title在哪里
  • 工信部网站备案管理系统dede网站搬家
  • 烟台优化网站公司公司域名注册后怎么建设网站
  • js网站模板下载网站管理工作
  • 网站开发如何修改域名视频制作和剪辑教程
  • 做网站的怎么赚钱2022中国互联网公司市值排名