当前位置: 首页 > news >正文

php程序员网站开发建设谷歌seo课程

php程序员网站开发建设,谷歌seo课程,网站定位 怎么做,33vu页面访问升级版本优点 首先,bert的创新点在于利用了双向transformer,这就跟openai的gpt有区别,gpt是采用单向的transformer,而作者认为双向transformer更能够融合上下文的信息。这里双向和单向的区别在于,单向只跟当前位置之前的tocke…

优点

首先,bert的创新点在于利用了双向transformer,这就跟openai的gpt有区别,gpt是采用单向的transformer,而作者认为双向transformer更能够融合上下文的信息。这里双向和单向的区别在于,单向只跟当前位置之前的tocken相连,双向与当前位置之后的tocken也有连接。跟ELMo相比的优势在于,transformer对特征的提取能力比lstm要强得多。
在这里插入图片描述

模型输入

首先是对输入的句子做tocken embedding,也就是将句子映射为一维向量,可以是word2vec的结果,猜想一下,如果不是维度过高也可以是one-hot,第二部分segment embedding 是在模型训练过程中自动学习得到的,猜想这里可以用全连接,也可以用transformer,最后是position embedding,主要用以区别“我喜欢妈妈”和“妈妈喜欢我”,虽然这两句话的单词一样,但是因为位置不同,所以含义不同。
在这里插入图片描述

模型参数

BERTBASE (L=12, H=768, A=12, Total Parameters=110M)

BERTLARGE (L=24, H=1024,
A=16, Total Parameters=340M).

L表示层数,H为隐层维度,A为注意力头的数量

两种任务

Masked LM

这个任务主要是随机将某句话的某几个位置做处理,这里的处理可能是3种,80%的概率用[mask]代替,10%的概率保留原来的单词,10%的概率用其他单词代替。就像是英语考试中的完形填空
在这里插入图片描述

Next Sentence Prediction (NSP)

主要利用输入的第一个tocken[cls]和中间的tocken[sep],其中cls用来表示后面一句是否为前一句的下一句,sep表示两个句子的间隔。从文本语料库中随机选择 50% 正确语句对和 50% 错误语句对进行训练。就像是与语文中的句子排序。

参考:BERT模型的详细介绍

http://www.tj-hxxt.cn/news/82056.html

相关文章:

  • 北京空间优化平台在线seo推广软件
  • 西宁 网站建设济宁百度推广开户
  • 自己做免费网站seo优化易下拉排名
  • 公司做网站要三千多吗重庆seo排名方法
  • 建立多个wordpress大连seo按天付费
  • 行业网站联盟百度推广登陆
  • 承接做网站的网站seo网站优化软件
  • 织梦系统如何做网站地图网站建设开发
  • 网站建设填空题爱站工具包下载
  • 京东怎么做轮播图链接网站seo关键词分析表
  • 网站建设哪家好公司seo营销是什么
  • 土特产直营网站建设代码中囯军事网
  • 做一个大型网站2023年8月新冠疫情
  • 做地方门户网站的资质自建站平台
  • 制作网站先做前端还是后端成人电脑培训班办公软件
  • 绵阳专门做网站的公司优化服务
  • html代码换行网站文章优化技巧
  • 摄影网站采用照片做宣传 版权费是多少seo优化报价公司
  • 西宁建设网站多少钱关键词挖掘工具爱站网
  • 有源码做网站全网热搜榜第一名
  • 江门百度网站快速优化郑州聚商网络科技有限公司
  • 怎样做国际网站对网络推广的理解
  • 宿迁企业网站建设win10最强优化软件
  • 做网站怎么这么贵创建自己的网页
  • 学网站开发哪里好网络营销案例实例
  • 你今天的好运是你前面积攒的善良seo软件开发
  • 环球下载杭州网海外seo网站推广
  • 网站页面怎么做识别二维码网站建站系统
  • 做宠物网站赚钱吗网站百度权重查询
  • 手机3g网站推广普通话内容50字