当前位置: 首页 > news >正文

有哪些做简历的好网站镇江关键字优化公司

有哪些做简历的好网站,镇江关键字优化公司,河北seo推广公司,呼和浩特 网站建设关于GPT的代码细节,这里梳理了一下: 数据集构造 原始数据集schema: inputwho is your favorite basketball player? outputOf course Kobe Bryant!那么在构造训练集时,根据chunk size构造多个输入: input_1who is …

关于GPT的代码细节,这里梳理了一下:

数据集构造

原始数据集schema:

input=who is your favorite basketball player?
output=Of course Kobe Bryant!

那么在构造训练集时,根据chunk size构造多个输入:

input_1=who is your favorite basketball player? Of
input_2=who is your favorite basketball player? Of course
......
input_n-1=who is your favorite basketball player? Of course Kobe Bryant!
input_n=who is your favorite basketball player? Of course Kobe Bryant! <EOS>

由于训练任务是下一个单词预测,所以 x = i n p u t [ : − 1 ] , y = i n p u t [ 1 : ] x=input[:-1], y=input[1:] x=input[:1],y=input[1:]

loss

x x x是模型可见已知的,需要mask掉,不算入loss:

y[:-1] = -1
loss = F.cross_entropy(logits.view(-1, logits.size(-1)), targets.view(-1), ignore_index=-1)

生成

在karpathy/minGPT项目中,是直接粗暴地生成固定长度的文本。这样做的问题就是生成的文本无法判断何处阶段。

在构造模型输入的时候,我们就加入了 <EOS> token,来标记文本的结束。那么在推理阶段,如果碰到该token,则结束生成:

if token == "<EOS>":break

参考

  • GPT2LMHeadModel
  • mingpt
  • GPT2-NewsTitle
http://www.tj-hxxt.cn/news/13536.html

相关文章:

  • 怎么做赌博网站的代理竞价推广员月挣多少
  • 怎么做网站的签约编辑网店推广营销方案
  • 建设网站制作公司如何选择班级优化大师头像
  • 东莞企业网站广州seo优化排名公司
  • 做网站建设的网站成都网站排名生客seo怎么样
  • mcms怎么做网站公司怎么推广网络营销
  • 建设局网站授权委托书信息推广
  • 网站到期后如何转域名2024小学生时事新闻十条
  • 什么是网站的权重东莞关键词排名推广
  • 招代理的网站要怎么做的巨量算数关键词查询
  • 3合1网站建设哪家好乐陵市seo关键词优化
  • 一个企业网站文章多少适合私域营销
  • 做网站的会计分录软文推广广告公司
  • 用小程序做视频网站今日新闻最新
  • 哪个威客网站做翻译最赚钱市场营销试题库(带答案)
  • 网站抓取qq最新实时新闻
  • 怎样做公司网站banner培训网站设计
  • 西安做网站排名软文广告范文
  • 盈利性网站的步骤十大互联网广告公司
  • 公司网站怎么做实名认证为什么sem的工资都不高
  • 滕州市住房城乡建设局网站seo优化服务公司
  • 网站建设实训报告模板免费网站大全下载
  • 做简历网站知乎百度云登录首页
  • 做酒的网站有哪些做网站平台需要多少钱
  • 外贸都用什么网站seo站长网
  • 手机网站自动跳转怎么解决北京seoqq群
  • 用织梦建网站免费的网站关键词查询工具
  • 最好科技上海网站建设百度学术免费查重入口
  • 如何写销售计划书方案优化大师手机版下载安装app
  • 做旅游的网站 是什么风格小广告