当前位置: 首页 > news >正文

重庆市建设工程安全管理信息网做seo的网站推广

重庆市建设工程安全管理信息网,做seo的网站推广,建站程序asp,网站设计和网站建设karpathy/nanoGPT: The simplest, fastest repository for training/finetuning medium-sized GPTs. (github.com) 原有模型使用的莎士比亚的戏剧数据集, 如果需要一个写唐诗机器人#xff0c;需要使用唐诗的文本数据#xff0c; 一个不错的唐诗#xff0c;宋词数据的下载…karpathy/nanoGPT: The simplest, fastest repository for training/finetuning medium-sized GPTs. (github.com) 原有模型使用的莎士比亚的戏剧数据集, 如果需要一个写唐诗机器人需要使用唐诗的文本数据 一个不错的唐诗宋词数据的下载资源地址 https://github.com/chinese-poet 这个数据集里面包含搜集到的唐诗宋词元曲小说文本数据。 一 数据准备 1. 先下载全唐诗数据保存到 data/poemtext/tang-poetry下 2. 进行数据的预处理 format-data.py # -*- coding: utf-8 -*- import glob import json datas_jsonglob.glob(./tang-poetry/poet*.json) #1匹配所有唐诗json文件for data_json in datas_json[:]: #2处理匹配的每一个文件with open(data_json,r,encodingutf-8) as f:ts_data json.load(f)for each_ts in ts_data[:]: #3处理文件中每段数据只要五言诗和2句的paragraphs_list each_ts[paragraphs]if len(paragraphs_list) 2 and len(paragraphs_list[0])12 and len(paragraphs_list[1]) 12:with open(tang_poet.txt,a,encodingutf-8) as f2:f2.write(.join(paragraphs_list))f2.write(\n)f open(tang_poet.txt,r,encodingutf-8) print(len(f.readlines())) prepare.py import os import requests import tiktoken import numpy as np# download the tiny shakespeare dataset input_file_path os.path.join(os.path.dirname(__file__), tang_poet.txt) with open(input_file_path, r) as f:data f.read() n len(data) train_data data[:int(n*0.9)] val_data data[int(n*0.9):]# encode with tiktoken gpt2 bpe enc tiktoken.get_encoding(gpt2) train_ids enc.encode_ordinary(train_data) val_ids enc.encode_ordinary(val_data) print(ftrain has {len(train_ids):,} tokens) print(fval has {len(val_ids):,} tokens)# export to bin files train_ids np.array(train_ids, dtypenp.uint16) val_ids np.array(val_ids, dtypenp.uint16) train_ids.tofile(os.path.join(os.path.dirname(__file__), train.bin)) val_ids.tofile(os.path.join(os.path.dirname(__file__), val.bin)) 二 配置文件准备 参考   train_shakespeare_char.py 三 开始训练 参考   train_shakespeare_char.py # mac pro m1机器上 python3 train.py config/train_poemtext_char.py --devicemps --compileFalse --eval_iters20 --log_interval1 --block_size64 --batch_size12 --n_layer4 --n_head4 --n_embd128 --max_iters1000 --lr_decay_iters1000 --dropout0.0 四 生成唐诗 python3 sample.py --out_dirout-poemtext-char --devicemps参考 迷你版ChatGPT开源教你怎么用nanoGPT训练一个写小说的AI机器人 - 知乎 (zhihu.com) Gpt进阶(二): 以古诗集为例,训练一个自己的古诗词gpt模型 - 知乎 (zhihu.com)
http://www.tj-hxxt.cn/news/227462.html

相关文章:

  • 玄武模板网站制作点击查看网站设计的人员分工
  • 设计专业新手网站南京高端网站制作公司哪家好
  • 网站开发的甘特图认证空间如何显示网站
  • 长春一大网站做信息网站能挣钱吗
  • 堆龙德庆网站建设列表网推广收费标准
  • 域名绑定ip网站吗如何做微信小程序店铺
  • 张掖艺能网站建设零基础月做网站多久
  • 企业网站php模版wordpress占用资源大
  • 河南网站建设公司|河南网站建设价格费用招代理商的网站
  • 杭州制作网站公司网站建设出找不到网页
  • 微网站设计基本要求手表官方网站
  • 网站建设在电子商务中的作用的看法新乡网站优化公司推荐
  • wordpress站标签打开空白出入库管理系统免费版
  • 做网站头部为什么很多代码商超设计
  • 网站建设公司人员组成专门做自由行的网站
  • 网站建设的系统设计程序开发是什么专业
  • 网站建设便宜不可信手机自己怎么建电影网站
  • 苏州工业园区质安监站网址WordPress料神
  • 网站建设和app制作如何注册一个设计网站
  • wordpress网站源码公司网站建设哪家正规
  • 陕西网站建设推广公司加强网站建设的制度
  • 杭州知名的企业网站建设做网站用什么开源程序
  • 门户网站静态页面3g手机网站源码
  • 希尔顿酒店网站建设的优点网站建设汇报稿
  • 顺义重庆网站建设开发技术网站开发技术
  • 生道网站建设平台天元建设集团有限公司张桂玉丑闻
  • 永康网站优化网店代运营公司
  • 河南做网站最好的公司wordpress删除仪表盘
  • 深圳企业网站制作公司哪家好西宁市网站建设高端
  • 企业门户网站的建设费用如何将wordpress上传