当前位置: 首页 > news >正文

兰州网站设计制作宁波网站推广公司有哪些

兰州网站设计制作,宁波网站推广公司有哪些,租电信服务器开网站,想学做网站学那个软件好文章目录 1. 引入SwanLabCallback2. 传入Trainer3. 完整案例代码4. GUI效果展示 TRL (Transformers Reinforcement Learning,用强化学习训练Transformers模型) 是一个领先的Python库,旨在通过监督微调(SFT)、近端策略优化&#xf…

文章目录

    • 1. 引入SwanLabCallback
    • 2. 传入Trainer
    • 3. 完整案例代码
    • 4. GUI效果展示

TRL (Transformers Reinforcement Learning,用强化学习训练Transformers模型) 是一个领先的Python库,旨在通过监督微调(SFT)、近端策略优化(PPO)和直接偏好优化(DPO)等先进技术,对基础模型进行训练后优化。TRL 建立在 🤗 Transformers 生态系统之上,支持多种模型架构和模态,并且能够在各种硬件配置上进行扩展。

logo

你可以使用Trl快速进行模型训练,同时使用SwanLab进行实验跟踪与可视化。

Demo

1. 引入SwanLabCallback

from swanlab.integration.transformers import SwanLabCallback

SwanLabCallback是适配于Transformers的日志记录类。

SwanLabCallback可以定义的参数有:

  • project、experiment_name、description 等与 swanlab.init 效果一致的参数, 用于SwanLab项目的初始化。
  • 你也可以在外部通过swanlab.init创建项目,集成会将实验记录到你在外部创建的项目中。

2. 传入Trainer

from swanlab.integration.transformers import SwanLabCallback
from trl import SFTConfig, SFTTrainer...# 实例化SwanLabCallback
swanlab_callback = SwanLabCallback(project="trl-visualization")trainer = SFTTrainer(...# 传入callbacks参数callbacks=[swanlab_callback],
)trainer.train()

3. 完整案例代码

使用Qwen2.5-0.5B-Instruct模型,使用Capybara数据集进行SFT训练:

from trl import SFTConfig, SFTTrainer
from datasets import load_dataset
from swanlab.integration.transformers import SwanLabCallbackdataset = load_dataset("trl-lib/Capybara", split="train")swanlab_callback = SwanLabCallback(project="trl-visualization",experiment_name="Qwen2.5-0.5B-SFT",description="测试使用trl框架sft训练"
)training_args = SFTConfig(output_dir="Qwen/Qwen2.5-0.5B-SFT",per_device_train_batch_size=1,per_device_eval_batch_size=1,num_train_epochs=1,logging_steps=20,learning_rate=2e-5,)trainer = SFTTrainer(args=training_args,model="Qwen/Qwen2.5-0.5B-Instruct",train_dataset=dataset,callbacks=[swanlab_callback]
)trainer.train()

DPO、GRPO、PPO等同理,只需要将SwanLabCallback传入对应的Trainer即可。

4. GUI效果展示

超参数自动记录:

ig-hf-trl-gui-2

指标记录:

ig-hf-trl-gui-1

http://www.tj-hxxt.cn/news/41466.html

相关文章:

  • 开公司可以在哪些网站做推广百度seo培训公司
  • 服务器出租深圳网站优化推广方案
  • 网站开发答辩演讲福建网络seo关键词优化教程
  • 做类似淘宝网站多少钱网站模板库
  • wordpress站点费用西安关键词排名推广
  • 色一把做最好网站138ip查询网域名解析
  • 做网站公司有什么出路推广通
  • 正规的网站建设专业公司电商seo优化
  • 代做土木工程专业毕业设计网站提升排名
  • python培训班丹东网站seo
  • 做网站能设置关键词在百度中搜索到seo怎么优化排名
  • 南京公司网站建设怎么收费今日实时热点新闻事件
  • 网站开发专业就业指导抖音推广运营公司
  • 南京建设企业网站海淀区seo搜索引擎
  • iis搭建网站怎么做前端旺道网站排名优化
  • wordpress主页加音乐我们seo
  • 一个网站做数据分析要多少钱百度sem代运营
  • WordPress开启me北京seo培训机构
  • 静态网站怎么入侵app代理推广合作50元
  • 政府 门户网站 互动平台 方案网站自动收录
  • 做网站的技术盏生活中的网络营销有哪些
  • 要建设一个网站百度企业号
  • 织梦cms怎么做网站地图武汉网站建设方案优化
  • 免费做公司网站能在百度上搜索的到电销名单渠道在哪里找
  • 网站建设优化服务机构微信软文怎么写
  • 网站开发什么语言创建一个网站需要什么
  • 百度提交网站多久收录郑州专业seo首选
  • 网站登录密码忘记免费的seo网站下载
  • o2o网站建设特色百度2022最新版本
  • 北京网站建设费用免费建站的网站哪个好