当前位置: 首页 > news >正文

丰台网站建设公司网络推广网站有哪些

丰台网站建设公司,网络推广网站有哪些,网站备案的要求是,求个网站知乎这里写自定义目录标题 介绍模型推理的输出过程方案原始Token输出RM输出(回归任务) 介绍 奖励函数模型 (Reward Model) 是人工智能 (AI) 中的一种方法,模型因其对给定提示的响应而获得奖励或分数。现在的文章清一色的讲解RM的训练&#xff0c…

这里写自定义目录标题

  • 介绍
  • 模型推理的输出过程方案
    • 原始Token输出
    • RM输出(回归任务)

介绍

奖励函数模型 (Reward Model) 是人工智能 (AI) 中的一种方法,模型因其对给定提示的响应而获得奖励或分数。现在的文章清一色的讲解RM的训练,但是没有讲解RM是如何输出一个分数的。本文只讲RM的输出,以补充资料的缺乏。RM通常采用Llama-7B模型,本文也沿用这一模型,同时模型的推理计算过程作为已知的知识,只讲解推理最后的输出部分。本文章先介绍传统Llama模型原始Token输出过程,再讲解RM的输出。以作为对比更好的学习。

模型推理的输出过程方案

  1. 原始Token输出

预训练语言模型(如LLaMA、GPT等)的默认任务是语言建模,它们的输出是针对每个token的概率分布(即词汇表中的每个词的概率)
在这里插入图片描述在这里插入图片描述
注,W矩阵在llama-7b中是lm_head.weight

  1. RM输出(回归任务)

写在前面:回归任务就不需要原始Token输出中的logits矩阵的计算(即图中H*W+B的部分)和softmax的计算。

  • 处理每个token的隐藏状态以生成全局表示
    隐藏状态的介绍:
    在这里插入图片描述
    1) 平均池化(Mean Pooling)
    在这里插入图片描述
    2) 最大池化(Max Pooling)在这里插入图片描述
  • 回归任务输出分数:

在这里插入图片描述

http://www.tj-hxxt.cn/news/5302.html

相关文章:

  • 程序外包东莞关键词优化平台
  • wordpress 微商网站西安百度网站排名优化
  • 建设网站需要什么2022今天刚刚发生地震了
  • 长安仿做网站免费b站推广网站链接
  • 手机怎么向WordPress传文件北京网站优化培训
  • 用淘宝做公司网站发布推广信息的网站
  • 鄄城住房和城乡建设局网站湖南好搜公司seo
  • 查询个人房产信息网站提高工作效率的软件
  • 专业医院网站建设seo优化培训机构
  • 什么网站做调查能赚钱吗搜索引擎排名竞价
  • 设计logo网站免网站软件免费下载
  • 专业做网站的技术人员郑州靠谱seo整站优化
  • 下载百度官方网站超级优化大师
  • 旅游网站开发目标做百度推广需要什么条件
  • 网站建设尺寸大小合肥网站推广公司哪家好
  • 两个网站链接如何做怎么做网站教程视频
  • 一个女装店网站建设的策划模板百度网盘登陆入口
  • 制作一个公司网站的流程宁波seo快速优化公司
  • 做360网站优化快速排今日新闻简报
  • 绵阳公司商务网站制作常见的网络营销策略都有哪些
  • 花店网站推广方案下载百度地图2022最新版官方
  • 如何提高网站响应速度有站点网络营销平台
  • 06627网页制作与网站建设友情链接交换软件
  • 东莞建设网站公司简介海外营销
  • 网页翻译的快捷键是什么seo服务靠谱吗
  • wordpress 禁止评论上海搜索优化推广哪家强
  • 中国三农建设工作委员会官方网站精准营销案例
  • 网站编程赚钱在线crm网站
  • 怎么做网络彩票网站服务营销案例100例
  • 网站建设 推广seow