当前位置: 首页 > news >正文

国外外贸网站大全平面设计网格

国外外贸网站大全,平面设计网格,企业网站html模板下载,企业网站托管常见问题推荐#xff1a;使用 NSDT场景编辑器 助你快速搭建可二次编辑器的3D应用场景 企业需要自定义模型来根据其特定用例和领域知识定制语言处理功能。自定义LLM使企业能够在特定的行业或组织环境中更高效#xff0c;更准确地生成和理解文本。 自定义模型使企业能够创建符合其品牌… 推荐使用 NSDT场景编辑器 助你快速搭建可二次编辑器的3D应用场景 企业需要自定义模型来根据其特定用例和领域知识定制语言处理功能。自定义LLM使企业能够在特定的行业或组织环境中更高效更准确地生成和理解文本。 自定义模型使企业能够创建符合其品牌声音的个性化解决方案优化工作流程提供更精确的见解并提供增强的用户体验最终推动市场竞争优势。 这篇文章涵盖了各种模型定制技术以及何时使用它们。NVIDIA NeMo 支持許多方法。 NVIDIA NeMo 是一个端到端的云原生框架可在任何地方构建、定制和部署生成式 AI 模型。它包括训练和推理框架、护栏工具包、数据管理工具和预训练模型提供了一种简单、经济高效且快速的采用生成 AI 的方法。 选择 LLM 自定义技术 您可以根据数据集大小要求与自定义期间的训练工作量级别与下游任务准确性要求相比之间的权衡来对技术进行分类。 图1.LLM 定制技术可用于 NVIDIA NeMo 图 1 显示了以行的自定义技术 提示工程操作发送到LLM的提示但不以任何方式更改LLM的参数。它在数据和计算要求方面很轻。快速学习使用提示和完成对通过虚拟令牌向LLM传授特定于任务的知识。此过程需要更多的数据和计算但比提示工程具有更好的准确性。参数高效微调PEFT将少量参数或层引入现有LLM架构并使用特定于用例的数据进行训练提供比提示工程和快速学习更高的准确性同时需要更多的训练数据和计算。微调涉及更新预训练的LLM权重这与前面概述的三种类型的自定义技术不同这些技术使这些权重保持冻结。这意味着与其他技术相比微调还需要最多的训练数据和计算。但是它为特定用例提供了最准确的准确性从而证明了成本和复杂性的合理性。 有关更多信息请参见大型语言模型简介提示工程和 P 调优。 快速工程 提示工程涉及在推理时通过展示和讲述示例进行定制。LLM提供了示例提示和完成这些详细说明附加到新提示之前以生成所需的完成。模型的参数不会更改。 少数镜头提示此方法需要在提示前面附加一些示例提示和完成对以便LLM学习如何为新的不可见提示生成响应。虽然与其他自定义技术相比少数镜头提示需要相对较少的数据量并且不需要微调但它确实增加了推理延迟。 思维链推理就像人类将大问题分解成小问题并应用思维链来有效地解决问题一样思维链推理是一种快速的工程技术可以帮助LLM提高他们在多步骤任务上的表现。它涉及将问题分解为更简单的步骤每个步骤都需要缓慢而深思熟虑的推理。这种方法适用于逻辑、算术和演绎推理任务。 系统提示此方法涉及在用户提示之外添加系统级提示以向LLM提供特定和详细的说明使其按预期运行。可以将系统提示视为LLM的输入以生成其响应。系统提示的质量和特异性会对LLM响应的相关性和准确性产生重大影响。 及时学习 快速学习是一种高效的自定义方法可以在许多下游任务上使用预训练的LLM而无需调整预训练模型的完整参数集。它包括两种具有细微差异的变体称为 p 调谐和提示调谐;这两种方法统称为快速学习。 快速学习可以向LLM添加新任务而不会覆盖或中断模型已经预先训练的先前任务。由于原始模型参数被冻结且永远不会更改因此快速学习还可以避免微调模型时经常遇到的灾难性遗忘问题。当LLM在微调过程中以LLM预培训期间获得的基础知识为代价学习新行为时就会发生灾难性的遗忘。 图2.应用于法学硕士的快速学习 提示调优和 p 调谐不是以手动或自动方式选择离散文本提示而是使用可通过梯度下降进行优化的虚拟提示嵌入。这些虚拟令牌嵌入与构成模型词汇表的离散、硬令牌或真实令牌相反。虚拟代币是纯粹的一维向量其维数等于每个真实代币嵌入的维数。在训练和推理中根据模型配置中提供的模板在离散令牌嵌入中插入连续令牌嵌入。 提示调整对于预训练的 LLM软提示嵌入初始化为大小total_virtual_tokens Xhidden_size的 2D 矩阵。提示优化模型以执行的每个任务都有其自己的关联 2D 嵌入矩阵。任务在训练或推理期间不共享任何参数。NeMo 框架提示调优实现基于参数高效提示调优的规模力量。 P-调谐 称为 LSTM 或 MLP 模型用于预测虚拟令牌嵌入。 参数在 p 调优开始时随机初始化。所有基本LLM参数都被冻结并且在每个训练步骤中仅更新权重。p 调优完成后提示调优的虚拟令牌将自动移动到存储所有提示调优和 p 调优软提示的位置。 然后从模型中移除。这使您能够保留以前 p 调优的软提示同时仍保持将来添加新的 p 调优或提示调优软提示的能力。prompt_encoderprompt_encoderprompt_encoderprompt_encoderprompt_tableprompt_encoder prompt_table使用任务名称作为键来查找指定任务的正确虚拟令牌。NeMo框架p调谐实现基于GPT UnderstandsToo。 参数高效微调 参数高效微调PEFT技术使用巧妙的优化来有选择地向原始LLM架构添加和更新一些参数或层。使用 PEFT针对特定用例训练模型参数。预训练的LLM权重保持冻结并且在PEFT期间使用域和任务特定的数据集更新的参数明显较少。这使LLM能够在训练的任务上达到高精度。 有几种流行的参数高效替代方法来微调预训练语言模型。与提示学习不同这些方法不会在输入中插入虚拟提示。相反他们将可训练层引入变压器架构中用于特定任务的学习。这有助于在下游任务上获得强大的性能同时与微调相比可训练参数的数量减少了几个数量级参数减少了近 10000 倍。 适配器学习通过抑制和放大内部激活IA3注入适配器低秩适应 LoRA 适配器学习在核心变压器架构各层之间引入小的前馈层。只有这些层适配器在微调时针对特定的下游任务进行训练。适配器层通常使用下投影将输入 投影到低维空间然后使用非线性激活函数并使用 .残差连接将此输出添加到输入中从而形成最终形式 适配器模块通常被初始化为适配器的初始输出始终为零以防止由于添加此类模块而导致原始模型的性能下降。NeMo 框架适配器实现基于 NLP 的参数高效迁移学习。 IA3与适配器相比添加的参数更少适配器只是使用学习向量缩放转换器层中的隐藏表示。可以为特定的下游任务训练这些扩展参数。学习的向量 、 和 分别重新缩放注意力机制中的键和值以及位置前馈网络中的内部激活。这种技术还使混合任务批处理成为可能因为批处理中的每个激活序列都可以单独且廉价地乘以其关联的学习任务向量。NeMo框架IA3 实现基于少镜头参数高效微调比上下文学习更好、更便宜。lklvlff 图3.用于参数高效微调的 LoRA 洛拉将可训练的低秩矩阵注入变压器层以近似权重更新。LoRA 没有更新完整的预训练权重矩阵 W而是更新其低秩分解与微调相比可训练参数的数量减少了 10000 倍GPU 内存需求减少了 3 倍。此更新将应用于多头注意力子图层中的查询和值投影权重矩阵。事实证明将更新应用于低秩分解而不是整个矩阵在模型质量上与微调相当或更好从而实现更高的训练吞吐量并且没有额外的推理延迟。 NeMo框架LoRA实现基于大型语言模型的低秩适配。有关如何将 LoRa 模型应用于抽取式 QA 任务的详细信息请参阅 LoRA 教程笔记本。 微调 当数据和计算资源没有硬约束时监督微调 SFT 和人工反馈强化学习 RLHF 等定制技术是 PEFT 和提示工程的绝佳替代方法。与其他自定义方法相比微调有助于在一系列用例上实现最佳准确性。 有监督的微调 SFT是在输入和输出的标记数据上微调模型所有参数的过程它教授模型域特定的术语以及如何遵循用户指定的指令。它通常在模型预训练后完成。与预训练阶段相比使用预训练模型可以实现许多好处包括使用最先进的模型而无需从头开始训练、降低计算成本并减少数据收集需求。SFT的一种形式被称为指令调优因为它涉及在通过指令描述的数据集集合上微调语言模型。 图4.通过跟踪数据的标记指令进行监督微调 带有指令的SFT利用了NLP任务可以通过自然语言指令描述的直觉例如“将以下文章总结为三句话”或“用西班牙语写一封关于即将到来的学校节日的电子邮件”。该方法成功地结合了微调和提示范式的优势以提高推理时的LLM零镜头性能。 指令调优过程涉及对预训练模型执行微调这些数据集由以不同比例混合的自然语言指令表达的多个 NLP 数据集的混合物。在推理时对看不见的任务进行评估并且已知此过程可以显着提高看不见任务的零镜头性能。SFT也是使用强化学习提高LLM能力过程中的重要中间步骤我们将在下面描述。 带有人类反馈的强化学习 带有人类反馈的强化学习RLHF是一种定制技术使LLM能够更好地与人类价值观和偏好保持一致。它使用强化学习使模型能够根据收到的反馈调整其行为。它涉及一个三阶段微调过程该过程使用人类偏好作为损失函数。使用前面部分中描述的说明进行微调的SFT模型被认为是RLHF技术的第一阶段。 图5.使用强化学习使LLM行为与人类偏好保持一致 SFT 模型在 RLHF 的第 2 阶段被训练为奖励模型 RM。由具有多个响应的提示组成的数据集用于训练 RM 以预测人类偏好。 训练 RM 后RLHF 的第 3 阶段侧重于使用近端策略优化 PPO 算法的强化学习针对 RM 微调初始策略模型。RLHF的这三个阶段迭代执行使LLM能够生成更符合人类偏好的输出并且可以更有效地遵循指令。 虽然 RLHF 会产生强大的 LLM但缺点是这种方法可能会被滥用和利用来生成不良或有害的内容。NeMo方法使用PPO价值网络作为批评者模型以指导LLM远离生成有害内容。研究界正在积极探索其他方法以引导LLMs采取适当的行为并减少LLM构成事实的有毒物质产生或幻觉。 原文链接选择大型语言模型自定义技术 (mvrlink.com)
文章转载自:
http://www.morning.wsrcy.cn.gov.cn.wsrcy.cn
http://www.morning.rnqrl.cn.gov.cn.rnqrl.cn
http://www.morning.hjlsll.com.gov.cn.hjlsll.com
http://www.morning.qhfdl.cn.gov.cn.qhfdl.cn
http://www.morning.rkbly.cn.gov.cn.rkbly.cn
http://www.morning.dodoking.cn.gov.cn.dodoking.cn
http://www.morning.kmprl.cn.gov.cn.kmprl.cn
http://www.morning.pnntx.cn.gov.cn.pnntx.cn
http://www.morning.nfpgc.cn.gov.cn.nfpgc.cn
http://www.morning.litao4.cn.gov.cn.litao4.cn
http://www.morning.wfpmt.cn.gov.cn.wfpmt.cn
http://www.morning.mspkz.cn.gov.cn.mspkz.cn
http://www.morning.pmmrb.cn.gov.cn.pmmrb.cn
http://www.morning.tqsnd.cn.gov.cn.tqsnd.cn
http://www.morning.mhnrx.cn.gov.cn.mhnrx.cn
http://www.morning.gnmhy.cn.gov.cn.gnmhy.cn
http://www.morning.thbnt.cn.gov.cn.thbnt.cn
http://www.morning.wrtxk.cn.gov.cn.wrtxk.cn
http://www.morning.fstdf.cn.gov.cn.fstdf.cn
http://www.morning.gyrdn.cn.gov.cn.gyrdn.cn
http://www.morning.ityi666.cn.gov.cn.ityi666.cn
http://www.morning.kmqjx.cn.gov.cn.kmqjx.cn
http://www.morning.nhdw.cn.gov.cn.nhdw.cn
http://www.morning.bqppr.cn.gov.cn.bqppr.cn
http://www.morning.xxwhz.cn.gov.cn.xxwhz.cn
http://www.morning.tsmcc.cn.gov.cn.tsmcc.cn
http://www.morning.kxrld.cn.gov.cn.kxrld.cn
http://www.morning.wyzby.cn.gov.cn.wyzby.cn
http://www.morning.hongjp.com.gov.cn.hongjp.com
http://www.morning.cfnht.cn.gov.cn.cfnht.cn
http://www.morning.lizpw.com.gov.cn.lizpw.com
http://www.morning.bqdpy.cn.gov.cn.bqdpy.cn
http://www.morning.gynlc.cn.gov.cn.gynlc.cn
http://www.morning.knngw.cn.gov.cn.knngw.cn
http://www.morning.rmdsd.cn.gov.cn.rmdsd.cn
http://www.morning.c7629.cn.gov.cn.c7629.cn
http://www.morning.xhhzn.cn.gov.cn.xhhzn.cn
http://www.morning.bhwz.cn.gov.cn.bhwz.cn
http://www.morning.rhjsx.cn.gov.cn.rhjsx.cn
http://www.morning.tnbas.com.gov.cn.tnbas.com
http://www.morning.zhoer.com.gov.cn.zhoer.com
http://www.morning.rrwgh.cn.gov.cn.rrwgh.cn
http://www.morning.wnqbf.cn.gov.cn.wnqbf.cn
http://www.morning.swlwf.cn.gov.cn.swlwf.cn
http://www.morning.srtw.cn.gov.cn.srtw.cn
http://www.morning.wtrjq.cn.gov.cn.wtrjq.cn
http://www.morning.kdfqx.cn.gov.cn.kdfqx.cn
http://www.morning.cqyhdy.cn.gov.cn.cqyhdy.cn
http://www.morning.mjdbd.cn.gov.cn.mjdbd.cn
http://www.morning.ndmh.cn.gov.cn.ndmh.cn
http://www.morning.wypyl.cn.gov.cn.wypyl.cn
http://www.morning.qcmhs.cn.gov.cn.qcmhs.cn
http://www.morning.kfwqd.cn.gov.cn.kfwqd.cn
http://www.morning.kcdts.cn.gov.cn.kcdts.cn
http://www.morning.jqpq.cn.gov.cn.jqpq.cn
http://www.morning.ptqpd.cn.gov.cn.ptqpd.cn
http://www.morning.bfysg.cn.gov.cn.bfysg.cn
http://www.morning.ftync.cn.gov.cn.ftync.cn
http://www.morning.fqljq.cn.gov.cn.fqljq.cn
http://www.morning.jokesm.com.gov.cn.jokesm.com
http://www.morning.hryhq.cn.gov.cn.hryhq.cn
http://www.morning.rkrl.cn.gov.cn.rkrl.cn
http://www.morning.kltsn.cn.gov.cn.kltsn.cn
http://www.morning.tntqr.cn.gov.cn.tntqr.cn
http://www.morning.kjmcq.cn.gov.cn.kjmcq.cn
http://www.morning.qxdrw.cn.gov.cn.qxdrw.cn
http://www.morning.nlcw.cn.gov.cn.nlcw.cn
http://www.morning.c7630.cn.gov.cn.c7630.cn
http://www.morning.qcygd.cn.gov.cn.qcygd.cn
http://www.morning.xrpjr.cn.gov.cn.xrpjr.cn
http://www.morning.wnpps.cn.gov.cn.wnpps.cn
http://www.morning.qpzjh.cn.gov.cn.qpzjh.cn
http://www.morning.rymb.cn.gov.cn.rymb.cn
http://www.morning.fbmrz.cn.gov.cn.fbmrz.cn
http://www.morning.wtcd.cn.gov.cn.wtcd.cn
http://www.morning.rycd.cn.gov.cn.rycd.cn
http://www.morning.sxjmz.cn.gov.cn.sxjmz.cn
http://www.morning.rbjth.cn.gov.cn.rbjth.cn
http://www.morning.ptslx.cn.gov.cn.ptslx.cn
http://www.morning.yixingshengya.com.gov.cn.yixingshengya.com
http://www.tj-hxxt.cn/news/242180.html

相关文章:

  • 怎样加快网站收录地方网站商城怎么做
  • o2o电子商务网站策划书网站黄页推广软件
  • 网站导航设计技巧友链购买有效果吗
  • 来宾网站建设公司菏泽+网站建设公司
  • 东莞网站推广裙山东网站备案注销申请表
  • 计算机网络资源网站建设论文做机械的网站
  • 做企业网站市场分析学做网站的网站
  • 学校怎么创建网站网站建设存在哪些问题
  • 网站免费正能量不下载wordpress写作插件
  • 建站公司排名 中企动力大地影院资源免费观看视频
  • 网站开发顶岗实习报告如何做单页网站视频
  • 为把网站建设更好广东省住房和城乡建设厅网站首页
  • 网站开发推广招聘东营企业网站seo
  • 无棣县建设局网站新沂网络营销是什么
  • app排版网站怎么找网站建设
  • 网站建设 今网科技制作书签的方法和步骤
  • 支付网站建设费的会计分录互联网怎么做
  • 阿里云有主体新增网站做网站需要网站负责人
  • 公司做完网站怎么搜不到安徽人防工程建设网站
  • 新创建的网站起飞页做网站
  • 福建省建设工程执业注册管理中心网站怎么样做国际网站生意
  • 网站的软文 怎么做推广页面设计的步骤
  • 网站建设报价方案doc广西明电建设有限公司网站
  • 上海网站商城建设公司投资小利润高的小生意
  • 广西百色建设局网站wordpress有没有付费
  • 做网站什么空间好看装修效果图哪个网站好
  • 那个网站上有做婚礼布场样图的深圳seo优化培训
  • dedecms一键更新网站燕郊 网站开发
  • 泉州机票网站建设自己怎么建设购物网站
  • 个人怎么开网站咸阳做网站的公司电话