当前位置: 首页 > news >正文

地税网站如何做税种确认做餐饮网站

地税网站如何做税种确认,做餐饮网站,网站备案 影响,js跳转网站思维树 (ToT) 对于需要探索或预判战略的复杂任务来说#xff0c;传统或简单的提示技巧是不够的。最近#xff0c;Yao et el. (2023)(opens in a new tab) 提出了思维树#xff08;Tree of Thoughts#xff0c;ToT#xff09;框架#xff0c;该框架基于思维链提示进行了总…思维树 (ToT) 对于需要探索或预判战略的复杂任务来说传统或简单的提示技巧是不够的。最近Yao et el. (2023)(opens in a new tab) 提出了思维树Tree of ThoughtsToT框架该框架基于思维链提示进行了总结引导语言模型探索把思维作为中间步骤来解决通用问题。 ToT 维护着一棵思维树思维由连贯的语言序列表示这个序列就是解决问题的中间步骤。使用这种方法LM 能够自己对严谨推理过程的中间思维进行评估。LM 将生成及评估思维的能力与搜索算法如广度优先搜索和深度优先搜索相结合在系统性探索思维的时候可以向前验证和回溯。 ToT 框架原理如下 图片援引自Yao et el. (2023)(opens in a new tab) ToT 需要针对不同的任务定义思维/步骤的数量以及每步的候选项数量。例如论文中的“算 24 游戏”是一种数学推理任务需要分成 3 个思维步骤每一步都需要一个中间方程。而每个步骤保留最优的best 5 个候选项。 ToT 完成算 24 的游戏任务要执行广度优先搜索BFS每步思维的候选项都要求 LM 给出能否得到 24 的评估“sure/maybe/impossible”一定能/可能/不可能 。作者讲到“目的是得到经过少量向前尝试就可以验证正确sure的局部解基于‘太大/太小’的常识消除那些不可能impossible的局部解其余的局部解作为‘maybe’保留。”每步思维都要抽样得到 3 个评估结果。整个过程如下图所示 图片援引自Yao et el. (2023)(opens in a new tab) 从下图中报告的结果来看ToT 的表现大大超过了其他提示方法 图片援引自Yao et el. (2023)(opens in a new tab) 这里(opens in a new tab)还有这里(opens in a new tab)可以找到代码例子。 从大方向上来看Yao et el. (2023)(opens in a new tab) 和 Long (2023)(opens in a new tab) 的核心思路是类似的。两种方法都是以多轮对话搜索树的形式来增强 LLM 解决复杂问题的能力。主要区别在于 Yao et el. (2023)(opens in a new tab) 采用了深度优先DFS/广度优先BFS/集束beam搜索而 Long (2023)(opens in a new tab) 则提出由强化学习Reinforcement Learning训练出的 “ToT 控制器”ToT Controller来驱动树的搜索策略(包括什么时候回退和搜索到哪一级回退等等)。深度优先/广度优先/集束搜索是通用搜索策略并不针对具体问题。相比之下由强化学习训练出的 ToT 控制器有可能从新的数据集学习或是在自对弈AlphaGo vs. 蛮力搜索的过程中学习。因此即使采用的是冻结的 LLM基于强化学习构建的 ToT 系统仍然可以不断进化学习新的知识。 Hulbert (2023)(opens in a new tab) 提出了思维树ToT提示法将 ToT 框架的主要概念概括成了一段简短的提示词指导 LLM 在一次提示中对中间思维做出评估。ToT 提示词的例子如下 假设三位不同的专家来回答这个问题。所有专家都写下他们思考这个问题的第一个步骤然后与大家分享。然后所有专家都写下他们思考的下一个步骤并分享。以此类推直到所有专家写完他们思考的所有步骤。只要大家发现有专家的步骤出错了就让这位专家离开。请问... 检索增强生成 (RAG) 通用语言模型通过微调就可以完成几类常见任务比如分析情绪和识别命名实体。这些任务不需要额外的背景知识就可以完成。 要完成更复杂和知识密集型的任务可以基于语言模型构建一个系统访问外部知识源来做到。这样的实现与事实更加一性生成的答案更可靠还有助于缓解“幻觉”问题。 Meta AI 的研究人员引入了一种叫做检索增强生成Retrieval Augmented GenerationRAG(opens in a new tab)的方法来完成这类知识密集型的任务。RAG 把一个信息检索组件和文本生成模型结合在一起。RAG 可以微调其内部知识的修改方式很高效不需要对整个模型进行重新训练。 RAG 会接受输入并检索出一组相关/支撑的文档并给出文档的来源例如维基百科。这些文档作为上下文和输入的原始提示词组合送给文本生成器得到最终的输出。这样 RAG 更加适应事实会随时间变化的情况。这非常有用因为 LLM 的参数化知识是静态的。RAG 让语言模型不用重新训练就能够获取最新的信息基于检索生成产生可靠的输出。 Lewis 等人2021提出一个通用的 RAG 微调方法。这种方法使用预训练的 seq2seq 作为参数记忆用维基百科的密集向量索引作为非参数记忆使通过神经网络预训练的检索器访问。这种方法工作原理概况如下 图片援引自: Lewis et el. (2021)(opens in a new tab) RAG 在 Natural Questions(opens in a new tab)、WebQuestions(opens in a new tab) 和 CuratedTrec 等基准测试中表现抢眼。用 MS-MARCO 和 Jeopardy 问题进行测试时RAG 生成的答案更符合事实、更具体、更多样。FEVER 事实验证使用 RAG 后也得到了更好的结果。 这说明 RAG 是一种可行的方案能在知识密集型任务中增强语言模型的输出。 最近基于检索器的方法越来越流行经常与 ChatGPT 等流行 LLM 结合使用来提高其能力和事实一致性。 LangChain 文档中可以找到一个使用检索器和 LLM 回答问题并给出知识来源的简单例子(opens in a new tab)。 自动推理并使用工具 (ART) 使用 LLM 完成任务时交替运用 CoT 提示和工具已经被证明是一种即强大又稳健的方法。这类方法通常需要针对特定任务手写示范还需要精心编写交替使用生成模型和工具的脚本。Paranjape et al., (2023)(opens in a new tab)提出了一个新框架该框架使用冻结的 LLM 来自动生成包含中间推理步骤的程序。 ARTAutomatic Reasoning and Tool-use的工作原理如下 接到一个新任务的时候从任务库中选择多步推理和使用工具的示范。在测试中调用外部工具时先暂停生成将工具输出整合后继续接着生成。 ART 引导模型总结示范将新任务进行拆分并在恰当的地方使用工具。ART 采用的是零样本形式。ART 还可以手动扩展只要简单地更新任务和工具库就可以修正推理步骤中的错误或是添加新的工具。这个过程如下 图片援引自: Paranjape et al., (2023)(opens in a new tab) 在 BigBench 和 MMLU 基准测试中ART 在未见任务上的表现大大超过了少样本提示和自动 CoT配合人类反馈后其表现超过了手写的 CoT 提示。 下面这张表格展示了 ART 在 BigBench 和 MMLU 任务上的表现 图片援引自: Paranjape et al., (2023)
http://www.tj-hxxt.cn/news/228710.html

相关文章:

  • 石家庄网站建设推广报价软件开发项目总结报告
  • 沈阳旅游集团网站建设泛微oa手机版
  • 外贸公司网站建设费会计科目建立门派
  • 唐山制作网站的公司上海4a广告公司
  • 仿站WordPress申请免费个人网站空间
  • 半导体网站建设网站制作大概费用
  • 国外购物网站平台有哪些公益平台网站怎么做
  • 寿县住房与城乡建设局网站西安建筑网站建设
  • 嵌入式软件开发培训班365优化大师软件下载
  • 确定网站建设的目的装饰网站建设重要性
  • 大连建设网站公司线上销售培训班课程
  • 室内设计网站公司wordpress侧栏小工具栏
  • 网站关键字多少合适微信公众网站开发
  • 手机制作最简单钓鱼网站html5网站开发需要框架吗
  • 网站怎样做排名百度文库首页官网
  • 去什么网站做推广电脑做服务器上传网站
  • 网站建设与管理课程总结做网站做电脑版还是手机版好
  • asp手机网站郑州网站制作公司
  • 做网站学哪方面知识购物网站成功案例
  • 网站稳定性不好的原因图片展示 wordpress
  • 制作一个网站数据库怎么做怀化优化营商环境
  • 公司网站怎么自己做APP网站建设开发企业发展
  • 前端做网站一般用什么框架360街景地图最新版
  • 临汾做网站百度旅游官网
  • 如何建立一个自己的网站?怎么建设ftp网站
  • 哈密网站建设贺州市城乡住房建设厅网站
  • 广告联盟没有网站怎么做汕头网页设计
  • 沈阳餐饮网站建设网站开发工具 比较好
  • linux做网站配置小程序加盟代理平台
  • 在演示文稿上网站怎么做淘宝客网站模块