当前位置: 首页 > news >正文

贵阳58同城做网站公司沈阳市和平区建设局网站

贵阳58同城做网站公司,沈阳市和平区建设局网站,四川省建设安全质量监理协会网站,哈尔滨网站开发联系薇前言 大模型的多轮问答难点就是在于如何精确识别用户最新的提问的真实意图#xff0c;而在常见的使用大模型进行多轮对话方式中#xff0c;我接触到的只有两种方式#xff1a; 一种是简单地直接使用 user 和 assistant 两个角色将一问一答的会话内容喂给大模型#xff0c…前言 大模型的多轮问答难点就是在于如何精确识别用户最新的提问的真实意图而在常见的使用大模型进行多轮对话方式中我接触到的只有两种方式 一种是简单地直接使用 user 和 assistant 两个角色将一问一答的会话内容喂给大模型让它能够结合最新的问题靠自己去理解用户的最新的问题的含义。另外一种方式是在会话过程中将历史的问题进行维护再使用另外一个大模型结合最新的问题去理解用户当前的意图。 两种方式都可以但是在我目前的业务上我目前使用的是后者因为比较容易实现效果也不错。 第一种方式 这是使用的是 qwen 的多轮问答 api 要使用这一种方式需要维护一个相当长的历史会话记录 messages 而且要保证 messages 中的 user/assistant 消息交替出现这是一个必须要遵循的条件如果是碰到异常必须要对 messages 中最后的无效对话进行清理。这里就是将理解用户意图和解决用户的问题都混在了一块对于我要做的业务回答内容的不确定性太高而且实现成本也高需要在会话中加入大量业务代码所以果断放弃了。 这里的代码主要实现了一个简易地关于烹饪的对话只有两轮实现逻辑比较简单写的比较粗糙理解意思即可。 ini 复制代码 def multi_round():messages [{role: system, content: 你是一个绝佳的烹饪助手},{role: user, content: 如何做西红柿炖牛腩}]response Generation.call(modelqwen-turbo, messagesmessages, result_formatmessage)if response.status_code HTTPStatus.OK:print(response)messages.append({role: response.output.choices[0][message][role],content: response.output.choices[0][message][content]}) # 将assistant的回复添加到messages列表中else:print(response.message)messages messages[:-1] # 如果响应失败将最后一条user message从messages列表里删除确保 user/assistant 消息交替出现messages.append({role: user, content: 不放糖可以吗}) # 将新一轮的user问题添加到messages列表中response Generation.call(modelqwen-turbo, messagesmessages, result_formatmessage, )if response.status_code HTTPStatus.OK:print(response)messages.append({role: response.output.choices[0][message][role],content: response.output.choices[0][message][content]}) # 将第二轮的assistant的回复添加到messages列表中else:print(response.message)messages messages[:-1] # 如果响应失败将最后一条user message从messages列表里删除确保 user/assistant 消息交替出现第二种方式 在我所做地业务中对于 assistant 的回复不关心主要关心的是用户的问题所以我只关注 user 的历史提问在实现的时候只需要维护一个列表 history始终将最新的用户提问追加即可为了保证列表信息的有效性我始终只维护最后 10 个问题。我这里使用 qwen-max 模型对历史提问进行总结并且按照我要求的方式进行输出。也就是说这个模型只负责总结历史问题对于业务问题的回答是其他大模型干的事情任务分工明确就减少了不确定性。 python 复制代码 history [] app.route(/getAnwser, methods[POST]) def getAnwser():data request.get_json()question data[question]global historyhistory.append(question)history history[-10:] # 始终只维护最后 10 个问题print(正在解析用户意图...\n\n)try:# 将 history 拼接成字符串传入 prompt 中history_str if history:history_str [for h in history:history_str f{h},history_str.strip(,)history_str ]messages [{role: system, content: 您是一名精通总结多轮问题含义的助手请根据历史问题做出有效的判断帮我总结最新的问题保证不会丢失关键信息需要注意的是越靠近新的对话越重要},{role: user, content: f历史上我依次提问了以下问题{history_str}请帮我总结出我最新的问题不要做冗余的解释或者赘述。如果用户提出的问题语义模糊不清无法识别可以直接返回空字符串。答案的模板必循遵循”【{{我的最新的问题描述}}】“}]response Generation.call(modelqwen-max, messagesmessages, result_formatmessage)if response.status_code HTTPStatus.OK:resp response.output.choices[0][message][content].replace(【, ).replace(】, )else:raise Exception(接口限流请稍后重试。)print(f您的最新问题是{resp} \n\n)except BaseException as e:if history:history history[:-1] # 异常时候将本次新增的问题删除print( fError: {str(e)}\n\n.encode())如何系统的去学习大模型LLM 作为一名热心肠的互联网老兵我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。 但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的 AI大模型资料 包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。 所有资料 ⚡️ 朋友们如果有需要全套 《LLM大模型入门进阶学习资源包》扫码获取~ CSDN大礼包全网最全《LLM大模型入门进阶学习资源包》免费分享安全链接放心点击 ​ 一、全套AGI大模型学习路线 AI大模型时代的学习之旅从基础到前沿掌握人工智能的核心技能 二、640套AI大模型报告合集 这套包含640份报告的合集涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师还是对AI大模型感兴趣的爱好者这套报告合集都将为您提供宝贵的信息和启示。 三、AI大模型经典PDF籍 随着人工智能技术的飞速发展AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型如GPT-3、BERT、XLNet等以其强大的语言理解和生成能力正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。 四、AI大模型商业化落地方案 阶段1AI大模型时代的基础理解 目标了解AI大模型的基本概念、发展历程和核心原理。内容 L1.1 人工智能简述与大模型起源L1.2 大模型与通用人工智能L1.3 GPT模型的发展历程L1.4 模型工程 - L1.4.1 知识大模型 - L1.4.2 生产大模型 - L1.4.3 模型工程方法论 - L1.4.4 模型工程实践L1.5 GPT应用案例 阶段2AI大模型API应用开发工程 目标掌握AI大模型API的使用和开发以及相关的编程技能。内容 L2.1 API接口 - L2.1.1 OpenAI API接口 - L2.1.2 Python接口接入 - L2.1.3 BOT工具类框架 - L2.1.4 代码示例L2.2 Prompt框架 - L2.2.1 什么是Prompt - L2.2.2 Prompt框架应用现状 - L2.2.3 基于GPTAS的Prompt框架 - L2.2.4 Prompt框架与Thought - L2.2.5 Prompt框架与提示词L2.3 流水线工程 - L2.3.1 流水线工程的概念 - L2.3.2 流水线工程的优点 - L2.3.3 流水线工程的应用L2.4 总结与展望 阶段3AI大模型应用架构实践 目标深入理解AI大模型的应用架构并能够进行私有化部署。内容 L3.1 Agent模型框架 - L3.1.1 Agent模型框架的设计理念 - L3.1.2 Agent模型框架的核心组件 - L3.1.3 Agent模型框架的实现细节L3.2 MetaGPT - L3.2.1 MetaGPT的基本概念 - L3.2.2 MetaGPT的工作原理 - L3.2.3 MetaGPT的应用场景L3.3 ChatGLM - L3.3.1 ChatGLM的特点 - L3.3.2 ChatGLM的开发环境 - L3.3.3 ChatGLM的使用示例L3.4 LLAMA - L3.4.1 LLAMA的特点 - L3.4.2 LLAMA的开发环境 - L3.4.3 LLAMA的使用示例L3.5 其他大模型介绍 阶段4AI大模型私有化部署 目标掌握多种AI大模型的私有化部署包括多模态和特定领域模型。内容 L4.1 模型私有化部署概述L4.2 模型私有化部署的关键技术L4.3 模型私有化部署的实施步骤L4.4 模型私有化部署的应用场景 学习计划 阶段11-2个月建立AI大模型的基础知识体系。阶段22-3个月专注于API应用开发能力的提升。阶段33-4个月深入实践AI大模型的应用架构和私有化部署。阶段44-5个月专注于高级模型的应用和部署。 这份完整版的所有 ⚡️ 大模型 LLM 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】 全套 《LLM大模型入门进阶学习资源包》↓↓↓ 获取~ CSDN大礼包全网最全《LLM大模型入门进阶学习资源包》免费分享安全链接放心点击 ​
http://www.tj-hxxt.cn/news/225583.html

相关文章:

  • 做网站端口内容无法替换大城网站建设
  • 网站建设需要啥静态网站建设的技术运用
  • 知名网站排行榜基金会网站建设方案
  • 做网站分辨率多少班级网站建设组织机构
  • 深圳营销网站企业网站建设公司制作平台
  • 企业网站建设 西宁网站引导页html模板
  • 茶叶网站建设哪家做网站常用字体
  • 网站添加cnzzwordpress主题如何使用教程
  • 做网站和微信公众号需要多少钱wordpress教程全集(入门到精通)
  • wordpress 跨站什么是网络营销有哪些特点
  • 建设银行网站查询企业推广的主要目的是
  • 南昌天和建设有限公司网站传媒公司官网
  • 做网站最简单的工具信息流优化师职业规划
  • 重庆有名的网站建设网站建设问题新闻资讯
  • 网站开发服务器多少钱中国互联网百强企业排名
  • 网站建设及维护价钱昆明seo代理商
  • 手机网站建设图片素材设置网络的网站
  • 长沙平面设计公司都有哪些四川seo推广公司
  • 网站开发通用流程图公司做网站需要哪些手续
  • 廊坊网站推广排名品牌网站建设优化公司排名
  • 在线购物网站建设流程图深圳网站建设公司哪家
  • 顺德o2o网站建设免费高清视频素材app哪里找
  • 到哪个网站做任务如何注册公司公众号
  • discuz和wordpress哪个好南通网站建设优化
  • 网站做淘客网站设计的文案
  • 一站式做网站平台不用囤货
  • 超炫网站模板网站网页设计html
  • 汉中微信网站建设开发淮安网站建设制作
  • 关于华大18年专注seo服务网站制作应用开发京东店铺购买平台
  • 怎么查看网站的友情链接辽宁建设工程信息网场内业绩什么意思