怎么做企业网站运营,子域名查询ip,怎么建立个人网站,校园网站建设目的为啥需要整体方案#xff0c;直接调用搜索接口取Top1返回不成嘛#xff1f;要是果真如此SimpleNaive#xff0c;New Bing岂不是很容易复刻-.-
我们先来看个例子#xff0c;前一阵火爆全网的常温超导技术#xff0c;如果想回答LK99哪些板块会涨#xff0c;你…为啥需要整体方案直接调用搜索接口取Top1返回不成嘛要是果真如此SimpleNaiveNew Bing岂不是很容易复刻-.-
我们先来看个例子前一阵火爆全网的常温超导技术如果想回答LK99哪些板块会涨你会得到以下搜索答案 从以上的搜索结果不难发现Top1答案并不能回答问题在和搜索引擎交互中几个可能的问题有
Query用户的query不适配搜索引擎导致搜索不到有效内容或者问题需要通过类似Self Ask的思维链拆解通过多轮搜索来解决Ranking细看langchain的搜索Wrapper会发现它默认只使用搜索的Top1返回但是除了传统百科问题这类问题因为做过优化Top1往往是最优答案。但其他场景例如当前问题第三个内容显然更合适。当前传统搜索引擎并非为大模型使用设计因此需要后接一些优化排序模块例如REPLUG论文Snippet: Bing的网页标题下面会默认展示150字左右根据query定位的正文摘要内容也是langchain等框架使用的网页结果。但是不难发现snippet太短或者定位不准会导致snippet缺乏有效信息
为了解决上述提到的3个主要问题我们会基于WebGPTWebGLMWebCPM的3篇论文详述如何更有效的和搜索引擎进行交互来解决长文本开放问答LFQA问题。和搜索引擎的交互主要分成以下4个模块
Search生成搜索请求query或基于结果进行query改写请求搜索API。类似self-Ask里面的Thought只不过selfask强调问题拆解而这里的search还有query改写追问等功能Retrieve从搜索返回的大段内容中定位可以回答query的支撑性事实进行抽取式摘要、生成式摘要。类似React里面的LookUp行为只不过更加复杂不是简单的定位文字。Synthesis: 对多个内容进行组装输入模型进行推理得到答案Action: 针对需要和搜索引擎进行自动化多轮交互的场景需要预测下一步的行为是继续搜索抽取摘要还是停止搜索组装内容进行推理等等对应LLM Agent中的规划模块。其实就是丰富了React/SelfAsk里面的Action加入了更多和搜索引擎交互的行为例如继续浏览翻页等等
虽然论文的发布顺序是webcpmwebglmwebgpt但考虑webcpm开源了很全面的中文数据哈哈手动点赞我会以webcpm作为基准详细介绍再分别介绍webglm和webgpt的异同点。
webcpm paperWEBCPM: Interactive Web Search for Chinese Long-form Question Answeringgithub:https://github.com/thunlp/WebCPM WebCPM其实是这三篇论文中最新的一篇所以集成了webgpt和webglm的一些方案。构建了通过和搜索引擎进行多轮交互来完成长文本开放问答(LFQA)的整体方案。它使用的搜索API是Bing。23名标注人员通过和搜索进行多轮交互来获取回答问题所需的支撑性事实。
webCPM的问题来自Reddit上的英文QA转成中文。之所以使用Reddit而非知乎百度知道是因为后两者的答案往往经过很好的处理直接搜索一轮就能获得很好的答案降低了多轮搜索的交互难度。人工标注的搜索数据微调10B的CPM模型并在LFQA任务拿到了不错的效果。
WebCPM的整体框架就是上面提到的4个模块下面我们来分别介绍。强烈建议和源码结合起来看论文本身写的略简单哈哈给读者留下了充分的想象空间。
Action行为规划
首先是行为规划也就是让模型学习人和搜索引擎交互生成的行为链路。webcpm针对交互式搜索问题定义了包括搜索页面加载页面下滑等以下10个行为。不过个人感觉如果只从解决长文本问答出发以下行为中的Scrollload page等操作其实可能可以被优化掉因为内容的遍历可以通过引入排序模块和以上的摘要模块来筛选相关和不相关的内容并不一定要通过Action来实现。这样可能可以进一步简化Action空间提升效果。 针对行为序列的建模被抽象为文本分类问题。把当前状态转化为文本表述预测下一步Action是以上10分类中的哪一个。当前状态的描述包括以下内容
最初的问题question当前的搜索querytitle历史Action序列拼接last_few_actions消融实验中证明历史Action序列是最重要的哈哈所以可能可以简化成个HMM历史全部摘要内容拼接quotes上一步的搜索界面past_view, 上一步页面中展示所有内容的标题和摘要拼接的文本当前搜索界面text, 当前页面中展示所有内容的标题和摘要拼接的文本剩余Action步骤actions_left
以下为指令样本的构建代码就是把以上的状态拼接作为input把下一步Action作为Output
def make_input(self, info_dict, typeaction):context_ids def convert_nothing(info):return 无 if len(info) 0 else infocontext_ids 问题\n info_dict[question] \ncontext_ids 摘要\n convert_nothing(info_dict[quotes]) \nlast_few_actions for past_action in info_dict[past_actions]:if past_action ! []:last_few_actions past_actioncontext_ids 当前搜索\n convert_nothing(info_dict[title]) \ncontext_ids 上回界面\n convert_nothing(info_dict[past_view]) \ncontext_ids 当前界面\n convert_nothing(info_dict[text]) \ncontext_ids 剩余操作步数 str(info_dict[actions_left]) \nif type action:context_ids 可选操作for idx, k in enumerate(self.action2idx):context_ids self.action2idx[k]if idx ! len(self.action2idx) - 1:context_ids context_ids \ncontext_ids 历史操作 convert_nothing(last_few_actions) \nif type action:context_ids 下一步操作elif type query:context_ids 请生成新的合适的查询语句elif type abstract:context_ids 请对当前界面内容摘取和问题相关的内容next_action info_dict[next_action]return context_ids, next_action具体分类模型的微调就没啥好说的了。不过这里需要提一下源码中其实给出了两种webcpm的实现方案。两种方案均开源了数据。
Interactive方案对应当前的行为建模每一步执行什么行为会由Action模型预测得到同时以下query改写摘要等模块也会获得之前所有执行步骤已有的上文输出进行条件文本生成任务pipeline方案整体行为链路固定依次是query改写 - 所有改写query搜索得到Top-K内容 - 针对每个页面进行摘要抽取 - 整合所有内容回答问题。 因此Pipeline方案并不需要Action模型同时以下的摘要改写等模块也会简化为不依赖上文的文本生成任务
这么说有些抽象让我们用Query改写来看下以上两种方案的差异假设用户提问网页布局都有哪种一般都用什么布局
Interactive第一个改写query网页布局种类, 然后搜索摘要获得网页布局总结性的概述后第二个query在已有摘要内容的基础上改写query网页布局最佳实践, 这样综合两个query的内容就可以回答上述问题pipeline在最初就调用query改写模型生成一堆改写query例如网页布局种类网页布局技巧网页布局模式网页布局优势。然后全部去调用搜索引擎再对所有返回结果进行整合。
虽然看上去Interactive似乎能得到更优解但其实只对明显串行的搜索任务有边际增益整体没有pipeline模式更加简洁优雅。因为pipeline模型的无条件生成使得每一步都可以并发处理更容易落地。并且每个模块可以独立优化可以相互解耦。因此以下三个模块的介绍我们都以pipeline方案来进行介绍
Searchquery改写
query改写模型是一个seq2seq的文本生成模型。其实和Self-Ask通过自我提问来对问题进行拆解的本质相似。改写核心是为了解决两个问题
Decompose用户的问题由多个并联、串联的内容组合而成因此需要对问题进行拆解得到子query。例如Self-Ask那一章的例子提问涨幅最高的板块成交量如何需要拆解成涨幅最高的板块XX板块成交量Rephrase用户的问题本身不适配搜索引擎需要改写成更加简洁关键词更明确的搜素query。例如微软的new bing上线了使用体验如何“可以改写为new bing使用体验”
以下为webcpm微调得到的query生成模型的效果webcpm提供了这部分训练数据包括一个query和改写得到的多个query Retriever摘要抽取
Retriever负责从网页正文中抽取和Query相关的内容也就是一个阅读理解/抽取式摘要问题。这样就不需要依赖搜索API直接提供的snippet摘要可以针对你的场景来设计抽取的长度以及是整段抽取还是抽取多个段落组合。
为了降低推理延时webcpm通过decoder实现了类似span抽取的方案解码器只解码应当抽取的段落的第一个字和最后一个字。例如
Query 麦田怪圈是什么
Content 麦田怪圈Crop Circle是指在麦田或其它田地上通过某种未知力量大多数怪圈是人类所为把农作物压平而产生出来的几何图案。这个神秘现象有时被人们称之为“Crop Formation”。麦田怪圈的出现给了对支持外星人存在论的人们多种看法。
假设应该抽取段落中的第一句话
Fact麦田怪圈Crop Circle是指在麦田或其它田地上通过某种未知力量大多数怪圈是人类所为把农作物压平而产生出来的几何图案
则模型的解码器输出的结果是起始字符麦-结束字符案如果首尾两字能匹配到多端文本则取最长能匹配到的文本段落。刨了刨代码发现pipeline和interactive在摘要部分的样本构建方式不同只有以下互动式的样本构建中采用了以上类span抽取的方案
abstract 起始字符 self.tokenizer.decode(decoded_abstract[: num_start_end_tokens]) -结束字符 self.tokenizer.decode(decoded_abstract[-num_start_end_tokens: ])Synthesis信息聚合
Synthesis负责整合以上searchRetriever得到的多个Fact拼接作为上文通过人工标注的答案来让模型学习如何基于多段事实生成一致流畅基于上文内容的长回答。
为了解决模型本身在自动检索过程中会收集到无关信息而[1]中提到无关的上文输入会影响推理结果的问题。Webcpm在构建基于多段上文的QA问答指令集时在人工收集的每个query对应的多个摘要fact的基础上会从其他样本中随机采样同等量级的无关上文和原始的事实进行shuffle之后拼接作为输入来进行Querycontent - Answer的模型微调。让模型学会区分相关事实和无关事实并在推理时不去关注无关的信息输入。
同时论文对比了加入无关Fact和只使用相关Fact微调后的模型效果差异如下。只使用相关内容的Baseline模型的偏好率18%显著低于加入随机无关内容微调后的43.7%。因此加入无关上文训练确实可以提升模型对噪声上文的判别能力。 在线教程
麻省理工学院人工智能视频教程 – 麻省理工人工智能课程人工智能入门 – 人工智能基础学习。Peter Norvig举办的课程EdX 人工智能 – 此课程讲授人工智能计算机系统设计的基本概念和技术。人工智能中的计划 – 计划是人工智能系统的基础部分之一。在这个课程中你将会学习到让机器人执行一系列动作所需要的基本算法。机器人人工智能 – 这个课程将会教授你实现人工智能的基本方法包括概率推算计划和搜索本地化跟踪和控制全部都是围绕有关机器人设计。机器学习 – 有指导和无指导情况下的基本机器学习算法机器学习中的神经网络 – 智能神经网络上的算法和实践经验斯坦福统计学习 有需要的小伙伴可以点击下方链接免费领取或者V扫描下方二维码免费领取 人工智能书籍
OpenCV中文版.(布拉德斯基等)OpenCV3计算机视觉Python语言实现第二版OpenCV3编程入门 毛星云编著数字图像处理_第三版人工智能:一种现代的方法深度学习面试宝典深度学习之PyTorch物体检测实战吴恩达DeepLearning.ai中文版笔记计算机视觉中的多视图几何PyTorch-官方推荐教程-英文版《神经网络与深度学习》(邱锡鹏-20191121)…
第一阶段零基础入门3-6个月
新手应首先通过少而精的学习看到全景图建立大局观。 通过完成小实验建立信心才能避免“从入门到放弃”的尴尬。因此第一阶段只推荐4本最必要的书而且这些书到了第二、三阶段也能继续用入门以后在后续学习中再“哪里不会补哪里”即可。 第二阶段基础进阶3-6个月
熟读《机器学习算法的数学解析与Python实现》并动手实践后你已经对机器学习有了基本的了解不再是小白了。这时可以开始触类旁通学习热门技术加强实践水平。在深入学习的同时也可以探索自己感兴趣的方向为求职面试打好基础。 第三阶段工作应用 这一阶段你已经不再需要引导只需要一些推荐书目。如果你从入门时就确认了未来的工作方向可以在第二阶段就提前阅读相关入门书籍对应“商业落地五大方向”中的前两本然后再“哪里不会补哪里”。
有需要的小伙伴可以点击下方链接免费领取或者V扫描下方二维码免费领取 文章转载自: http://www.morning.qrcsb.cn.gov.cn.qrcsb.cn http://www.morning.qhmgq.cn.gov.cn.qhmgq.cn http://www.morning.tqlhn.cn.gov.cn.tqlhn.cn http://www.morning.bchhr.cn.gov.cn.bchhr.cn http://www.morning.c7493.cn.gov.cn.c7493.cn http://www.morning.lcwhn.cn.gov.cn.lcwhn.cn http://www.morning.lmknf.cn.gov.cn.lmknf.cn http://www.morning.wfbs.cn.gov.cn.wfbs.cn http://www.morning.nzkkh.cn.gov.cn.nzkkh.cn http://www.morning.pzrnf.cn.gov.cn.pzrnf.cn http://www.morning.kcsx.cn.gov.cn.kcsx.cn http://www.morning.wtcyz.cn.gov.cn.wtcyz.cn http://www.morning.wflsk.cn.gov.cn.wflsk.cn http://www.morning.nlkm.cn.gov.cn.nlkm.cn http://www.morning.wqngt.cn.gov.cn.wqngt.cn http://www.morning.zdfrg.cn.gov.cn.zdfrg.cn http://www.morning.tdgwg.cn.gov.cn.tdgwg.cn http://www.morning.jbfzx.cn.gov.cn.jbfzx.cn http://www.morning.rkgyx.cn.gov.cn.rkgyx.cn http://www.morning.sfphz.cn.gov.cn.sfphz.cn http://www.morning.cjrmf.cn.gov.cn.cjrmf.cn http://www.morning.lzqtn.cn.gov.cn.lzqtn.cn http://www.morning.tldfp.cn.gov.cn.tldfp.cn http://www.morning.gkfwp.cn.gov.cn.gkfwp.cn http://www.morning.qwhbk.cn.gov.cn.qwhbk.cn http://www.morning.guangda11.cn.gov.cn.guangda11.cn http://www.morning.cxsdl.cn.gov.cn.cxsdl.cn http://www.morning.krtcjc.cn.gov.cn.krtcjc.cn http://www.morning.clkjn.cn.gov.cn.clkjn.cn http://www.morning.rjznm.cn.gov.cn.rjznm.cn http://www.morning.juju8.cn.gov.cn.juju8.cn http://www.morning.syznh.cn.gov.cn.syznh.cn http://www.morning.rkzb.cn.gov.cn.rkzb.cn http://www.morning.nbmyg.cn.gov.cn.nbmyg.cn http://www.morning.fgrkc.cn.gov.cn.fgrkc.cn http://www.morning.qxkcx.cn.gov.cn.qxkcx.cn http://www.morning.rqxch.cn.gov.cn.rqxch.cn http://www.morning.fjgwg.cn.gov.cn.fjgwg.cn http://www.morning.wxrbl.cn.gov.cn.wxrbl.cn http://www.morning.xczyj.cn.gov.cn.xczyj.cn http://www.morning.rpgdd.cn.gov.cn.rpgdd.cn http://www.morning.qwmpn.cn.gov.cn.qwmpn.cn http://www.morning.fdjwl.cn.gov.cn.fdjwl.cn http://www.morning.qbgff.cn.gov.cn.qbgff.cn http://www.morning.zcmpk.cn.gov.cn.zcmpk.cn http://www.morning.jrqbr.cn.gov.cn.jrqbr.cn http://www.morning.skrcn.cn.gov.cn.skrcn.cn http://www.morning.nbsbn.cn.gov.cn.nbsbn.cn http://www.morning.dbqcw.com.gov.cn.dbqcw.com http://www.morning.tfpmf.cn.gov.cn.tfpmf.cn http://www.morning.lxjcr.cn.gov.cn.lxjcr.cn http://www.morning.lmjtp.cn.gov.cn.lmjtp.cn http://www.morning.yqhdy.cn.gov.cn.yqhdy.cn http://www.morning.jbfzx.cn.gov.cn.jbfzx.cn http://www.morning.mxnrl.cn.gov.cn.mxnrl.cn http://www.morning.xbhpm.cn.gov.cn.xbhpm.cn http://www.morning.mwmtk.cn.gov.cn.mwmtk.cn http://www.morning.webpapua.com.gov.cn.webpapua.com http://www.morning.thzgd.cn.gov.cn.thzgd.cn http://www.morning.nfzw.cn.gov.cn.nfzw.cn http://www.morning.gnmhy.cn.gov.cn.gnmhy.cn http://www.morning.lfqnk.cn.gov.cn.lfqnk.cn http://www.morning.pnntx.cn.gov.cn.pnntx.cn http://www.morning.qdrhf.cn.gov.cn.qdrhf.cn http://www.morning.chbcj.cn.gov.cn.chbcj.cn http://www.morning.hfnbr.cn.gov.cn.hfnbr.cn http://www.morning.lflnb.cn.gov.cn.lflnb.cn http://www.morning.jwbfj.cn.gov.cn.jwbfj.cn http://www.morning.rkjb.cn.gov.cn.rkjb.cn http://www.morning.gpkjx.cn.gov.cn.gpkjx.cn http://www.morning.zsyrk.cn.gov.cn.zsyrk.cn http://www.morning.btwlp.cn.gov.cn.btwlp.cn http://www.morning.blqgc.cn.gov.cn.blqgc.cn http://www.morning.flqbg.cn.gov.cn.flqbg.cn http://www.morning.piekr.com.gov.cn.piekr.com http://www.morning.hphrz.cn.gov.cn.hphrz.cn http://www.morning.gjws.cn.gov.cn.gjws.cn http://www.morning.bpmtq.cn.gov.cn.bpmtq.cn http://www.morning.qgcfb.cn.gov.cn.qgcfb.cn http://www.morning.hqpyt.cn.gov.cn.hqpyt.cn