当前位置: 首页 > news >正文

重庆企业网站推广方法福州最新通告今天

重庆企业网站推广方法,福州最新通告今天,织梦pc怎么做手机网站,自适应网站dedecms代码说明#xff1a;这是我的学习笔记#xff0c;很多内容转自网络#xff0c;请查阅文章末尾的参考资料。 文章目录 RAGRagas评估框架评估维度评估指标Faithfulness (忠实度)Answer Relevance (答案相关度)Context Precision (上下文精确度)Context Recall (上下文召回率)Cont…说明这是我的学习笔记很多内容转自网络请查阅文章末尾的参考资料。 文章目录 RAGRagas评估框架评估维度评估指标Faithfulness (忠实度)Answer Relevance (答案相关度)Context Precision (上下文精确度)Context Recall (上下文召回率)Context Relevance (上下文相关度)Answer Similarity (答案相似度)Answer Correctness (答案正确性)Aspect Critique (层面评判) 参考资料 RAG RAG (Retrieval-Augmented Generation) 检索增强生成。RAG系统是利用检索的内容以增强LLM生成答案的系统。 Ragas RAGAS (Automated Evaluation of Retrieval Augmented Generation) 检索增强生成的自动评估。Ragas是一个大模型评测框架可以评估检索增强生成RAG的效果。Ragas可以帮助分析模型的输出了解模型在给定任务上的表现。 如果我们为某个真实线上系统开发了检索增强生成RAG应用那么在此应用正式上线提供服务前我们需要评估 RAG 的表现到底是怎样的。如果发现现有的 RAG 效果不够理想可能需要一些新的 RAG 算法流程来改进。在这之前就需要对 RAG 流程进行评估得到评估指标然后才能进行自动化对比观察改进的流程是否真的有效。 Ragas 官网 Ragas 安装 pip install ragas评估框架 RAGAS框架必须的数据源 Question: 用户所提的问题Answer: AI生成的回复Contexts: 上下文也就是检索得到的内容 可选的数据源 Ground Truths: 真相(下文简称Truths)人工标注的数据可以有多个真相对应同一个问题 评估维度 评估指标 Faithfulness (忠实度) 评估的是答案忠实于Contexts的程度因为LLM有编造回答的能力在理想的RAG系统中答案应该全部由提供的Contexts推理而来。 用LLM提取Answer中的要点, 设要点的数量为|Sa|用LLM检验这些要点是否可以Contexts中推理而来设能够推理而来的要点数量为|Va|计算它们的比值: F |Va| / |Sa| 所需输入 Question(提取要点时会需要用到)Answer, Contexts 是否需要标注: 否 Answer Relevance (答案相关度) 本质上可以视为无标注数据时的Answer Similarity。但因为作法不同所以它体现的更多的是Answer与Question之间的对齐程度。 利用LLM通过答案反推出问题。例如 RAG的全称是Retrieval-Augmented Generation是检索增强生成系统。生成的问题1RAG是什么。生成的问题2RAG的全程是什么。 用embedding模型提取Answer与生成问题的文本语义向量。计算向量间的相似度。 其中: n是生成的问题数量qi代表第i个生成问题, q代表实际的问题。 所需输入QuestionAnswer 是否需要标注: 否 Context Precision (上下文精确度) 评估的是检索到的文档是否对question都有帮助。其实就是有帮助的文档数量与所有被检索出文档数量的比例。它体现的是RAG系统对于文档检索的精准度会惩罚搜索一大堆没用文档喂给下游的行为。 用LLM判断Contexts对Question有帮助的数量假设该数量为|TP|设所有被检索出的文档数量为k, 计算它们的比值: CP |TP| / k 所需输入QuestionContexts 是否需要标注: 否 Context Recall (上下文召回率) 评估的是检索到的文档中包含真相Truths所需要信息的程度。如果为了优化Context Precision把文档删减了很多以至于包含的信息不够了自然Context Recall便会低。 用LLM提取所有Truths中的要点设要点数量为|St|。 要点(statements): 可以理解为一段描述中关于Question的小段信息。例如 问题RAG全称是什么。真相RAG全称Retrieval-Augmented Generation是检索增强生成系统。要点1 Retrieval-Augmented Generation要点2检索增强生成系统 用LLM判断在Contexts能找到对应信息的要点数量记作|Vt|计算它们的比值: CR |Vt| / |St| Context Relevance (上下文相关度) 评估的是检索到的文档中所有的内容是否对Question都有帮助。它与Context Precision的区别是它精确到了文档文本的所有内容。例如有的文档很长它涉及到的内容很广泛自然也包含回答问题的信息所以这篇文档在计算Context Precision时会是一个正例。但是因为这篇文章内容中也包含了其他冗余信息所以它的Context Relevance不会高。 用LLM将所有Contexts分解为句子设句子数量为|Sc|并判断对Question 有帮助的句子数量记作|Vc|计算它们的比值: CR |Vc| / |Sc| 所需输入QuestionContexts 是否需要标注: 否 Answer Similarity (答案相似度) Answer Correctness (答案正确性) Aspect Critique (层面评判) 参考资料 Rag系统的评估指标与Ragas框架的使用小白学大模型使用Ragas评价RAG效果RAG03-使用RAGAS进行评估RAG:系统评估以RAGAS为例
http://www.tj-hxxt.cn/news/143195.html

相关文章:

  • 能进外国网站看视频的浏览器合肥高端网站建设费用
  • 在什么网站做调查问卷肇庆网页制作公司
  • 柠檬网络科技网站建设做网站设计需要什么技术
  • 广州专业的网站建设公司排名申请免费个人网站和域名
  • 网站二级域名怎么弄天津哪家网站做的好
  • 721网站建设案例学——网页设计与网站建设
  • 响应式 网站 设计软件网站建设哪家好 北京
  • 什么是电子商务网站的建设如何建设免费网站
  • 广州市天河区建设局网站建设企业网站e路护航官网企业端
  • 普通网站建设wordpress中文博客主题
  • 提供常州网站优化php内容管理系统cms
  • 建站 备案开发网页需要多少钱
  • 网站虚拟空间过期色弱做网站
  • 网站开发技能有哪些建设网站需要钱吗
  • 安康市建设规划局网站企业邮箱注册需要什么
  • 台州路桥做网站的公司wordpress降级
  • 建设社团网站的可行性分析wordpress theme o'connor
  • 国外对于网站开发安装nginx wordpress
  • 企业网站优化设计的含义网站开发的目的 实习报告
  • 网站建设需要上税吗海淀网站建设电话
  • 深圳手机商城网站设计多少钱泉州企业网站建设公司
  • 谷歌优化教程外贸seo网站搭建
  • 网站开发基础教程图书馆评估定级关于网站建设标准
  • 安阳历史网站关键词优化代码
  • 四川建设学网官方网站登录网站建设费会计分录
  • 手机网站建设一般要多少钱做简历的网站viso
  • 一般做网站需要的js有哪些怎样建设网站?(怎样注册域名?如何选择主机?网站应有哪些功能模块
  • 网站建设方案项目书wordpress调用一篇文章
  • 做网站推广需要什么专业长沙品牌网站建设
  • 咸宁网站建设公司电子商务公司图片