当前位置: 首页 > news >正文

网站推广一站式服务百度推广怎么做效果好

网站推广一站式服务,百度推广怎么做效果好,网络营销方案怎么做,网页网站的制作过程诸神缄默不语-个人CSDN博文目录 本文介绍自然语言生成任务中的各种评估指标。 因为我是之前做文本摘要才接触到这一部分内容的#xff0c;所以本文也是文本摘要中心。 持续更新。 文章目录 1. 常用术语2. ROUGE (Recall Oriented Understudy for Gisting Evaluation)1. 计算…诸神缄默不语-个人CSDN博文目录 本文介绍自然语言生成任务中的各种评估指标。 因为我是之前做文本摘要才接触到这一部分内容的所以本文也是文本摘要中心。 持续更新。 文章目录 1. 常用术语2. ROUGE (Recall Oriented Understudy for Gisting Evaluation)1. 计算指标2. 对rouge指标的更深入研究和改进 3. BLEU (Bilingual Evaluation Understudy)4. METEOR (Metric for Evaluation for Translation with Explicit Ordering)5. Perplexity6. Bertscore7. Faithfulness8. 人工评估指标9. InfoLM10. MOVERSCORE11. BEER12. BEND参考资料 1. 常用术语 模型生成的句子、预测结果——candidate 真实标签——reference、ground-truth 2. ROUGE (Recall Oriented Understudy for Gisting Evaluation) ROUGE值是文本摘要任务重最常用的机器评估指标衡量生成文本与真实标签之间的相似程度。 precisioncandidate中匹配reference的内容占candidate比例 recallcandidate中匹配reference的内容占reference比例 示例 Reference: I work on machine learning.Candidate A: I work.Candidate B: He works on machine learning.在这个例子中用unigram可以理解为一个词或token1衡量匹配A就比B的precision更高A的匹配内容I work占candidate 100%B的on machine learning占60%但B的recall更高60% VS 40%。 出处论文(2004 WS) ROUGE: A Package for Automatic Evaluation of Summaries 感觉没有2004年之后的文本摘要论文不使用这个指标的如果看到有的话我会专门来这里提一嘴的。 分类ROUGE-N常用其中的ROUGE-1和ROUGE-2, ROUGE-LROUGE-WROUGE-S后两种不常用 原版论文中ROUGE主要关注recall值但事实上在用的时候可以用precision、recall和F值。我看到很多论文都用的是F值 1. 计算指标 每种rouge值原本都是计算recall的主要区别在于这个匹配文本的单位的选择 ROUGE-N基于n-grams如ROUGE-1计算基于匹配unigrams的recall以此类推。 ROUGE-L基于longest common subsequence (LCS) ROUGE-W基于weighted LCS ROUGE-S基于skip-bigram co-occurence statisticsskip-bigram指两个共同出现的单词不管中间隔了多远。要计算任何bigram的出现可能 C n 2 C_n^2 Cn2​ 以ROUGE-L为例 A A A 是candidate长度 m m m B B B 是reference长度 n n n P L C S ( A , B ) m P\frac{LCS(A,B)}{m} PmLCS(A,B)​ R L C S ( A , B ) n R\frac{LCS(A,B)}{n} RnLCS(A,B)​ F ( 1 b 2 ) R P R b 2 P F\frac{(1b^2)RP}{Rb^2P} FRb2P(1b2)RP​ 2. 对rouge指标的更深入研究和改进 (2018 EMNLP) A Graph-theoretic Summary Evaluation for ROUGE 批判文学(2023 ACL) Rogue Scores喷原包有bug。嘛我之前也喷过2终于有顶会论文喷了我很欣慰 3. BLEU (Bilingual Evaluation Understudy) 常用于翻译领域。 出处论文(2002 ACL) Bleu: a Method for Automatic Evaluation of Machine Translation precision用modified n-gram precision估计recall用best match length估计。 Modified n-gram precision: n-gram precision是candidate中与reference匹配的n-grams占candidates的比例。但仅用这一指标会出现问题。 举例来说 Reference: I work on machine learning.Candidate 1: He works on machine learning.Candidate 2: He works on on machine machine learning learning.candidate 1的unigram precision有60%3/5candidate 2的有75%6/8但显然candidate 1比2更好。 为了解决这种问题我们提出了“modified” n-gram precision仅按照reference中匹配文本的出现次数来计算candidate中的出现次数。这样candidate中的on、machine和learning就各自只计算一次candidate 2的unigram precision就变成了37.5%3/8。 对多个candidate的n-gram precision求几何平均因为precision随n呈几何增长因此対数平均能更好地代表所有数值这块其实我没看懂 P r e c i s i o n exp ⁡ ( ∑ n 1 N w n log ⁡ p n ) , where  w n 1 / n Precision\exp(\sum_{n1}^Nw_n\log p_n),\ \text{where} \ w_n1/n Precisionexp(n1∑N​wn​logpn​), where wn​1/n Best match length: recall的问题在于可能存在多个reference texts故难以衡量candidate对整体reference的sensitivity这块其实我也没看懂。显然长的candidate会包含更多匹配文本但我们也已经保证了candidate不会无限长因为这样的precision可能很低。因此我们可以从惩罚candidate的简洁性文本短入手来设计recall指标 在modified n-gram precision中添加一个multiplicative factor B P BP BP B P { 1 , if  c r exp ⁡ ( 1 − r c ) , otherwise \begin{aligned} BP\begin{cases}1, \text{if}\ c r\\ \exp \left( 1-\dfrac{r}{c}\right) ,\text{otherwise}\end{cases} \end{aligned} BP{1,exp(1−cr​),​if crotherwise​​ 其中 c c c 是candidates总长度 r r r 是reference有效长度如reference长度平均值随着candidate长度 c c c下降 B P BP BP 也随之减少起到了惩罚短句的作用。 4. METEOR (Metric for Evaluation for Translation with Explicit Ordering) 常用于翻译领域。 出处(2005) METEOR: An Automatic Metric for MT Evaluation with Improved Correlation with Human Judgments BLEU的问题在于 B P BP BP 值所用的长度是平均值因此单句得分不清晰。而METEOR调整了precision和recall的计算方式用基于mapping unigrams的weighted F-score和penalty function for incorrect word order来代替。 Weighted F-score: 首先我们要找到candidate和reference间最大的可以形成对齐alignment的映射mappings子集subset。在经过Porter stemming[^3]、用了WordNet同义词后假设找到的对齐数是 m m m则precision就是 m / c m/c m/c c c c 是candidate长度、recall是 m / r m/r m/r r r r 是reference长度F就是 F P R α P ( 1 − α ) R F\frac{PR}{\alpha P(1-\alpha)R} FαP(1−α)RPR​ Penalty function: 考虑candidate中的单词顺序 P e n a l t y γ ( c m ) β , where  0 ≤ γ ≤ 1 Penalty\gamma(\frac{c}{m})^\beta,\ \text{where}\ 0\leq\gamma\leq1 Penaltyγ(mc​)β, where 0≤γ≤1 其中 c c c 是matching chunks数 m m m 是matches总数。因此如果大多数matches是连续的 c c c 就会小penalty就会低。这部分我的理解是连续的matches组成一个chunk。但我不确定可能我会去查阅更多资料。 最终METEOR得分的计算方式为 ( 1 − P e n a l t y ) F (1-Penalty)F (1−Penalty)F 5. Perplexity 常用于语言模型训练。 待补。 6. Bertscore 使用该指标的论文Rewards with Negative Examples for Reinforced Topic-Focused Abstractive Summarization 待补。 7. Faithfulness Entailment Ranking Generated Summaries by Correctness: An Interesting but Challenging Application for Natural Language Inference用预训练的基于entailment的方法评估原文蕴含生成摘要的概率FactCC Evaluating the Factual Consistency of Abstractive Text Summarization用基于规则的变换生成假摘要训练基于Bert的模型分类生成摘要是否faithfulDAE Annotating and Modeling Fine-grained Factuality in Summarization收集细粒度的词/依赖/句级别的faithfulness的标注用这些标注训练factuality检测模型 8. 人工评估指标 文本的流畅程度、对原文的忠实程度、对原文重要内容的包含程度、语句的简洁程度等 9. InfoLM 出处论文(2022 AAAI) InfoLM: A New Metric to Evaluate Summarization Data2Text Generation 待补。 10. MOVERSCORE 待补 11. BEER 待补。 12. BEND 待补。 参考资料 Metrics for NLG evaluation. Simple natural language processing… | by Desh Raj | Explorations in Language and Learning | Medium我还没看等我看完了补上 Revisiting Automatic Evaluation of Extractive Summarization Task: Can We Do Better than ROUGE? Benchmarking Answer Verification Methods for Question Answering-Based Summarization Evaluation Metrics SARI InfoLM: A New Metric to Evaluate Summarization Data2Text Generation SPICE Play the Shannon Game With Language Models: A Human-Free Approach to Summary Evaluation Reference-free Summarization Evaluation via Semantic Correlation and Compression Ratio 参考unigram_百度百科 父词条n-gram unigram: 1个word bigram: 2个word trigram : 3个word 注意此处的word是英文的概念在中文中可能会根据需要指代字或词 中文中如果用字作为基本单位示例 西安交通大学 unigram 形式为西/安/交/通/大/学 bigram形式为 西安/安交/交通/通大/大学 trigram形式为西安交/安交通/交通大/通大学 ↩︎ pyrouge和rouge在Linux上的安装方法以及结果比较 ↩︎
文章转载自:
http://www.morning.gghhmi.cn.gov.cn.gghhmi.cn
http://www.morning.wwkft.cn.gov.cn.wwkft.cn
http://www.morning.lbcbq.cn.gov.cn.lbcbq.cn
http://www.morning.htmhl.cn.gov.cn.htmhl.cn
http://www.morning.brwnd.cn.gov.cn.brwnd.cn
http://www.morning.tsqrc.cn.gov.cn.tsqrc.cn
http://www.morning.yuminfo.com.gov.cn.yuminfo.com
http://www.morning.dhtdl.cn.gov.cn.dhtdl.cn
http://www.morning.dhyqg.cn.gov.cn.dhyqg.cn
http://www.morning.fgkwh.cn.gov.cn.fgkwh.cn
http://www.morning.xkppj.cn.gov.cn.xkppj.cn
http://www.morning.ppghc.cn.gov.cn.ppghc.cn
http://www.morning.lmhwm.cn.gov.cn.lmhwm.cn
http://www.morning.flfdm.cn.gov.cn.flfdm.cn
http://www.morning.dkfrd.cn.gov.cn.dkfrd.cn
http://www.morning.lflnb.cn.gov.cn.lflnb.cn
http://www.morning.tfkqc.cn.gov.cn.tfkqc.cn
http://www.morning.xywfz.cn.gov.cn.xywfz.cn
http://www.morning.rjtmg.cn.gov.cn.rjtmg.cn
http://www.morning.kstlm.cn.gov.cn.kstlm.cn
http://www.morning.yrbqy.cn.gov.cn.yrbqy.cn
http://www.morning.dnbkz.cn.gov.cn.dnbkz.cn
http://www.morning.mldrd.cn.gov.cn.mldrd.cn
http://www.morning.ymrq.cn.gov.cn.ymrq.cn
http://www.morning.pbxkk.cn.gov.cn.pbxkk.cn
http://www.morning.zwmjq.cn.gov.cn.zwmjq.cn
http://www.morning.dzgyr.cn.gov.cn.dzgyr.cn
http://www.morning.nfqyk.cn.gov.cn.nfqyk.cn
http://www.morning.xesrd.com.gov.cn.xesrd.com
http://www.morning.lhrxq.cn.gov.cn.lhrxq.cn
http://www.morning.lznfl.cn.gov.cn.lznfl.cn
http://www.morning.ntqqm.cn.gov.cn.ntqqm.cn
http://www.morning.rpfpx.cn.gov.cn.rpfpx.cn
http://www.morning.jcrlx.cn.gov.cn.jcrlx.cn
http://www.morning.bsrqy.cn.gov.cn.bsrqy.cn
http://www.morning.rmryl.cn.gov.cn.rmryl.cn
http://www.morning.kbqbx.cn.gov.cn.kbqbx.cn
http://www.morning.sooong.com.gov.cn.sooong.com
http://www.morning.jfmyt.cn.gov.cn.jfmyt.cn
http://www.morning.jrdbq.cn.gov.cn.jrdbq.cn
http://www.morning.pszw.cn.gov.cn.pszw.cn
http://www.morning.txmkx.cn.gov.cn.txmkx.cn
http://www.morning.cxryx.cn.gov.cn.cxryx.cn
http://www.morning.jtfsd.cn.gov.cn.jtfsd.cn
http://www.morning.kmcfw.cn.gov.cn.kmcfw.cn
http://www.morning.nrll.cn.gov.cn.nrll.cn
http://www.morning.smxyw.cn.gov.cn.smxyw.cn
http://www.morning.nwbnt.cn.gov.cn.nwbnt.cn
http://www.morning.lyhrg.cn.gov.cn.lyhrg.cn
http://www.morning.nccyc.cn.gov.cn.nccyc.cn
http://www.morning.bfysg.cn.gov.cn.bfysg.cn
http://www.morning.rpkl.cn.gov.cn.rpkl.cn
http://www.morning.wkwds.cn.gov.cn.wkwds.cn
http://www.morning.cykqb.cn.gov.cn.cykqb.cn
http://www.morning.dfkby.cn.gov.cn.dfkby.cn
http://www.morning.njntp.cn.gov.cn.njntp.cn
http://www.morning.jnvivi.com.gov.cn.jnvivi.com
http://www.morning.pnmtk.cn.gov.cn.pnmtk.cn
http://www.morning.mkyny.cn.gov.cn.mkyny.cn
http://www.morning.bmgdl.cn.gov.cn.bmgdl.cn
http://www.morning.lqjpb.cn.gov.cn.lqjpb.cn
http://www.morning.ptwqf.cn.gov.cn.ptwqf.cn
http://www.morning.bsqth.cn.gov.cn.bsqth.cn
http://www.morning.ncfky.cn.gov.cn.ncfky.cn
http://www.morning.lkthj.cn.gov.cn.lkthj.cn
http://www.morning.wgbmj.cn.gov.cn.wgbmj.cn
http://www.morning.kpypy.cn.gov.cn.kpypy.cn
http://www.morning.cctgww.cn.gov.cn.cctgww.cn
http://www.morning.dhckp.cn.gov.cn.dhckp.cn
http://www.morning.rfrx.cn.gov.cn.rfrx.cn
http://www.morning.dtrzw.cn.gov.cn.dtrzw.cn
http://www.morning.lkfhk.cn.gov.cn.lkfhk.cn
http://www.morning.mwlxk.cn.gov.cn.mwlxk.cn
http://www.morning.rtlg.cn.gov.cn.rtlg.cn
http://www.morning.ywpwq.cn.gov.cn.ywpwq.cn
http://www.morning.bwgrd.cn.gov.cn.bwgrd.cn
http://www.morning.xzlp.cn.gov.cn.xzlp.cn
http://www.morning.lchtb.cn.gov.cn.lchtb.cn
http://www.morning.tqpnf.cn.gov.cn.tqpnf.cn
http://www.morning.zdmlt.cn.gov.cn.zdmlt.cn
http://www.tj-hxxt.cn/news/252459.html

相关文章:

  • 网站建设案例 星座外贸网址建站
  • 重庆网站排名如何用腾讯云主机做网站
  • 网站自适应布局与网络公司洽谈做网站需要注意什么
  • 如皋做网站的公司有什么网站可以做微信支付
  • 余姚网站建设维护最新招聘信息邯郸网络公司哪家好
  • 网站建设联整合资源加强全市网站建设
  • 做免费网站推广开头语做物流运输网站电话
  • 微信企业号网站开发软件wordpress被自动发布文章
  • 宁波网站推广怎么做怎么做二维码网站
  • 苏州门户网站房产门户网站建设
  • 泰塔科技网站建设凤翔做网站
  • 怎么做微网站wordpress外贸网站好用的模板
  • 网站用的是什么字体outline免费服务器
  • 网站开发制作报价门户网站建设一般多少钱
  • iosapp做网站排版设计网站有哪些
  • 网站查询平台个人公司注册流程及材料
  • 网站搭建响应式wordpress+制作首页模板下载
  • 手机网页无法访问镇江网站建设优化制作公司
  • 有没有接活做的网站百度小程序优化排名
  • 广告行业网站建设方案济南行知网站建设有限公司怎么样
  • 苏州网站开发公司兴田德润在哪儿wordpress多語言主頁
  • 腾讯网站建设阿里巴巴网站网络营销的影响
  • 陈仓网站建设河北工商注册网入口
  • 幸运快三的网站怎么做国家建设部人才交流中心网站
  • 廊坊市固安县建设局网站凡客诚品vancl
  • 云南网站建设优化技术计算机应用技术
  • 上海企业网站优化多少钱网站域名注册如何填写
  • 设计最简单的企业网站哪些外贸网站比较好
  • 站长统计网站统计如何建个人免费网站
  • 长清网站建设费用雄安优秀网站建设