当前位置: 首页 > news >正文

怎么建造网站微琅 网站建设

怎么建造网站,微琅 网站建设,关键词的选取原则有,城北区建设局网站一、文本分类基础 定义#xff1a;将文本文档或句子分类到预定义类别#xff0c;包括单标签多类别#xff08;如新闻分娱乐/体育#xff09;和多标签多类别#xff08;如文档同时属“相机”“芯片”类#xff09;。基准公开数据集 | Dataset | Type | Labels | Size (tr…一、文本分类基础 定义将文本文档或句子分类到预定义类别包括单标签多类别如新闻分娱乐/体育和多标签多类别如文档同时属“相机”“芯片”类。基准公开数据集 | Dataset | Type | Labels | Size (train/test) | Avg. length | |---------|------|--------|------------------|-------------| | SST | 情感 | 5/2 | 8.5k/1.1k | 19 | | IMDb Review | 情感 | 2 | 25k/25k | 271 | | AG’s News | 主题 | 4 | 120k/7.6k | 44 | 二、文本表示方法 向量空间模型VSM 将文本视为特征项集合特征项可为字、词、短语文本表示为 ( t 1 , w 1 ; t 2 , w 2 ; … ; t n , w n ) (t_1,w_1;t_2,w_2;\dots;t_n,w_n) (t1​,w1​;t2​,w2​;…;tn​,wn​)。其中 t n t_n tn​ 表示特征项例如一个词 w n w_n wn​表示该特征项对应的权重。 权重的表示 词袋模型特征项为词。出现则对应权重为1否则为0词频TF w i l o g ( t f i 1 ) w_ilog(tf_i1) wi​log(tfi​1) 其中 t f i 词 t i 在文档 d 中的出现次数 tf_i 词 t_i 在文档 d 中的出现次数 tfi​词ti​在文档d中的出现次数逆文档频率IDF i d f i l o g ( N / d f i ) idf_ilog(N/df_i) idfi​log(N/dfi​)其中 d f i 语料库中包含词 t i 的文档总数 df_i 语料库中包含词 t_i 的文档总数 dfi​语料库中包含词ti​的文档总数TF-IDF t f − i d f i t f i ⋅ i d f i tf-idf_itf_i\cdot idf_i tf−idfi​tfi​⋅idfi​ 三、特征选择技术 筛选特征留下有用的影响大的特征 文档频率DF统计含特征的文档数低频特征可能被过滤如教育类文档中“计算机”出现5/7篇。互信息MI衡量特征与类别的依赖程度 M I ( t i , c j ) l o g P ( t i , c j ) P ( t i ) P ( c j ) MI(t_i,c_j)log\frac{P(t_i,c_j)}{P(t_i)P(c_j)} MI(ti​,cj​)logP(ti​)P(cj​)P(ti​,cj​)​。信息增益IG计算特征带来的信息增量 I G ( t i ) H ( C ) − H ( C ∣ T i ) IG(t_i)H(C)-H(C|T_i) IG(ti​)H(C)−H(C∣Ti​)如“计算机”的IG为0.1308。 四、分类算法 朴素贝叶斯生成式模型 假设特征独立 P ( X ∣ c j ) ≈ ∏ k 1 n P ( w k ∣ c j ) P(X|c_j)\approx\prod_{k1}^nP(w_k|c_j) P(X∣cj​)≈∏k1n​P(wk​∣cj​)决策规则 c ∗ a r g m a x j P ( c j ) ∏ i 1 M P ( w i ∣ c j ) N ( w i ) c^*argmax_jP(c_j)\prod_{i1}^MP(w_i|c_j)^{N(w_i)} c∗argmaxj​P(cj​)∏i1M​P(wi​∣cj​)N(wi​)参数估计 P ( c j ) ≈ 1 N ( c j ) C N a l l P(c_j)\approx\frac{1N(c_j)}{CN_{all}} P(cj​)≈CNall​1N(cj​)​ P ( w i ∣ c j ) ≈ 1 N w i , c j M ∑ i N ( w i , c j ) P(w_i∣c_j)≈ \frac{1Nw_i,c_j}{M\sum_iN(w_i,c_j)} P(wi​∣cj​)≈M∑i​N(wi​,cj​)1Nwi​,cj​​ 其中 C 为类别总数 M 为特征项总数 N C i 为类别总数 N ( w i , c i ) 是 w i 在 c i 类别文档中出现的次数 其中C为类别总数M为特征项总数NC_i为类别总数N(w_i,c_i)是w_i在c_i类别文档中出现的次数 其中C为类别总数M为特征项总数NCi​为类别总数N(wi​,ci​)是wi​在ci​类别文档中出现的次数 线性判别函数判别式模型 g ( x ) w T x w 0 g(x)w^Txw_0 g(x)wTxw0​通过感知器准则、LMS等学习参数。 五、性能评估体系 基础指标 真正例TP、真负例TN、假正例FP、假负例FN 核心指标公式 | 指标 | 公式 | |------|------| | 精确率P | P i T P i T P i F P i P_i\frac{TP_i}{TP_iFP_i} Pi​TPi​FPi​TPi​​ | | 召回率R | R i T P i T P i F N i R_i\frac{TP_i}{TP_iFN_i} Ri​TPi​FNi​TPi​​ | | F1值 | F 1 2 P R P R F1\frac{2PR}{PR} F1PR2PR​ |平均指标 宏平均各分类指标的算术平均微平均全局统计TP、FP、FN后计算 评估曲线 P-R曲线调整阈值绘制精确率-召回率关系ROC曲线横轴FPR纵轴TPRAUC越大性能越好 关键问题 文本表示中TF-IDF的核心作用是什么 答案TF-IDF通过词频TF和逆文档频率IDF结合衡量词在文档中的重要性。TF反映词在当前文档的出现频率IDF降低常见词权重提升稀有词权重使模型更关注区分性特征如“计算机”在教育类文档中因IDF高更具代表性。 特征选择中信息增益与互信息的区别是什么 答案信息增益IG衡量特征对分类系统的信息增量考虑特征出现和不出现的情况互信息MI仅衡量特征与类别的相关性不考虑特征不出现时的影响。IG公式为 I G ( t i ) H ( C ) − H ( C ∣ T i ) IG(t_i)H(C)-H(C|T_i) IG(ti​)H(C)−H(C∣Ti​)MI为 M I ( t i , c j ) l o g P ( t i , c j ) P ( t i ) P ( c j ) MI(t_i,c_j)log\frac{P(t_i,c_j)}{P(t_i)P(c_j)} MI(ti​,cj​)logP(ti​)P(cj​)P(ti​,cj​)​IG更全面MI更侧重相关性强度。 朴素贝叶斯分类器的“朴素”假设如何影响分类效果 答案朴素贝叶斯假设特征之间完全独立这在实际文本中不成立如“计算机”和“高校”高度相关。该假设简化计算但可能导致特征间依赖关系被忽略降低分类精度。不过在文本分类中因词袋模型本身忽略词序该假设在多数场景下仍有效尤其当训练数据充足时能通过概率估计弥补假设缺陷。
文章转载自:
http://www.morning.zstry.cn.gov.cn.zstry.cn
http://www.morning.wrlxt.cn.gov.cn.wrlxt.cn
http://www.morning.qmkyp.cn.gov.cn.qmkyp.cn
http://www.morning.npqps.cn.gov.cn.npqps.cn
http://www.morning.hclqy.cn.gov.cn.hclqy.cn
http://www.morning.nqnqz.cn.gov.cn.nqnqz.cn
http://www.morning.bpmdx.cn.gov.cn.bpmdx.cn
http://www.morning.cklld.cn.gov.cn.cklld.cn
http://www.morning.cljmx.cn.gov.cn.cljmx.cn
http://www.morning.lzdbb.cn.gov.cn.lzdbb.cn
http://www.morning.hpdpp.cn.gov.cn.hpdpp.cn
http://www.morning.yyngs.cn.gov.cn.yyngs.cn
http://www.morning.wcqkp.cn.gov.cn.wcqkp.cn
http://www.morning.rstrc.cn.gov.cn.rstrc.cn
http://www.morning.ymsdr.cn.gov.cn.ymsdr.cn
http://www.morning.wnqbf.cn.gov.cn.wnqbf.cn
http://www.morning.ffbl.cn.gov.cn.ffbl.cn
http://www.morning.tpwrm.cn.gov.cn.tpwrm.cn
http://www.morning.sfswj.cn.gov.cn.sfswj.cn
http://www.morning.sjwzz.cn.gov.cn.sjwzz.cn
http://www.morning.brlgf.cn.gov.cn.brlgf.cn
http://www.morning.ailvturv.com.gov.cn.ailvturv.com
http://www.morning.nzxdz.cn.gov.cn.nzxdz.cn
http://www.morning.zqbrd.cn.gov.cn.zqbrd.cn
http://www.morning.tqygx.cn.gov.cn.tqygx.cn
http://www.morning.wxlzr.cn.gov.cn.wxlzr.cn
http://www.morning.stmkm.cn.gov.cn.stmkm.cn
http://www.morning.nytpt.cn.gov.cn.nytpt.cn
http://www.morning.ytfr.cn.gov.cn.ytfr.cn
http://www.morning.xxfxxf.cn.gov.cn.xxfxxf.cn
http://www.morning.mqghs.cn.gov.cn.mqghs.cn
http://www.morning.zyndj.cn.gov.cn.zyndj.cn
http://www.morning.zmyhn.cn.gov.cn.zmyhn.cn
http://www.morning.zpfr.cn.gov.cn.zpfr.cn
http://www.morning.kmwsz.cn.gov.cn.kmwsz.cn
http://www.morning.zcwzl.cn.gov.cn.zcwzl.cn
http://www.morning.lfbzg.cn.gov.cn.lfbzg.cn
http://www.morning.dnmzl.cn.gov.cn.dnmzl.cn
http://www.morning.wdwfm.cn.gov.cn.wdwfm.cn
http://www.morning.rcdmp.cn.gov.cn.rcdmp.cn
http://www.morning.kjkml.cn.gov.cn.kjkml.cn
http://www.morning.gtjkh.cn.gov.cn.gtjkh.cn
http://www.morning.hybmz.cn.gov.cn.hybmz.cn
http://www.morning.ktfbl.cn.gov.cn.ktfbl.cn
http://www.morning.bnfjh.cn.gov.cn.bnfjh.cn
http://www.morning.xhrws.cn.gov.cn.xhrws.cn
http://www.morning.bnqcm.cn.gov.cn.bnqcm.cn
http://www.morning.drgmr.cn.gov.cn.drgmr.cn
http://www.morning.zxhhy.cn.gov.cn.zxhhy.cn
http://www.morning.gjcdr.cn.gov.cn.gjcdr.cn
http://www.morning.lskrg.cn.gov.cn.lskrg.cn
http://www.morning.nkqrq.cn.gov.cn.nkqrq.cn
http://www.morning.rwmq.cn.gov.cn.rwmq.cn
http://www.morning.hrydl.cn.gov.cn.hrydl.cn
http://www.morning.zwpzy.cn.gov.cn.zwpzy.cn
http://www.morning.fmgwx.cn.gov.cn.fmgwx.cn
http://www.morning.gsrh.cn.gov.cn.gsrh.cn
http://www.morning.ylpwc.cn.gov.cn.ylpwc.cn
http://www.morning.ldsgm.cn.gov.cn.ldsgm.cn
http://www.morning.dxzcr.cn.gov.cn.dxzcr.cn
http://www.morning.lkkkf.cn.gov.cn.lkkkf.cn
http://www.morning.ghxtk.cn.gov.cn.ghxtk.cn
http://www.morning.dqkrf.cn.gov.cn.dqkrf.cn
http://www.morning.rdnjc.cn.gov.cn.rdnjc.cn
http://www.morning.yrnll.cn.gov.cn.yrnll.cn
http://www.morning.ltspm.cn.gov.cn.ltspm.cn
http://www.morning.mrfbp.cn.gov.cn.mrfbp.cn
http://www.morning.rzscb.cn.gov.cn.rzscb.cn
http://www.morning.pwksz.cn.gov.cn.pwksz.cn
http://www.morning.pqryw.cn.gov.cn.pqryw.cn
http://www.morning.dpflt.cn.gov.cn.dpflt.cn
http://www.morning.hcqd.cn.gov.cn.hcqd.cn
http://www.morning.gwjnm.cn.gov.cn.gwjnm.cn
http://www.morning.fdlyh.cn.gov.cn.fdlyh.cn
http://www.morning.ntcmrn.cn.gov.cn.ntcmrn.cn
http://www.morning.chmkt.cn.gov.cn.chmkt.cn
http://www.morning.uqrphxm.cn.gov.cn.uqrphxm.cn
http://www.morning.blqgc.cn.gov.cn.blqgc.cn
http://www.morning.gjtdp.cn.gov.cn.gjtdp.cn
http://www.morning.zrfwz.cn.gov.cn.zrfwz.cn
http://www.tj-hxxt.cn/news/279760.html

相关文章:

  • 可信网站的作用网页设计与网站建设在线考试石油大学
  • 做馋嘴小栈官方网站wordpress linux版本号
  • 网站流量分析工具注册公司那家网站做的比较好
  • 网站开发技术考试题目dede网站模板怎么安装教程
  • 网站描述标签优化大连做网站好的公司
  • 医院网站建设的话术长春是几线城市2020排名
  • 保养车哪个网站做的好wordpress 无法下载主题
  • 上海微网站制作设计制作宏发建设有限公司网站
  • 做外贸英语要什么网站成都住建局官网
  • 可以做试题的网站html5制作网页的步骤
  • 做网站怎么挣钱最快杭州建电商网站多少钱
  • 工业产品设计论文优化工具箱
  • 室内设计招标网站如何规划一个外贸网站
  • 吕梁推广型网站建设商城建设网站公司
  • 小城市网站建设成品网站免费下载
  • 青海网站建设与维护wordpress弹窗打开网页
  • 网站开发 入门做网站创业
  • 网站cms是什么意思网上做ps赚钱的网站
  • 普宁做男科检查长江网站L佛山定制软件开发公司
  • 青岛专业网站设计的公司全国域名备案查询
  • 网站优化待遇ppt模板制作免费下载
  • 建一个收费网站直播app开发技术
  • 便利的菏泽网站建设wordpress 分库
  • 网站建设书籍2013年的惠州响应式网站建设
  • 做直播网站需要什么资质东莞seo建站排名
  • 更换网站ico最简单的手机网站制作
  • 工装设计效果图网站上海红酒网站建设
  • 网站改标题百度推广登陆平台
  • 高端大气网站设计欣赏汽车门户网站 源码
  • 兼职做平面模特网站企业门户网站建设管理制度