会计信息网站建设的意思,能自己做网站吗,网站建设经济可行性,生活服务网站建设四、机器学习基础概念介绍 1_机器学习基础概念机器学习分类1.1 有监督学习1.2 无监督学习 2_有监督机器学习—常见评估方法数据集的划分2.1 留出法2.2 校验验证法#xff08;重点方法#xff09;简单交叉验证K折交叉验证#xff08;单独流出测试集#xff09;#xff08;常… 四、机器学习基础概念介绍 1_机器学习基础概念机器学习分类1.1 有监督学习1.2 无监督学习 2_有监督机器学习—常见评估方法数据集的划分2.1 留出法2.2 校验验证法重点方法简单交叉验证K折交叉验证单独流出测试集常用方法/Sklearn的默认方法k折交叉验证不单独留出测试集留一法交叉验证Subject-wise交叉验证 2.3 bootstrap自助法 3_ 有监督机器学习—学习评价指标3.1 准确率Accuracy混淆矩阵3.2 精确率Precision3.3 召回率Recall3.4 特异度Specificity3.5 F1-值F1-score3,6 ROC曲线3.7 AUC面积3.8 PR曲线 4_continue...后续更新 1_机器学习基础概念
机器学习一般可以分为训练和测试两个步骤。 训练让模型学习数据的特点。 测试让模型对新的数据进行预测对比预测结果与实际结果之间的差异。 训练集这批数据是供模型学习使用。 测试集这批数据是供模型测试使用。 一般情况训练集和测试集是完全不相同的训练集和测试集发生重叠是一个严重错误
机器学习分类
1按照学习方式
有监督学习训练数据包含了数据本身及其对应的标签。每个训练数据都有一个明确的标识或结果。无监督学习训练数据只包含数据本身不包含对应的标签。例如通过聚类算法对很多段EEG信号进行聚类分析。模型能够自主的学习到一些数据的特点。通常缺乏先验知识因此难以对数据进行标注或者标注成本太高半监督学习部分训练数据有标签部分训练数据没有标签。强化学习强化学习的标签可以不是一个明确的标识或结果。 一般是一个反馈或者奖励。
2按照算法的原理
传统的机器学习(不包含任何人工神经网络结构此文章的重点)深度学习
1.1 有监督学习
监督学习一般解决两个问题分类和回归 1 分类和回归是做什么的
无论是分类还是回归其本质都是对输入进行预测都是有监督学习。分类是根据输出得到一个分类的类别而回归是根据输出得到一个具体的值。
2分类和回归的区别
分类问题的输出的物体所属的类别而回归问题的输出是物体的值。分类问题的输出是离散值0123,…回归问题输出的是连续值36.7,36.8,…eg:输入是一堆气象数据 如果输出是具体的天气情况雨天晴天阴天 —分类— 如果输出是具体的温度 —回归—
3有监督学习有哪些
1.2 无监督学习
无监督学习一般解决两个问题聚类和降维 1聚类
在无监督学习中数据不会带有任何标签。将这些无标签数据分成N个分开点集称为簇的算法就被称为聚类算法。常用聚类算法K均值聚类和层次聚类聚类和分类的区别分类是有标签的每个物体有其具体的明确的归属。而聚类是没有标签的根据算法不同可能会得到不通过的结果。
2降维
采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。降维是对数据本身处理不需要标签。常用降维算法PCA、张量分解。
2_有监督机器学习—常见评估方法
常见的评估方法有留出法、校验验证法和自助法
数据集的划分
第一种训练集和测试集不建议适用第二种训练集、验证集和测试集正确的数据集划分方法
训练集——学生的课本学生 根据课本里的内容来掌握知识。 验证集——作业通过作业可以知道 不同学生学习情况、进步的速度快慢。 测试集——考试考的题是平常都没有见过考察学生举一反三的能力。
正确做法 在训练集上训练模型在验证集上评估模型对模型进行参数调整最后在测试集上测试模型。
2.1 留出法
将数据集D分割为两个互斥的集合训练集S和测试集T。其中训练集S还可以进一步划分为训练集S1和验证集V。数据集划分完毕后直接在训练集S上训练模型在验证集S1上评估模型在测试集T上测试模型即可。
一般情况下会选择20%左右的数据作为测试集。 缺点数据选择随机结果的方差比较大
2.2 校验验证法重点方法
校验验证法能充分利用数据集但不适用于特别大的数据集
一般分为简单交叉验证留一法交叉验证和K折交叉验证其中K折交叉验证单独流出测试集该方法为常用方法Sklearn的默认方法
简单交叉验证
将样本全部打乱随机的将样本数据集分为互斥的两个部分训练集和测试集。其中训练集还可以划分为训练集和验证集。通过训练集训练模型通过验证集选择模型参数在测试集上评估模型的分类率。接着重新把样本数据打乱重新划分训练集和测试集。重复上述过程若干次此时将会得到若千个分类率。选择最大的分类率作为最终分类率。
等价于将留出法重复n次通常用于模型预筛可作为论文中探讨模型选择的一部分。
K折交叉验证单独流出测试集常用方法/Sklearn的默认方法
将样本全部打乱随机从样本数据集划分出互斥的两部分训练集和测试集。从训练集D分类K大小相似的互斥子集。每次选用K-1个子集作为训练集余下的那个子集作为验证集。这样就得到了K组训练/验证集从而可以进行 K次训练和验证可以返回K个模型。在测试集上分别对K个模型进行测试得到分类率最终K次测试中分类率的均值作为最终分类率。
k为几就是几折交叉验证通常五折/十折。
k折交叉验证不单独留出测试集 单独留出测试集的交叉验证会在进行交叉验证前单独留出测试集后续所有的交叉验证都会最终在测试集上进行测试。而不单独留出测试集的折交叉验证不会单独留出测试集训练集、验证集和测试集将一会通过“交叉”产生。数据量比较多10折。10000个样本
留一法交叉验证
当K折交叉验证中的K与样本个数N相等时此时该验证方法被称为“留一法”。理论上留一法对数据的利用最为充分其结果最接近实际的结果。如果样本数据比较大会带来极大的计算量因此留一法一般只适用于小样本量数据集。最终K个模型分类率的均值作为最终分类率。注意在神经科学领域一般使用留一被试法留一被试法将同一个被试的所有的样本视为一个特定的集合每次选择一个被试的样本作为测试集其他被试的样本作为训练集。
Subject-wise交叉验证 2.3 bootstrap自助法
3_ 有监督机器学习—学习评价指标
3.1 准确率Accuracy 准确率能够清晰的判断我们模型的表现但有一个严重的缺陷 在正负样本不均衡的情况下占比大的类别往往会成为影响 Accuracy 的最主要因素此时的 Accuracy 并不能很好的反映模型的整体情况。 例如一个测试集有正样本99个负样本1个。模型把所有的样本都预测为正样本那么模型的Accuracy为99%看评价指标模型的效果很好但实际上模型没有任何预测能力。
混淆矩阵
TP True Postive 真阳性 FP False Positive 假阳性 FN False Negative 假阴性 TN True Negative 真阴性 比如我们一个模型对15个样本进行预测然后结果如下。 真实值0 1 1 0 1 1 0 0 1 0 1 0 1 0 0 预测值1 1 1 1 1 0 0 0 0 0 1 1 1 0 1
3.2 精确率Precision
精度precision, 或者PPV,positive predictive value) TP / (TP FP) 在上面的例子中精度5/(54) 0.556
3.3 召回率Recall
·召回recall或者敏感度sensitivity真阳性率TPRTrue Positive Rate) TP /(TP FN) 在上面的例子中召回5/(52) 0.714 3.4 特异度Specificity
特异度specificity或者真阴性率TNRTrue Negative Rate) TN / (TN FP) 在上面的例子中特异度 4 / (42) 0.667
3.5 F1-值F1-score
F1-值(F1-score) 2TP / (2TPFPFN) 精确率和召回率是一对矛盾的指标因此需要放到一起综合考虑。F1-score是精确率和召回率的调和平均值。 相对于ACC的优势能够同时表明模型对正负样本的预测能力 在上面的例子中F1-值 25 / (2542) 0.625
敏感度和特异度有何用 特异度(specificity)TNR,即它反映筛检试验确定非病人的能力。 敏感度(sensitivity召回率)TPR,即它反映筛检试验确定病人的能力。 敏感度高漏诊率低特异度高误诊率低。 例如核酸检测允许比较高的误诊率但漏诊率低一定要很低。
3,6 ROC曲线
ROC曲线横轴FPR纵轴TPR该曲线越接近左上角越好 TPR TP / (TPFN); 真阳率 FPR FP / (FP TN); 伪阳率
3.7 AUC面积
AUCROC与坐标轴围成图像的面积 AUC 1是完美分类器。 AUC [0.85, 0.95], 效果很好 AUC [0.7, 0.85], 效果一般 AUC [0.5, 0.7],效果较低但用于预测股票已经很不错了 AUC 0.5跟随机猜测一样例丢铜板模型没有预测价值。 AUC 0.5比随机猜测还差但只要总是反预测而行就优于随机猜测。
3.8 PR曲线
仅供了解横轴是recall纵轴是precision越接近右上角越好
4_continue…后续更新 文章转载自: http://www.morning.rkdzm.cn.gov.cn.rkdzm.cn http://www.morning.mjctt.cn.gov.cn.mjctt.cn http://www.morning.cwrnr.cn.gov.cn.cwrnr.cn http://www.morning.qkqpy.cn.gov.cn.qkqpy.cn http://www.morning.dhxnr.cn.gov.cn.dhxnr.cn http://www.morning.gsksm.cn.gov.cn.gsksm.cn http://www.morning.qwmdx.cn.gov.cn.qwmdx.cn http://www.morning.fygbq.cn.gov.cn.fygbq.cn http://www.morning.tlnbg.cn.gov.cn.tlnbg.cn http://www.morning.ykmtz.cn.gov.cn.ykmtz.cn http://www.morning.ljfjm.cn.gov.cn.ljfjm.cn http://www.morning.xbmwm.cn.gov.cn.xbmwm.cn http://www.morning.lbzgt.cn.gov.cn.lbzgt.cn http://www.morning.kngx.cn.gov.cn.kngx.cn http://www.morning.dddcfr.cn.gov.cn.dddcfr.cn http://www.morning.sbyhj.cn.gov.cn.sbyhj.cn http://www.morning.ssrjt.cn.gov.cn.ssrjt.cn http://www.morning.zlhbg.cn.gov.cn.zlhbg.cn http://www.morning.mpsnb.cn.gov.cn.mpsnb.cn http://www.morning.tqqfj.cn.gov.cn.tqqfj.cn http://www.morning.txtzr.cn.gov.cn.txtzr.cn http://www.morning.srzhm.cn.gov.cn.srzhm.cn http://www.morning.tklqs.cn.gov.cn.tklqs.cn http://www.morning.rklgm.cn.gov.cn.rklgm.cn http://www.morning.jydky.cn.gov.cn.jydky.cn http://www.morning.yrnrr.cn.gov.cn.yrnrr.cn http://www.morning.rfwrn.cn.gov.cn.rfwrn.cn http://www.morning.ljsxg.cn.gov.cn.ljsxg.cn http://www.morning.gfqjf.cn.gov.cn.gfqjf.cn http://www.morning.klrpm.cn.gov.cn.klrpm.cn http://www.morning.qtkdn.cn.gov.cn.qtkdn.cn http://www.morning.ftcrt.cn.gov.cn.ftcrt.cn http://www.morning.rcjyc.cn.gov.cn.rcjyc.cn http://www.morning.trrhj.cn.gov.cn.trrhj.cn http://www.morning.mzwfw.cn.gov.cn.mzwfw.cn http://www.morning.bfnbn.cn.gov.cn.bfnbn.cn http://www.morning.hcgbm.cn.gov.cn.hcgbm.cn http://www.morning.mxhys.cn.gov.cn.mxhys.cn http://www.morning.krxzl.cn.gov.cn.krxzl.cn http://www.morning.gywfp.cn.gov.cn.gywfp.cn http://www.morning.fqpyj.cn.gov.cn.fqpyj.cn http://www.morning.ylpwc.cn.gov.cn.ylpwc.cn http://www.morning.tkyry.cn.gov.cn.tkyry.cn http://www.morning.kxbdm.cn.gov.cn.kxbdm.cn http://www.morning.tsycr.cn.gov.cn.tsycr.cn http://www.morning.qkskm.cn.gov.cn.qkskm.cn http://www.morning.rlkgc.cn.gov.cn.rlkgc.cn http://www.morning.hzqjgas.com.gov.cn.hzqjgas.com http://www.morning.yjmlg.cn.gov.cn.yjmlg.cn http://www.morning.pwlxy.cn.gov.cn.pwlxy.cn http://www.morning.nrzbq.cn.gov.cn.nrzbq.cn http://www.morning.dnhdp.cn.gov.cn.dnhdp.cn http://www.morning.mkxxk.cn.gov.cn.mkxxk.cn http://www.morning.xswrb.cn.gov.cn.xswrb.cn http://www.morning.jjhrj.cn.gov.cn.jjhrj.cn http://www.morning.zrhhb.cn.gov.cn.zrhhb.cn http://www.morning.jjhrj.cn.gov.cn.jjhrj.cn http://www.morning.krfpj.cn.gov.cn.krfpj.cn http://www.morning.wxfgg.cn.gov.cn.wxfgg.cn http://www.morning.nrrzw.cn.gov.cn.nrrzw.cn http://www.morning.drmbh.cn.gov.cn.drmbh.cn http://www.morning.dmzfz.cn.gov.cn.dmzfz.cn http://www.morning.rgkd.cn.gov.cn.rgkd.cn http://www.morning.ghfmd.cn.gov.cn.ghfmd.cn http://www.morning.lstmq.cn.gov.cn.lstmq.cn http://www.morning.wwwghs.com.gov.cn.wwwghs.com http://www.morning.slnz.cn.gov.cn.slnz.cn http://www.morning.rlpmy.cn.gov.cn.rlpmy.cn http://www.morning.wdshp.cn.gov.cn.wdshp.cn http://www.morning.wmrgp.cn.gov.cn.wmrgp.cn http://www.morning.nlryq.cn.gov.cn.nlryq.cn http://www.morning.dygqq.cn.gov.cn.dygqq.cn http://www.morning.ydzly.cn.gov.cn.ydzly.cn http://www.morning.qtnmp.cn.gov.cn.qtnmp.cn http://www.morning.nsmyj.cn.gov.cn.nsmyj.cn http://www.morning.wtwhj.cn.gov.cn.wtwhj.cn http://www.morning.ybhrb.cn.gov.cn.ybhrb.cn http://www.morning.hotlads.com.gov.cn.hotlads.com http://www.morning.gbrps.cn.gov.cn.gbrps.cn http://www.morning.yrflh.cn.gov.cn.yrflh.cn