当前位置: 首页 > news >正文

服务好的网站设计重庆网站设计

服务好的网站设计,重庆网站设计,介绍网络营销的短文,wordpress配置文件是参考:DataWhale教程链接 集成学习(上)所有Task: (一)集成学习上——机器学习三大任务 (二)集成学习上——回归模型 (三)集成学习上——偏差与方差 (四)集成学习上——回归模型评估与超参数调优 (五)集成学习上——分类模型 (六)集成学习上——分类模型评…

参考:DataWhale教程链接

集成学习(上)所有Task:

(一)集成学习上——机器学习三大任务

(二)集成学习上——回归模型

(三)集成学习上——偏差与方差

(四)集成学习上——回归模型评估与超参数调优

(五)集成学习上——分类模型

(六)集成学习上——分类模型评估与超参数调优

(七)集成学习中——投票法

(八)集成学习中——bagging

(九)集成学习中——Boosting简介&AdaBoost

(十)集成学习中——GBDT

(十一)集成学习中——XgBoost、LightGBM

(十二)集成学习(下)——Blending

(十三)集成学习(下)——Stacking

(十四)集成学习(下)——幸福感预测

(十五)集成学习(下)——蒸汽量预测

Stacking集成学习算法

Stacking是一种比赛中常用的trick,严格它来说并不是一种算法,而是精美而又复杂的,对模型集成的一种策略。Stacking集成算法可以理解为一个两层的集成,第一层含有多个基础分类器,把输出的预测结果作为第二层的输入特征, 第二层的分类器通常是逻辑回归。

Blending存在的问题:Blending在第二层集成的时候中只会用了验证集的数据产生的特征,对数据的使用浪费比较大。

Stacking:采用交叉验证的思路,产生多组验证集,且可以充分利用训练集。

Blending与Stacking对比:

集成方法BlendingStacking
集成的特征一次划分,特征简单,数据少cv交叉验证,特征略复杂,数据多
泛化能力可能会过拟合健壮性好

看一下Stacking是如何集成算法的:(参考案例:https://www.cnblogs.com/Christina-Notebook/p/10063146.html)
在这里插入图片描述

由于sklearn并没有直接对Stacking的方法,因此我们需要下载mlxtend工具包(pip install mlxtend)

# 1. 简单堆叠3折CV分类
from sklearn import datasetsiris = datasets.load_iris()
X, y = iris.data[:, 1:3], iris.target
from sklearn.model_selection import cross_val_score
from sklearn.linear_model import LogisticRegression
from sklearn.neighbors import KNeighborsClassifier
from sklearn.naive_bayes import GaussianNB 
from sklearn.ensemble import RandomForestClassifier
from mlxtend.classifier import StackingCVClassifierRANDOM_SEED = 42clf1 = KNeighborsClassifier(n_neighbors=1)
clf2 = RandomForestClassifier(random_state=RANDOM_SEED)
clf3 = GaussianNB()
lr = LogisticRegression()# Starting from v0.16.0, StackingCVRegressor supports
# `random_state` to get deterministic result.
sclf = StackingCVClassifier(classifiers=[clf1, clf2, clf3],  # 第一层分类器meta_classifier=lr,   # 第二层分类器random_state=RANDOM_SEED)print('3-fold cross validation:\n')for clf, label in zip([clf1, clf2, clf3, sclf], ['KNN', 'Random Forest', 'Naive Bayes','StackingClassifier']):scores = cross_val_score(clf, X, y, cv=3, scoring='accuracy')print("Accuracy: %0.2f (+/- %0.2f) [%s]" % (scores.mean(), scores.std(), label))
3-fold cross validation:Accuracy: 0.91 (+/- 0.01) [KNN]
Accuracy: 0.95 (+/- 0.01) [Random Forest]
Accuracy: 0.91 (+/- 0.02) [Naive Bayes]
Accuracy: 0.93 (+/- 0.02) [StackingClassifier]
# 我们画出决策边界
from mlxtend.plotting import plot_decision_regions
import matplotlib.gridspec as gridspec
import itertoolsgs = gridspec.GridSpec(2, 2)
fig = plt.figure(figsize=(10,8))
for clf, lab, grd in zip([clf1, clf2, clf3, sclf], ['KNN', 'Random Forest', 
http://www.tj-hxxt.cn/news/57912.html

相关文章:

  • 微信做网站的弊端搜索引擎优化常用方法
  • 一般做淘宝的素材都有哪个网站详情页页面页面
  • 可以做自媒体的网站营销软件网站
  • 网站论坛页怎么做app推广之家
  • 上海 科技网站建设seo的作用是什么
  • 品牌策划的意义百度seo排名优化公司哪家强
  • 响应式网站什么意思百度链接提交工具
  • 北京哪里有做网站的百度图片搜索引擎
  • wordpress加入音乐播放器站内优化主要从哪些方面进行
  • 有没有兼职做设计的网站中国职业培训在线
  • 个人网站模板代码优秀营销软文范例500字
  • 包头网站中山谷歌推广
  • 影楼做网站软文推广公司有哪些
  • 做彩票网站需要代购黄冈网站建设收费
  • 一家做特卖的网站叫什么时候网店推广运营
  • 广州做网站一般要多少钱百色seo外包
  • 平面设计展示网站seoer是什么意思
  • 做外贸用什么网站免费海报模板网站
  • 做电脑网站会很难么百度公司招聘官网最新招聘
  • 做网站设计图用什么软件公司域名注册查询
  • 做网站枣庄东营seo
  • 江门网站制作培训学校建网站找谁
  • 网站地图制作怎么做南昌网站优化公司
  • 免费网站电视剧下载五种新型营销方式
  • 如何制作自己网站新乡百度网站优化排名
  • php网站开发技术要点网络营销有哪些功能
  • 上海长城建设有限公司网站竞价推广和信息流推广
  • 铜川微网站建设app关键词排名优化
  • 自己怎么手机做网站线下推广100种方式
  • 新郑郑州网站建设各行业关键词