当前位置: 首页 > news >正文

镇江门户网志鸿优化设计电子版

镇江门户网,志鸿优化设计电子版,珠海公司网站制作,网站上传在空间哪里文章目录 背景参考官网信息训练调参模型保存推理 背景 想在 GPU 上使用使用闪电般快速的提升方法?了解这个库就好了。在很多任务上,它都比 LightGBM 和 XGBoost 快。 ThunderGBM 的主要特征如下: 通常是其它库的 10 倍。 支持 Python&#x…

文章目录

  • 背景
  • 参考官网信息
  • 训练
  • 调参
  • 模型保存
  • 推理

背景

想在 GPU 上使用使用闪电般快速的提升方法?了解这个库就好了。在很多任务上,它都比 LightGBM 和 XGBoost 快。

ThunderGBM 的主要特征如下:

通常是其它库的 10 倍。
支持 Python(scikit-learn)接口。
支持操作系统 Linux。
支持分类、回归和排序。

ThunderGBM 预测和训练的整体流程
ThunderGBM 主要作者包括新加坡国立大学的 Zeyi Wen 和 Qinbin Li、华南理工大学的 Jiashuai Shi 等,指导教师为 NUS 的 Bingsheng He。

参考官网信息

https://gitee.com/Wyq131/thundergbm?_from=gitee_search#key-members-of-thundergbm
https://github.com/Xtra-Computing/thundergbm/blob/master/docs/parameters.md

训练

clf = TGBMClassifier(n_trees =170,depth = 12, max_num_bin=128,bagging=1)
'''
class TGBMModel(depth = 6, num_round = 40, n_device = 1, min_child_weight = 1.0, lambda_tgbm = 1.0, gamma = 1.0, max_num_bin = 255, verbose = 0, column_sampling_rate = 1.0, bagging = 0, n_parallel_trees = 1, learning_rate = 1.0, objective = "reg:linear", num_class = 1, path = "../dataset/test_dataset.txt"))
'''
# 模型训练
begin = time.time()
# clf= RandomForestClassifier(n_estimators=100,
# #                             random_state=1,
#                             n_jobs=-1)
clf.fit(X_train,y_train)

调参

参数跟随机森林类似,关于参数的影响可参考随机森林
在随机森林(Random Forest)中,不同参数的设置会对模型的性能和行为产生影响。下面是一些常见的随机森林参数及其影响:
n_estimators
:决策树的数量。增加树的数量可以提高模型的表达能力和稳定性,但也会增加训练时间和内存消耗。
max_features
:每棵树考虑的特征数。较小的值可以增加树之间的多样性,减少特征间的相关性,但可能会导致模型的偏差增加。较大的值可以使模型更加稳定,但可能会导致过拟合。
max_depth
:树的最大深度。较大的值可以增加模型的表达能力,但也容易导致过拟合。较小的值可以限制模型的复杂度,减少过拟合风险,但可能会导致模型的偏差增加。
min_samples_split
:内部节点分裂所需的最小样本数。较小的值可以使模型更加灵活,但也容易过拟合。较大的值可以增加模型的保守性,避免过拟合。
min_samples_leaf
:叶子节点所需的最小样本数。较小的值可以使模型更加灵活,但也容易过拟合。较大的值可以增加模型的保守性,避免过拟合。
bootstrap
:是否使用自助采样。如果设置为True,则每个决策树的训练集将使用有放回抽样的方式从原始训练集中抽取。这有助于增加模型的多样性,减少方差。如果设置为False,则每个决策树的训练集将使用原始训练集的全部样本。
random_state
:随机种子。通过设置相同的种子,可以确保每次运行时随机性的一致性。
这些参数的最佳设置取决于具体的数据集和问题。通常,可以通过交叉验证来评估不同参数组合的性能,并选择性能最好的组合。增加树的数量、限制树的深度和节点分裂的样本数、增加特征的随机性等方法都可以用于控制模型的复杂度和泛化能力。在调整参数时,需要权衡模型的准确性和计算资源之间的平衡。

(12 封私信 / 80 条消息) 随机森林Random Forests的各个参数对模型的影响? - 知乎 (zhihu.com)
在这里插入图片描述

模型保存

clf.save_model(“path”)

支持多种格式

clf.save_model('thundergbm.json')
clf.save_model('thundergbm.xgb')
clf.save_model('thundergbm.gbm')
clf.save_model('thundergbm.txt')

推理

clf.model.load(“path”)

先实例化,然后导入模型

clf = TGBMClassifier()
# You should specific objective here as in training stage
clf.load_model('path/thundergbm.json')
y_pred = clf.predict(X_test)

推理时,使用json格式比其他几种格式加粗样式时间长一点,txt格式时间最短。

http://www.tj-hxxt.cn/news/75698.html

相关文章:

  • 营销型企业网站建设包括什么网络营销成功案例ppt免费
  • 佛山网站制作哪家好西安企业做网站
  • 怎样申请网站域名排名第一的玉米品种
  • 广州北京网站建设正规电商培训班
  • 网站建设公司无锡app地推网
  • 快乐彩网站做友情链接检索数据分析
  • 商业图片素材网站推广优化关键词
  • c 做网站教程网站排名优化软件联系方式
  • 做点阵纸的网站重庆seo网站推广优化
  • 网站开发完以后交付源代码内蒙古最新消息
  • 网店运营流程步骤网站优化排名方法有哪些
  • 付费网站怎么做网络推广接单平台
  • 新疆生产建设兵团第七师门户网站抖音搜索排名
  • 网站开发培训学校今日最新国际新闻
  • 爱情动做电影网站推荐天津seo优化公司
  • 效果图设计师主要做什么优化方案电子版
  • 做网站说要自己贴税点是怎么回事呀如何用google搜索产品关键词
  • 佛山营销型网站seo1域名查询
  • 河北农业建设信息网站百度热搜榜排名今日
  • 武汉 外贸网站建设公司互联网营销师有什么用
  • 企业网站建设原则百度精准获客平台
  • 太原建站公司点击查看泰安seo公司
  • 网站如何做等级保护seo优化排名易下拉用法
  • 宝鸡做网站设计个人如何注册网址
  • 帝国cms做的网站新闻类软文营销案例
  • 网站建设方案预算费用预算无锡营销型网站制作
  • 手机网站功能分析网络营销是指什么
  • 公司网站banner怎么做网络推广技术外包
  • 建设银行网站怎么登陆不了成都网络营销搜索推广
  • 网站建设 服务内容 费用太原seo排名优化软件