当前位置: 首页 > news >正文

新沂网站建设爱站网seo工具

新沂网站建设,爱站网seo工具,乐陵天气预报15天查询百度,先做网站还是做APP文章目录 背景参考官网信息训练调参模型保存推理 背景 想在 GPU 上使用使用闪电般快速的提升方法?了解这个库就好了。在很多任务上,它都比 LightGBM 和 XGBoost 快。 ThunderGBM 的主要特征如下: 通常是其它库的 10 倍。 支持 Python&#x…

文章目录

  • 背景
  • 参考官网信息
  • 训练
  • 调参
  • 模型保存
  • 推理

背景

想在 GPU 上使用使用闪电般快速的提升方法?了解这个库就好了。在很多任务上,它都比 LightGBM 和 XGBoost 快。

ThunderGBM 的主要特征如下:

通常是其它库的 10 倍。
支持 Python(scikit-learn)接口。
支持操作系统 Linux。
支持分类、回归和排序。

ThunderGBM 预测和训练的整体流程
ThunderGBM 主要作者包括新加坡国立大学的 Zeyi Wen 和 Qinbin Li、华南理工大学的 Jiashuai Shi 等,指导教师为 NUS 的 Bingsheng He。

参考官网信息

https://gitee.com/Wyq131/thundergbm?_from=gitee_search#key-members-of-thundergbm
https://github.com/Xtra-Computing/thundergbm/blob/master/docs/parameters.md

训练

clf = TGBMClassifier(n_trees =170,depth = 12, max_num_bin=128,bagging=1)
'''
class TGBMModel(depth = 6, num_round = 40, n_device = 1, min_child_weight = 1.0, lambda_tgbm = 1.0, gamma = 1.0, max_num_bin = 255, verbose = 0, column_sampling_rate = 1.0, bagging = 0, n_parallel_trees = 1, learning_rate = 1.0, objective = "reg:linear", num_class = 1, path = "../dataset/test_dataset.txt"))
'''
# 模型训练
begin = time.time()
# clf= RandomForestClassifier(n_estimators=100,
# #                             random_state=1,
#                             n_jobs=-1)
clf.fit(X_train,y_train)

调参

参数跟随机森林类似,关于参数的影响可参考随机森林
在随机森林(Random Forest)中,不同参数的设置会对模型的性能和行为产生影响。下面是一些常见的随机森林参数及其影响:
n_estimators
:决策树的数量。增加树的数量可以提高模型的表达能力和稳定性,但也会增加训练时间和内存消耗。
max_features
:每棵树考虑的特征数。较小的值可以增加树之间的多样性,减少特征间的相关性,但可能会导致模型的偏差增加。较大的值可以使模型更加稳定,但可能会导致过拟合。
max_depth
:树的最大深度。较大的值可以增加模型的表达能力,但也容易导致过拟合。较小的值可以限制模型的复杂度,减少过拟合风险,但可能会导致模型的偏差增加。
min_samples_split
:内部节点分裂所需的最小样本数。较小的值可以使模型更加灵活,但也容易过拟合。较大的值可以增加模型的保守性,避免过拟合。
min_samples_leaf
:叶子节点所需的最小样本数。较小的值可以使模型更加灵活,但也容易过拟合。较大的值可以增加模型的保守性,避免过拟合。
bootstrap
:是否使用自助采样。如果设置为True,则每个决策树的训练集将使用有放回抽样的方式从原始训练集中抽取。这有助于增加模型的多样性,减少方差。如果设置为False,则每个决策树的训练集将使用原始训练集的全部样本。
random_state
:随机种子。通过设置相同的种子,可以确保每次运行时随机性的一致性。
这些参数的最佳设置取决于具体的数据集和问题。通常,可以通过交叉验证来评估不同参数组合的性能,并选择性能最好的组合。增加树的数量、限制树的深度和节点分裂的样本数、增加特征的随机性等方法都可以用于控制模型的复杂度和泛化能力。在调整参数时,需要权衡模型的准确性和计算资源之间的平衡。

(12 封私信 / 80 条消息) 随机森林Random Forests的各个参数对模型的影响? - 知乎 (zhihu.com)
在这里插入图片描述

模型保存

clf.save_model(“path”)

支持多种格式

clf.save_model('thundergbm.json')
clf.save_model('thundergbm.xgb')
clf.save_model('thundergbm.gbm')
clf.save_model('thundergbm.txt')

推理

clf.model.load(“path”)

先实例化,然后导入模型

clf = TGBMClassifier()
# You should specific objective here as in training stage
clf.load_model('path/thundergbm.json')
y_pred = clf.predict(X_test)

推理时,使用json格式比其他几种格式加粗样式时间长一点,txt格式时间最短。

http://www.tj-hxxt.cn/news/93799.html

相关文章:

  • 浙江省建设执业注册中心网站彩虹云商城网站搭建
  • 网站网络推广软件职业培训机构资质
  • 深圳html5网站建设张家界seo
  • 做app的网站有哪些怎样在百度答题赚钱
  • 哪一个网站可以做专利检索报告邵阳疫情最新消息
  • 网站备案证书下载密码忘了西安网站建设平台
  • 中美最新消息什么是白帽seo
  • 做招聘网站价格国外搜索引擎大全不屏蔽
  • 中国站长素材网学历提升
  • asp网站上传到服务器上之后一打开就是download厦门关键词排名推广
  • 网站展示怎么做手机建站教程
  • 网站建设团队拍照线上推广营销
  • 郑州招聘网站有哪些seo手机排名软件
  • 建设电子商务网站的规划书怎么样建立自己的网站
  • 怎么看网站是哪个平台做的清远seo
  • 自己做的网站怎么绑定域名十大流量平台
  • 网站自动滚动代码女生seo专员很难吗为什么
  • 易乐自助建站互联网推广有哪些方式
  • wordpress 上传按钮简述seo
  • 平台搭建与拆除seo线上培训机构
  • 石家庄知名网站西安专业做网站公司
  • 北京哪个公司做网站郴州seo网络优化
  • 网站模板百度拍照搜索
  • 网站定制化什么意思上海关键词优化公司哪家好
  • 商丘做网站用什么程序好邀请注册推广赚钱
  • 白酒网站模版站长工具站长
  • 网站建设做网站百度seo优化服务项目
  • 网站banner尺寸是多少营销顾问
  • 网站建设实施关键词下载
  • 最好的微网站建设公司百度网盘官网网页版