网站后台编辑不了网上推广产品哪个网好
补充:调整超参数的原因
补充:关于“验证集”
验证集(Validation Set)是机器学习中非常重要的一个概念。它的主要作用如下:
1. 模型调参
在训练模型时,很多算法有“超参数”需要手动设置,比如决策树的最大深度、KNN的K值、LightGBM的学习率等。我们不能直接用测试集来调这些参数,否则会导致“作弊”——模型对测试集有了“提前了解”,评估结果就不真实。
验证集就是用来在训练过程中测试不同参数效果,帮助你选择最优参数的。
2. 防止过拟合
如果只用训练集来训练和评估模型,模型可能会记住训练集的所有细节,导致在新数据上表现很差(过拟合)。
验证集可以帮助你发现模型是否过拟合:
- 如果模型在训练集上表现很好,但在验证集上表现很差,说明模型过拟合了。
3. 模型选择
有时你会尝试多种不同的模型(比如决策树、随机森林、LightGBM等),需要选出表现最好的那个。
验证集的评估结果可以帮助你公平地比较不同模型的优劣,选择最合适的模型。
4. 训练集、验证集、测试集的区别
- 训练集(Train Set):用来训练模型,模型“学习”用的数据。
- 验证集(Validation Set):用来调参和选择模型,模型“考试”用的数据,但不是最终成绩。
- 测试集(Test Set):只在最后评估模型的泛化能力,模拟模型在真实新数据上的表现。
手写笔记复习
今日复习到这里,明日继续,加油!!!@浙大疏锦行