当前位置: 首页 > news >正文

重庆网站建设哪里有win10优化大师怎么样

重庆网站建设哪里有,win10优化大师怎么样,广州市手机网站建设怎么样,杭州集团网站建设目录 1.算法流程简介 2.算法核心代码 3.算法效果展示 1.算法流程简介 """ 决策树的应用:对泰坦尼克号数据集成员进行预测生死 算法流程还是比较简单的,简单学习一下决策树跟着注释写即可 文章参考:https://zhuanlan.zhihu.com/p/133838427 算法种遇上sklear…

目录

1.算法流程简介

2.算法核心代码

3.算法效果展示

1.算法流程简介

"""
决策树的应用:对泰坦尼克号数据集成员进行预测生死
算法流程还是比较简单的,简单学习一下决策树跟着注释写即可
文章参考:https://zhuanlan.zhihu.com/p/133838427
算法种遇上sklearn的函数还是比较多的,请将sklearn函数更新到最新
更新代码如下所示:
pip install --upgrade sklearn
"""

2.算法核心代码

#首先导入需要的包
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import classification_report
from sklearn.tree import DecisionTreeClassifier, export_graphviz
from sklearn.feature_extraction import  DictVectorizer
import pandas as pdtitan= pd.read_csv(r'C:\Users\Zeng Zhong Yan\Desktop\train.csv')
# 处理数据,找出特征值和目标值
x = titan[['Pclass', 'Age', 'Sex']]
y = titan['Survived']
print(x)
# 缺失值处理
x['Age'].fillna(x['Age'].mean(), inplace=True)
# 分割数据集到训练集和测试集
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.25)
# 进行处理(特征工程)
dict = DictVectorizer(sparse=False)
x_train = dict.fit_transform(x_train.to_dict(orient="records"))
dict = DictVectorizer(sparse=False)
x_test = dict.fit_transform(x_test.to_dict(orient='records'))
print(dict.get_feature_names_out())
#X_test = vec.fit_transform(X_features)
print(x_train)
# 用决策树进行预测
dec = DecisionTreeClassifier()
dec.fit(x_train, y_train)
# 预测准确率
print("预测的准确率为:", dec.score(x_test, y_test))
# 导出决策树的结构
export_graphviz(dec, out_file=r"C:\Users\Zeng Zhong Yan\Desktop\py.vs\.vscode\数学建模\decision_tree.dot", feature_names=['Age', 'Pclass', 'Sex=female', 'Sex=male'])
算法最终取得的预测正确率:0.78-0.84左右
整体上来看波动还是比较大的
可能是我的数据集不够多,只有800来个,如果用真正的titanic数据集的话,大概会稳定在0.79-0.82之间

3.算法BUG解决


由于现在各种函数库更新比较快,所以有的时候一个看似正常的函数会一直报错.
这个可能与你的库的版本有关,过高或者过低了,没能正确匹配上,我的建议是统一升级到最新版本1.bug1:AttributeError: 'DictVectorizer' object has no attribute 'feature_names_out'
这个就是典型的版本不符合的问题.
我们需要做以下更改:
#老版本代码
dict = DictVectorizer(sparse=False)
x_test = dict.transform(x_test.to_dict(orient='records'))
print(dict.feature_names_out())
#新版本代码
dict = DictVectorizer(sparse=False)
x_test = dict.fit_transform(x_test.to_dict(orient='records'))
print(dict.get_feature_names_out())
#改完就不会报AttributeError: 'DictVectorizer' object has no attribute 'feature_names_out'2.bug2:ValueError: Length of feature_names, 4 does not match number of features, 6
#老版本代码:
export_graphviz(dec, out_file=r"C:\Users\Zeng Zhong Yan\Desktop\py.vs\.vscode\数学建模\decision_tree.dot", feature_names=['age', 'pclass=1st', 'pclass=2nd', 'pclass=3rd', 'sex=female', 'sex=male'])
#新版本代码:
export_graphviz(dec, out_file=r"C:\Users\Zeng Zhong Yan\Desktop\py.vs\.vscode\数学建模\decision_tree.dot", feature_names=['Age', 'Pclass', 'Sex=female', 'Sex=male'])
#解释:因为你原先报错提示你只有4个长度,却要容下6个特征类,这显然是不对的,但是我们发现Pclass=1st/2nd/3rd本质上就属于'Pclass',所以就简化成4个特征维度了

http://www.tj-hxxt.cn/news/96383.html

相关文章:

  • 做网站什么费用培训网站建设
  • 现在asp做网站外包服务公司
  • 福州自助建设网站外链查询
  • 网站开发和web前端开发区别俄罗斯搜索引擎浏览器
  • 网站开发的最后五个阶段免费域名注册永久
  • icp网站信息西安网站推广慧创科技
  • 新网站建设流程图新东方雅思培训价目表
  • 全国疫情最新中高风险地区名单seo提供服务
  • 单位做网站注意什么问题长沙优化科技有限公司正规吗
  • 小公司网站建设现状优化营商环境的措施建议
  • 关于校园网站的策划书seo外链在线工具
  • 天津装饰公司排行榜前十位有哪些百度网站优化公司
  • 东莞一站式网站建设seo服务合同
  • 建筑英才网appseo的内容怎么优化
  • 天津做宠物饲料的网站网址最新连接查询
  • wordpress适合建什么网站吗搜一搜
  • 毕设做网站需要发布到浏览器吗惠州疫情最新情况
  • 2012服务器如何做网站网站友情链接购买
  • 网站建设报价模版百度推广代理商有哪些
  • 上海有名的网站建设公司培训心得体会范文大全1000
  • 网站开发 题目金华seo扣费
  • 四川住房和城乡建设厅网站官网爱站网收录
  • 做网站百科如何在百度发布短视频
  • 安阳网站建设哪家便宜微博推广方法有哪些
  • 福州公司网站seo 知乎
  • 网站网络营销怎么做百度一下百度一下百度一下
  • 南京网站建设企业青岛模板建站
  • 刘金鹏做网站靠谱吗企业网站建设优化
  • 珠海做网站的公司有哪些推广类软文
  • 外包制作app百度seo推广优化