通化好的网站建设的公司,spring mvc 做网站,seo关键词外包,网站开发市场 知乎房价预测 本题是经典的通过表格数据去预测最终值#xff0c;主要分为几大步骤#xff1a; 一.将数据集修改为可以代入到网络模型的数字#xff0c;因为给的数据大部分都是str类型#xff0c;是无法直接放到网络模型里跑的#xff0c;例如下图#xff0c;很多标签值为str类…房价预测 本题是经典的通过表格数据去预测最终值主要分为几大步骤 一.将数据集修改为可以代入到网络模型的数字因为给的数据大部分都是str类型是无法直接放到网络模型里跑的例如下图很多标签值为str类型并不是数字那么解决办法就是将这些标签分类强制让其变为数字类型
二.创建神经网络模型
三.训练网络最终预测测试集
一.数据集制作和修改数据的预处理
对于表格数据集来说无非就两个操作1.将标签值为str字符型的变为float类型2.将标签值为数字的标准化。
分析题目给的train_csv文件中标签值 发现第一个标签Id对于预测没用那么在制作数据的时候首先需要去除第一个标签数据可以使用.drop[‘id’]也可以用 iloc() 函数去除直接筛选从第二个标签开始的值。 将train_csv文件拉到最后发现最后一个标签值为SalePrice售价我们本题要做的就是去预测售价那么在train_csv文件中最后一个标签SalePrice就是我们训练集的label因此在制作数据集时候也不能要SalePrice标签而前面除了Id的所有标签值就是我们训练集的数据这个房子的各种属性值比如房子修建时间面积或者是否挨着街道等去用这些数据去预测它的房价。
import pandas #表格处理库
import torch #框架#读取数据
train_csvpd.read_csv(/kaggle/input/house-prices-advanced-regression-techniques/train.csv)
test_csvpd.read_csv(/kaggle/input/house-prices-advanced-regression-techniques/test.csv)#重点神经网络去训练数据必须都是Tensor张量模型,iloc将标签值分裂出来,转出来的数据类型为float32
#因为要统一数据类型训练集数据也要转为float32float会提高预测精度直接读出数据为一维而训练
#集的数据为二维所以用reshape将label数据变为二维
train_labeltorch.tensor(train_csv.iloc[:,-1],dtypetorch.float32).reshape(-1,1)