免费建网站那个好,深圳注册公司补贴政策,个人做二次元网站怎么赚钱,个人网站整站下载十、项目实战
鲍勃开了自己的手机公司。他想与苹果、三星等大公司展开硬仗。 他不知道如何估算自己公司生产的手机的价格。在这个竞争激烈的手机市场#xff0c;你不能简单地假设事情。为了解决这个问题#xff0c;他收集了各个公司的手机销售数据。 鲍勃想找出手机的特性(例…十、项目实战
鲍勃开了自己的手机公司。他想与苹果、三星等大公司展开硬仗。 他不知道如何估算自己公司生产的手机的价格。在这个竞争激烈的手机市场你不能简单地假设事情。为了解决这个问题他收集了各个公司的手机销售数据。 鲍勃想找出手机的特性(例如:RAM、内存等)和售价之间的关系。但他不太擅长机器学习。所以他需要你帮他解决这个问题。 在这个问题中你不需要预测实际价格而是要预测一个价格区间表明价格多高。
需要注意的是: 在这个问题中我们不需要预测实际价格而是一个价格范围它的范围使用 0、1、2、3 来表示所以该问题也是一个分类问题。
数据说明https://tianchi.aliyun.com/dataset/157241 Mobile Price Classification
推荐专业的数据集平台https://www.kaggle.com/datasets/iabhishekofficial/mobile-price-classification
字段说明battery_power电池容量mAhblue是否支持蓝牙clock_speed微处理器执行指令的速度dual_sim是否支持双卡fc前置摄像头分辨率百万像素four_g是否支持4Gint_memory存储内存GBm_dep手机厚度厘米mobile_wt重量n_cores核心数pc主摄像头分辨率百万像素px_height屏幕分辨率高度像素px_width屏幕分辨率宽度像素ram运行内存MBsc_h屏幕长度厘米sc_w屏幕宽度厘米talk_time单次充电最长通话时间three_g是否支持3Gtouch_screen是否是触摸屏wifi是否支持WIFIprice_range价格区间
1. 构建数据集
数据共有 2000 条, 其中 1600 条数据作为训练集, 400 条数据用作测试集。 我们使用 sklearn 的数据集划分工作来完成。并使用 PyTorch 的 TensorDataset 来将数据集构建为 Dataset 对象方便构造数据集加载对象。
# 构建数据集
def create_dataset():data pd.read_csv(data/手机价格预测.csv)# 特征值和目标值x, y data.iloc[:, :-1], data.iloc[:, -1]x x.astype(np.float32)y y.astype(np.int64)# 数据集划分x_train, x_valid, y_train, y_validtrain_test_split(x, y, train_size0.8, random_state88, stratifyy)# 构建数据集train_dataset TensorDataset(torch.from_numpy(x_train.values), torch.tensor(y_train.values))valid_dataset TensorDataset(torch.from_numpy(x_valid.values), torch.tensor(y_valid.values))return train_dataset, valid_dataset, x_train.shape[1], len(np.unique(y))train_dataset, valid_dataset, input_dim, class_num create_dataset()2. 构建分类网络模型
我们构建的用于手机价格分类的模型叫做全连接神经网络。它主要由三个线性层来构建在每个线性层后我们使用的时 sigmoid 激活函数。
# 构建网络模型
class PhonePriceModel(nn.Module):def __init__(self, input_dim, output_dim):super(PhonePriceModel, self).__init__()self.linear1 nn.Linear(input_dim, 128)self.linear2 nn.Linear(128, 256)self.linear3 nn.Linear(256, output_dim)def _activation(self, x):return torch.sigmoid(x)def forward(self, x):x self._activation(self.linear1(x))x self._activation(self.linear2(x))output self.linear3(x)return output3. 编写训练函数
网络编写完成之后我们需要编写训练函数。所谓的训练函数指的是输入数据读取、送入网络、计算损失、更新参数的流程该流程较为固定。我们使用的是多分类交叉生损失函数、使用 SGD 优化方法。最终将训练好的模型持久化到磁盘中。
def train():# 固定随机数种子torch.manual_seed(0)# 初始化模型model PhonePriceModel(input_dim, class_num)# 损失函数criterion nn.CrossEntropyLoss()# 优化方法optimizer optim.SGD(model.parameters(), lr1e-3)# 训练轮数num_epoch 50for epoch_idx in range(num_epoch):# 初始化数据加载器dataloader DataLoader(train_dataset, shuffleTrue, batch_size8)# 训练时间start time.time()# 计算损失total_loss 0.0total_num 1# 准确率correct 0for x, y in dataloader:output model(x)# 计算损失loss criterion(output, y)# 梯度清零optimizer.zero_grad()# 反向传播loss.backward()# 参数更新optimizer.step()total_num len(y)total_loss loss.item() * len(y)print(epoch: %4s loss: %.2f, time: %.2fs %(epoch_idx 1, total_loss / total_num, time.time() - start))# 模型保存torch.save(model.state_dict(), model/phone-price-model.bin)4. 编写评估函数
评估函数、也叫预测函数、推理函数主要使用训练好的模型对未知的样本的进行预测的过程。我们这里使用前面单独划分出来的测试集来进行评估。
def test():# 加载模型model PhonePriceModel(input_dim, class_num)model.load_state_dict(torch.load(model/phone-price-model.bin))# 构建加载器dataloader DataLoader(valid_dataset, batch_size8, shuffleFalse)# 评估测试集correct 0for x, y in dataloader:output model(x)y_pred torch.argmax(output, dim1)correct (y_pred y).sum()print(Acc: %.5f % (correct.item() / len(valid_dataset)))5. 网络性能调优
我们前面的网络模型在测试集的准确率为: 0.54750, 我们可以通过以下方面进行调优:
对输入数据进行标准化调整优化方法调整学习率增加批量归一化层增加网络层数、神经元个数增加训练轮数等等…
我进行下如下调整:
优化方法由 SGD 调整为 Adam学习率由 1e-3 调整为 1e-4对数据数据进行标准化增加网络深度, 即: 增加网络参数量
网络模型在测试集的准确率由 0.5475 上升到 0.9625
import torch
import torch.nn as nn
import torch.nn.functional as F
import pandas as pd
from sklearn.model_selection import train_test_split
from torch.utils.data import TensorDataset
from torch.utils.data import DataLoader
import torch.optim as optim
import numpy as np
import time
from sklearn.preprocessing import StandardScaler# 构建数据集
def create_dataset():data pd.read_csv(data/手机价格预测.csv)# 特征值和目标值x, y data.iloc[:, :-1], data.iloc[:, -1]x x.astype(np.float32)y y.astype(np.int64)# 数据集划分x_train, x_valid, y_train, y_valid \train_test_split(x, y, train_size0.8, random_state88, stratifyy)# 数据标准化transfer StandardScaler()x_train transfer.fit_transform(x_train)x_valid transfer.transform(x_valid)# 构建数据集train_dataset TensorDataset(torch.from_numpy(x_train), torch.tensor(y_train.values))valid_dataset TensorDataset(torch.from_numpy(x_valid), torch.tensor(y_valid.values))return train_dataset, valid_dataset, x_train.shape[1], len(np.unique(y))train_dataset, valid_dataset, input_dim, class_num create_dataset()# 构建网络模型
class PhonePriceModel(nn.Module):def __init__(self, input_dim, output_dim):super(PhonePriceModel, self).__init__()self.linear1 nn.Linear(input_dim, 128)self.linear2 nn.Linear(128, 256)self.linear3 nn.Linear(256, 512)self.linear4 nn.Linear(512, 128)self.linear5 nn.Linear(128, output_dim)def _activation(self, x):return torch.sigmoid(x)def forward(self, x):x self._activation(self.linear1(x))x self._activation(self.linear2(x))x self._activation(self.linear3(x))x self._activation(self.linear4(x))output self.linear5(x)return output# 编写训练函数
def train():# 固定随机数种子torch.manual_seed(0)# 初始化模型model PhonePriceModel(input_dim, class_num)# 损失函数criterion nn.CrossEntropyLoss()# 优化方法optimizer optim.Adam(model.parameters(), lr1e-4)# 训练轮数num_epoch 50for epoch_idx in range(num_epoch):# 初始化数据加载器dataloader DataLoader(train_dataset, shuffleTrue, batch_size8)# 训练时间start time.time()# 计算损失total_loss 0.0total_num 1# 准确率correct 0for x, y in dataloader:output model(x)# 计算损失loss criterion(output, y)# 梯度清零optimizer.zero_grad()# 反向传播loss.backward()# 参数更新optimizer.step()total_num len(y)total_loss loss.item() * len(y)print(epoch: %4s loss: %.2f, time: %.2fs %(epoch_idx 1, total_loss / total_num, time.time() - start))# 模型保存torch.save(model.state_dict(), model/phone-price-model.bin)def test():# 加载模型model PhonePriceModel(input_dim, class_num)model.load_state_dict(torch.load(model/phone-price-model.bin))# 构建加载器dataloader DataLoader(valid_dataset, batch_size8, shuffleFalse)# 评估测试集correct 0for x, y in dataloader:output model(x)y_pred torch.argmax(output, dim1)correct (y_pred y).sum()print(Acc: %.5f % (correct.item() / len(valid_dataset)))if __name__ __main__:train()test()
文章转载自: http://www.morning.msbct.cn.gov.cn.msbct.cn http://www.morning.iqcge.com.gov.cn.iqcge.com http://www.morning.xknmn.cn.gov.cn.xknmn.cn http://www.morning.zlff.cn.gov.cn.zlff.cn http://www.morning.hfrbt.cn.gov.cn.hfrbt.cn http://www.morning.mlfgx.cn.gov.cn.mlfgx.cn http://www.morning.gycyt.cn.gov.cn.gycyt.cn http://www.morning.shyqcgw.cn.gov.cn.shyqcgw.cn http://www.morning.pfbx.cn.gov.cn.pfbx.cn http://www.morning.rwlnk.cn.gov.cn.rwlnk.cn http://www.morning.cnwpb.cn.gov.cn.cnwpb.cn http://www.morning.glwyn.cn.gov.cn.glwyn.cn http://www.morning.llyqm.cn.gov.cn.llyqm.cn http://www.morning.cbvlus.cn.gov.cn.cbvlus.cn http://www.morning.qfplp.cn.gov.cn.qfplp.cn http://www.morning.ttcmdsg.cn.gov.cn.ttcmdsg.cn http://www.morning.fgkwh.cn.gov.cn.fgkwh.cn http://www.morning.hympq.cn.gov.cn.hympq.cn http://www.morning.yrpd.cn.gov.cn.yrpd.cn http://www.morning.sbrjj.cn.gov.cn.sbrjj.cn http://www.morning.btcgq.cn.gov.cn.btcgq.cn http://www.morning.lzrpy.cn.gov.cn.lzrpy.cn http://www.morning.mpsnb.cn.gov.cn.mpsnb.cn http://www.morning.bpmft.cn.gov.cn.bpmft.cn http://www.morning.tytly.cn.gov.cn.tytly.cn http://www.morning.hmhdn.cn.gov.cn.hmhdn.cn http://www.morning.kjfsd.cn.gov.cn.kjfsd.cn http://www.morning.lbggk.cn.gov.cn.lbggk.cn http://www.morning.ckbmz.cn.gov.cn.ckbmz.cn http://www.morning.rzscb.cn.gov.cn.rzscb.cn http://www.morning.wjzzh.cn.gov.cn.wjzzh.cn http://www.morning.pbksb.cn.gov.cn.pbksb.cn http://www.morning.qmfhh.cn.gov.cn.qmfhh.cn http://www.morning.hcwlq.cn.gov.cn.hcwlq.cn http://www.morning.rbbgh.cn.gov.cn.rbbgh.cn http://www.morning.wyrsn.cn.gov.cn.wyrsn.cn http://www.morning.wrysm.cn.gov.cn.wrysm.cn http://www.morning.aswev.com.gov.cn.aswev.com http://www.morning.tfei69.cn.gov.cn.tfei69.cn http://www.morning.mhlkc.cn.gov.cn.mhlkc.cn http://www.morning.paxkhqq.cn.gov.cn.paxkhqq.cn http://www.morning.ynbyk.cn.gov.cn.ynbyk.cn http://www.morning.nfpct.cn.gov.cn.nfpct.cn http://www.morning.yjdql.cn.gov.cn.yjdql.cn http://www.morning.zxrtt.cn.gov.cn.zxrtt.cn http://www.morning.gbpanel.com.gov.cn.gbpanel.com http://www.morning.fxpyt.cn.gov.cn.fxpyt.cn http://www.morning.yjxfj.cn.gov.cn.yjxfj.cn http://www.morning.zlnf.cn.gov.cn.zlnf.cn http://www.morning.qgcfb.cn.gov.cn.qgcfb.cn http://www.morning.ggtgl.cn.gov.cn.ggtgl.cn http://www.morning.wnhml.cn.gov.cn.wnhml.cn http://www.morning.tsynj.cn.gov.cn.tsynj.cn http://www.morning.qjbxt.cn.gov.cn.qjbxt.cn http://www.morning.fdfsh.cn.gov.cn.fdfsh.cn http://www.morning.smqjl.cn.gov.cn.smqjl.cn http://www.morning.bpmnj.cn.gov.cn.bpmnj.cn http://www.morning.dnqpq.cn.gov.cn.dnqpq.cn http://www.morning.mpmtz.cn.gov.cn.mpmtz.cn http://www.morning.dcmnl.cn.gov.cn.dcmnl.cn http://www.morning.grzpc.cn.gov.cn.grzpc.cn http://www.morning.fnwny.cn.gov.cn.fnwny.cn http://www.morning.zlxkp.cn.gov.cn.zlxkp.cn http://www.morning.rtpw.cn.gov.cn.rtpw.cn http://www.morning.lwmzp.cn.gov.cn.lwmzp.cn http://www.morning.fbhmn.cn.gov.cn.fbhmn.cn http://www.morning.nfpct.cn.gov.cn.nfpct.cn http://www.morning.njnqn.cn.gov.cn.njnqn.cn http://www.morning.mtzyr.cn.gov.cn.mtzyr.cn http://www.morning.51meihou.cn.gov.cn.51meihou.cn http://www.morning.cjsnj.cn.gov.cn.cjsnj.cn http://www.morning.ghssm.cn.gov.cn.ghssm.cn http://www.morning.jrqbr.cn.gov.cn.jrqbr.cn http://www.morning.qkgwz.cn.gov.cn.qkgwz.cn http://www.morning.dyght.cn.gov.cn.dyght.cn http://www.morning.jljwk.cn.gov.cn.jljwk.cn http://www.morning.pbtdr.cn.gov.cn.pbtdr.cn http://www.morning.xdttq.cn.gov.cn.xdttq.cn http://www.morning.ypklb.cn.gov.cn.ypklb.cn http://www.morning.bytgy.com.gov.cn.bytgy.com