空壳主体接入网站,公司网站开发需要做哪些事,如何入侵网站后台密码,腾讯云域名备案流程贝叶斯简介
贝叶斯公式#xff0c;又称贝叶斯定理、贝叶斯法则#xff0c;最初是用来描述两个事件的条件概率间的关系的公式#xff0c;后来被人们发现具有很深刻的实际意义和应用价值。该公式的实际内涵是#xff0c;支持某项属性的事件发生得愈多#xff0c;则该属性成…贝叶斯简介
贝叶斯公式又称贝叶斯定理、贝叶斯法则最初是用来描述两个事件的条件概率间的关系的公式后来被人们发现具有很深刻的实际意义和应用价值。该公式的实际内涵是支持某项属性的事件发生得愈多则该属性成立的可能性就愈大。利用贝叶斯公式可以定量地描述由果推因的可靠程度在经济、医药、人工智能等领域中广泛应用。贝叶斯公式可以拓展为随机变量形式在贝叶斯统计的观点下如果已知样本的观察值便可以使用参数的后验分布来进行参数估计。
贝叶斯分类器 参数 alpha 类型浮点数默认为 1.0 fit_prior 类型布尔值默认为 True。 binarize二值化 浮点数或 None默认值0.0样本特征二值化映射到布尔值的阈值。如果为 None则假定输入已由二进制向量组成。 class_prior 数组形状为 (n_classes,)默认值为 None类别的先验概率。如果指定则先验不会根据数据进行调整。
贝叶斯实例 我们通过贝叶斯的算法实例通过算法来实现项目。 本项目目标是对数据进行分类共一百条数据且第一列为数据编号不参与项目最后一列为数据的分类标签有0和1类别。 项目过程
导入数据处理数据划分数据通过贝叶斯分类器训练模型自测并用测试集测试产生分类报告和绘制混淆矩阵
导入数据 数据通过网盘分享的文件iris.csv 链接: https://pan.baidu.com/s/1ssc_VSVSUbkzz2-SOipV9w 提取码: jq54 # 导入数据
data pd.read_csv(iris.csv,headerNone)处理数据
# 删除第一列
data data.drop(0,axis1)
x_whole data.drop(5,axis1) # 删除第5列其余为原始特征数据
y_whole data[5] # 第5列为原始标签划分数据
# 划分训练集和测试集从原始数据中划分20%为测试集80%为训练集。
from sklearn.model_selection import train_test_split
x_train_w,x_test_w,y_train_w,y_test_w\train_test_split(x_whole,y_whole,test_size0.2,random_state0)通过贝叶斯分类器训练模型
# 导入贝叶斯分类器
from sklearn.naive_bayes import MultinomialNB
classifier MultinomialNB()
# 训练模型
classifier.fit(x_train_w,y_train_w)自测并用测试集测试
# 使用训练集自测
from sklearn import metrics
train_pred classifier.predict(x_train_w)
# 使用测试集进行测试
test_pred classifier.predict(x_test_w)产生分类报告和绘制混淆矩阵
# 分别对训练集和测试集的结果产生分类报告和混淆矩阵
print(metrics.classification_report(y_train_w,train_pred))
cm_plot(y_train_w,train_pred).show()
print(metrics.classification_report(y_test_w,test_pred))
cm_plot(y_test_w,test_pred).show()可以通过分类报告和混淆矩阵可以看出没有产生过拟合和欠拟合等准确率和召回率都很高。