电子商务网站开发进什么科目,个人导航页模板,建筑公司网站运营方案,绍兴网站制作公司目录
1.Matplotlib基础绘图与定制化
1.1. 基础绘图
1.2. 定制化
2.Seaborn高级图表类型与样式设定
2.1. 高级图表类型 2.2. 样式设定
3.实战#xff1a;绘制多维度数据可视化报告
4.总结 1. 前言 在数据科学领域#xff0c;数据可视化扮演着至关重要的角色。通过图形化…目录
1.Matplotlib基础绘图与定制化
1.1. 基础绘图
1.2. 定制化
2.Seaborn高级图表类型与样式设定
2.1. 高级图表类型 2.2. 样式设定
3.实战绘制多维度数据可视化报告
4.总结 1. 前言 在数据科学领域数据可视化扮演着至关重要的角色。通过图形化的展示我们可以更直观地理解数据的分布、趋势以及不同变量之间的关系。Matplotlib和Seaborn是两个在Python中非常流行的数据可视化库前者提供了基础的绘图功能后者则提供了更高级的图表类型和样式设定。接下来我们将通过实战的方式探索这两个库在数据可视化中的应用。 更多Python在人工智能中的应用案例欢迎关注《Python人工智能实战》栏目
2.Matplotlib基础绘图与定制化
2.1. 基础绘图 Matplotlib是Python中最为基础且功能强大的数据可视化库之一。它可以绘制各种类型的图表如折线图、散点图、柱状图等并且允许用户进行高度定制。 以下是一些基本图表的创建示例
import matplotlib.pyplot as plt
import numpy as np# 创建数据
x np.linspace(0, 2 * np.pi, 100)
y np.sin(x)# 绘制折线图
plt.plot(x, y, labelSine Function)
plt.xlabel(Angle (radians))
plt.ylabel(sin(x))
plt.legend()
plt.show() # 显示图形# 绘制散点图
plt.scatter(x, np.cos(x), labelCosine Function)
plt.xlabel(Angle (radians))
plt.ylabel(cos(x))
plt.legend()
plt.show()# 绘制直方图
data np.random.normal(loc0, scale1, size1000)
plt.hist(data, bins30, densityTrue, alpha0.5, labelNormal Distribution)
plt.xlabel(Value)
plt.ylabel(Density)
plt.legend()
plt.show() 本例中折线图效果 本例中散点图效果 本例中直方图效果 2.2. 定制化 Matplotlib允许对图表的各个元素进行精细定制包括颜色、线条样式、字体、坐标轴、图例、网格等。以下是对折线图进行定制的例子
import matplotlib.pyplot as plt
import numpy as npx np.linspace(0, 2 * np.pi, 100)
y np.sin(x)# 自定义颜色、线宽、线型
plt.plot(x, y, colorcrimson, linewidth2.5, linestyle--)# 设置坐标轴范围、刻度
plt.xlim([0, 2*np.pi])
# 使用LaTeX格式显示π
plt.xticks((-np.pi, -np.pi/2, np.pi/2, np.pi),(r$\pi$, r$-\frac{\pi}{2}$, r$\frac{\pi}{2}$, r$\pi$))
# 添加图例、标题、网格
plt.legend([Sine Function])
plt.title(Customized Sine Plot)
plt.grid(True, linestyledashed, alpha0.9)# 修改字体、背景色
plt.rcParams[font.family] Arial
plt.rcParams[axes.facecolor] lightgoldenrodyellowplt.show() 定制化效果 3.Seaborn高级图表类型与样式设定 Seaborn是基于Matplotlib的高级统计图形库提供更高级别的接口和更美观的默认样式。它特别擅长展示多变量数据的复杂关系。
3.1. 高级图表类型
线性回归图展示两个连续变量之间的线性关系及其置信区间。
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pdtips sns.load_dataset(tips)sns.lmplot(xtotal_bill, ytip, datatips, hueday, palettemuted)
plt.show() 线性回归图 热力图展示数据的二维矩阵用颜色强度表示数值大小。
import seaborn as sns
import pandas as pd
from matplotlib import pyplot as plt
tips sns.load_dataset(tips)
# pandas2.0版本后原来corr函数自动忽略字符串等非浮点数的特性被修改。现在需要加上numeric_onlyTrue才会忽略字符串。
corr tips.corr(numeric_onlyTrue)
sns.heatmap(corr, annotTrue, cmapcoolwarm)
plt.show() 热力图 3.2. 样式设定 Seaborn提供多种内置样式可以通过set_theme()函数全局设置
import seaborn as sns
# style 包括darkgrid、whitegrid、dark、white
sns.set_theme(styledarkgrid) # 设置为深色网格样式# 继续绘制图表...也可以针对特定图表进行单独样式调整如更改颜色映射、设置透明度等。
4.实战绘制多维度数据可视化报告 以鸢尾花Iris数据集为例我们使用Matplotlib与Seaborn联合创建一份包含多种图表的可视化报告
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
from sklearn.datasets import load_iris
import numpy as np
iris load_iris()
df pd.DataFrame(datanp.c_[iris[data], iris[target]],columnsiris[feature_names] [species])
print(df.columns)
# 分析不同物种花瓣长度与宽度的关系
sns.lmplot(xsepal length (cm), ypetal width (cm), datadf, huespecies, colspecies, ciNone)plt.suptitle(Petal Length vs Width by Species)# 展示所有特征间的相关性
corr df.corr()
sns.heatmap(corr, annotTrue, cmapcoolwarm, linewidths.5)
plt.title(Feature Correlation Matrix)# 绘制箱线图对比各物种的萼片长度
sns.boxplot(xspecies, ysepal length (cm), datadf, paletteSet2)
plt.title(Sepal Length Distribution Across Species)plt.show() 多维度数据可视化报告 这份报告包含了线性回归图、热力图以及箱线图分别展示了鸢尾花不同物种间花瓣长度与宽度的关系、所有特征的相关性以及萼片长度在不同物种间的分布情况。通过这样的多维度可视化我们可以直观地洞察数据内在结构与关联为后续数据分析提供有力支持。
5.总结 以上就是利用Matplotlib与Seaborn进行数据可视化的基础操作与实战应用熟练掌握这些技巧将极大地提升数据洞察力和沟通效率。 更多Python在人工智能中的使用方法欢迎关注《Python人工智能实战》栏目