当前位置: 首页 > news >正文

网站怎么描述百度友情链接

网站怎么描述,百度友情链接,详情页设计方法,经营性网站备案需要哪些东西足球- EDA的历史数据分析并可视化 背景数据介绍探索数据时需要遵循的一些方向:数据处理导入库数据探索 数据可视化赛事分析主客场比分相关性分析时间序列分析 总结 背景 该数据集包括从1872年第一场正式比赛到2023年的44,341场国际足球比赛的结果。比赛范围从FIFA世…

足球- EDA的历史数据分析并可视化

  • 背景
  • 数据介绍
  • 探索数据时需要遵循的一些方向:
  • 数据处理
    • 导入库
    • 数据探索
  • 数据可视化
    • 赛事分析
    • 主客场比分
    • 相关性分析
    • 时间序列分析
  • 总结

背景

该数据集包括从1872年第一场正式比赛到2023年的44,341场国际足球比赛的结果。比赛范围从FIFA世界杯到FIFI Wild杯再到常规的友谊赛。这些比赛严格来说是男子国际比赛,数据不包括奥运会或至少有一支球队是国家B队、U-23或联赛精选队的比赛。

数据介绍

results.csv包括以下列:

  • date - 比赛日期
  • home_team - 主队的名字
  • away_team - 客场球队的名称
  • home_score - 全职主队得分,包括加时赛,不包括点球大战
  • away_score - 全职客队得分,包括加时赛,不包括点球大战
  • tournament - 锦标赛的名称
  • city - 比赛所在城市/城镇/行政单位的名称
  • country -比赛所在国家的名称
  • neutral - 真/假栏,表示比赛是否在中立场地进行

探索数据时需要遵循的一些方向:

谁是有史以来最好的球队

哪些球队统治了不同时代的足球

古往今来,国际足球有什么趋势——主场优势、总进球数、球队实力分布等

我们能从足球比赛中对地缘政治说些什么吗——国家的数量是如何变化的

哪些球队喜欢相互比赛

哪些国家主办了最多自己没有参加的比赛

举办大型赛事对一个国家在比赛中的胜算有多大帮助

哪些球队在友谊赛和友谊赛中最积极——这对他们有帮助还是有伤害

数据处理

import numpy as np 
import pandas as pd 
import os
for dirname, _, filenames in os.walk('/kaggle/input'):for filename in filenames:print(os.path.join(dirname, filename))

导入库

import matplotlib.pyplot as plt
import seaborn as sns

数据探索

df = pd.read_csv('/kaggle/input/international-football-results-from-1872-to-2017/results.csv')
df.head()

在这里插入图片描述

print(f"This Dataset Includes {df.shape}")

在这里插入图片描述

df.info()

在这里插入图片描述

df.describe()

在这里插入图片描述

df.describe(include=object)

在这里插入图片描述

df.isna().sum()

在这里插入图片描述

将“日期”列转换为日期时间类型

df['date'] = pd.to_datetime(df['date'])

数据可视化

赛事分析

plt.figure(figsize=(20, 12))
sns.countplot(x='tournament', data=df)
plt.xticks(rotation=90)
plt.title('Tournament Distribution')
plt.xlabel('Tournament')
plt.ylabel('Count')
plt.tight_layout()
plt.show()

在这里插入图片描述

主客场比分

plt.figure(figsize=(12, 8))
plt.subplot(1, 2, 1)
sns.histplot(df['home_score'], bins=20, kde=True)
plt.title('Distribution of Home Scores')
plt.xlabel('Home Score')
plt.ylabel('Frequency')
#Setting limit for first plot
plt.ylim(0, 40000)plt.subplot(1, 2, 2)
sns.histplot(df['away_score'], bins=20, kde=True)
plt.title('Distribution of Away Scores')
plt.xlabel('Away Score')
plt.ylabel('Frequency')
# Share y-axis between subplots
plt.ylim(0, 40000)plt.tight_layout()
plt.show()

在这里插入图片描述

相关性分析

correlation_matrix = df.corr()
plt.figure(figsize=(10, 6))
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm')
plt.title('Correlation Matrix')
plt.show()

在这里插入图片描述

时间序列分析

# 为年份创建新列
df['year'] = df['date'].dt.year#时间序列分析
plt.figure(figsize=(10, 6))
sns.lineplot(x='year', y='home_score', data=df, label='Home Score')
sns.lineplot(x='year', y='away_score', data=df, label='Away Score')
plt.title('Trends in Home and Away Scores over Time')
plt.xlabel('Year')
plt.ylabel('Score')
plt.legend()
plt.tight_layout()
plt.show()

在这里插入图片描述

总结

以上就是今天分享的内容

http://www.tj-hxxt.cn/news/47098.html

相关文章:

  • 中国十大设计素材网站网络推广计划方案
  • wordpress建站时间网页分析报告案例
  • 网站制作自己静态网站开发
  • 中国商标查询网官网seo技术培训东莞
  • 2018做网站赚钱不seo关键词排名价格
  • 在地区做网站怎么赚钱教育培训机构加盟十大排名
  • 江门自助建站模板小时seo百度关键词点击器
  • 怎么在网站做推广seo优化方案模板
  • 烟台做网站的网站广告投放价格表
  • 建设监理杂志网站谷歌地球
  • 深圳网站论坛建设百度搜索引擎排名
  • 网站标题是什么互联网域名注册查询
  • 西安做网站收费价格网站seo服务商
  • 怎么寻找要建设网站的客户群seo是哪个英文的缩写
  • 移动网站怎么登录抖音的商业营销手段
  • 青岛建设工程信息网官网广州宣布5条优化措施
  • 睢宁网站建设西安seo主管
  • asp.net做报名网站推销一个产品的方案
  • 派出所网站免费源代码怎么用网络推广
  • 单位门户网站怎么做二级子域名ip地址查询
  • 品牌官网建设内容百度快照怎么优化排名
  • 自贡百度做网站多少钱最近国际新闻大事20条
  • wordpress 教育海外网站seo优化
  • 个人做网站能赚到钱吗合肥网站优化seo
  • 什么网站免费建设营销型网站建设的重要原则
  • 在线涨粉平台汉中网站seo
  • 微网站开发的比较总结百度客服怎么联系
  • 如何做自己的淘宝优惠券网站最新社会舆情信息
  • 深圳外贸网站优化哪家好seo sem是什么职位
  • 微信房地产网站建设创建网站的公司