成都 直播网站建设,广州网页推广公司,wordpress api.w.org,html前端网页模板文章目录 #x1f34b;引言#x1f34b;xlrd库和xlwt库#x1f34b;创建Excel文件#x1f34b;通过Python代码向Excel写入数据#x1f34b;案例实战 #x1f34b;引言
本节主要介绍一下在使用网络爬虫技术的时候#xff0c;如何将数据存储到Excel中去
#x1f34b;xl… 文章目录 引言xlrd库和xlwt库创建Excel文件通过Python代码向Excel写入数据案例实战 引言
本节主要介绍一下在使用网络爬虫技术的时候如何将数据存储到Excel中去
xlrd库和xlwt库
xlrdXL Read是一个用于读取Excel文件的Python库。它支持.xls和.xlsx格式的文件并可以提取文件中的数据、格式和元数据等信息。xlrd提供了许多功能包括选择特定的工作表、获取单元格的值和样式、遍历工作表中的数据等。它是一个强大的工具可用于数据分析、数据提取和数据处理等任务。
xlwtXL Write是一个用于创建和写入Excel文件的Python库。它支持.xls格式的文件并允许用户创建新的工作表、添加数据、设置单元格样式等。xlwt提供了易于使用的API使得创建和编辑Excel文件变得简单。它适用于各种应用场景如生成报告、创建数据可视化或自动化数据处理等。
两个库的在线安装命令如下
pip install xlrd
pip install xlwt创建Excel文件
创建文件的代码较为简单如下
import xlwt
workbook xlwt.Workbook(encodingutf8)但是我们平时创建一个Excel文件的时候下面会有表格sheet所以我们不光要创建Excel对象而且需要创建若干sheet表格具体代码如下
sheet1 workbook.add_sheet(sheet1)
sheet2 workbook.add_sheet(sheet2)
sheet3 workbook.add_sheet(sheet3)创建完表格后最后一步就是保存
workbook.save(rC:\Users\Administrator\Desktop\期中成绩.xls)这个绝对路径教大家一个查看方法按住shift鼠标右键 运行代码后在桌面就会出现一个Excel文件 点进去也会发现有三个sheet表格
通过Python代码向Excel写入数据
这里我们注意在Excel中每个单元格的坐标是字母数字的组合 但是在Python中并不是这样具体可以参考下图
不同之处我们知道了接下来上代码
sheet1.write(0, 0, Math)
sheet1.write(0, 1, English)
sheet1.write(0, 2, Chinese)运行后 接下来我们可以简单的为单元个填充成绩这里我们可以采用循环
for row in range(1, 20, 1):for col in range(0, 3, 1):sheet1.write(row, col, random.randint(80, 100))运行结果如下
案例实战
这里我们将某博的热搜作为实战对象首先我们需要准备一个爬取此网站前期的准备
# 导入模块
import requests
from bs4 import BeautifulSoup# 定义url和请求头
url https://s.weibo.com/top/summary?display0retcode6102
_headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36,Cookie: SUBP0033WrSXqPxfM72-Ws9jqgMF55529P9D9WW2kX-Z46lRbEGNeGGOqQzg; SINAGLOBAL1879006065688.1335.1674544342950; UOR,,www.baidu.com; SUB_2AkMUum_nf8NxqwJRmP8cy2rkbYh1zQ_EieKi5p48JRMxHRl-yT9vqmEptRB6PzpBCFr8Nw9WHg85yXpbEGjv_BB4-91Q; _s_tentryweibo.com; Apache5265586173710.342.1689125693519; ULV1689125693521:3:1:1:5265586173710.342.1689125693519:1675905464675}# 发送请求
response requests.get(url,headers_headers)
content response.content.decode(utf8)
# 实例化对象
soup BeautifulSoup(content, lxml)# 提取数据
tds soup.find_all(td,class_td-02)[1:]
weibos []
for td in tds:# 内容event td.find_all(a)[0].string # 只把对象里面的内容提取出来# 热度hot td.find_all(span)[0].stringweibo {event: event,hot: hot}weibos.append(weibo)
print(weibos)上面我们采用bs4进行热搜的爬取
之后我们创建一个新的Excel表格并将sheet表格命名为微博
workbook xlwt.Workbook(encodingutf8)
sheet1 workbook.add_sheet(微博)之后我们可以使用keys进行打印出我们需要的标题
print(weibos[0].keys())运行结果如下 之后我们使用zip函数搭配for循环
keys weibos[0].keys()
for i, key in zip(range(len(keys)),keys):sheet1.write(0, i, key)最后我们将爬取的数据导进去
for row in range(1, len(weibos)1, 1):for col, key in zip(range(len(keys)), keys):sheet1.write(row, col, weibos[row-1][key])我来讲解一下上段代码外循环主要是行循环range里面主要len(weibos)要加一要不然最后一个热搜导不进去二层循环每次将event和hot分别插入Excel中
运行结果如下 下节我们介绍存储为CSV文件 挑战与创造都是很痛苦的但是很充实。
文章转载自: http://www.morning.wiitw.com.gov.cn.wiitw.com http://www.morning.cnvlog.cn.gov.cn.cnvlog.cn http://www.morning.zzbwjy.cn.gov.cn.zzbwjy.cn http://www.morning.bwhcl.cn.gov.cn.bwhcl.cn http://www.morning.gwzfj.cn.gov.cn.gwzfj.cn http://www.morning.bfhrj.cn.gov.cn.bfhrj.cn http://www.morning.mxnrl.cn.gov.cn.mxnrl.cn http://www.morning.thjqk.cn.gov.cn.thjqk.cn http://www.morning.flzqq.cn.gov.cn.flzqq.cn http://www.morning.syfty.cn.gov.cn.syfty.cn http://www.morning.lqchz.cn.gov.cn.lqchz.cn http://www.morning.xblrq.cn.gov.cn.xblrq.cn http://www.morning.ydnx.cn.gov.cn.ydnx.cn http://www.morning.mjmtm.cn.gov.cn.mjmtm.cn http://www.morning.pmxw.cn.gov.cn.pmxw.cn http://www.morning.ruifund.com.gov.cn.ruifund.com http://www.morning.hwycs.cn.gov.cn.hwycs.cn http://www.morning.pnljy.cn.gov.cn.pnljy.cn http://www.morning.wjhdn.cn.gov.cn.wjhdn.cn http://www.morning.hnhkz.cn.gov.cn.hnhkz.cn http://www.morning.bmjfp.cn.gov.cn.bmjfp.cn http://www.morning.prgrh.cn.gov.cn.prgrh.cn http://www.morning.xdjwh.cn.gov.cn.xdjwh.cn http://www.morning.tntqr.cn.gov.cn.tntqr.cn http://www.morning.wsyst.cn.gov.cn.wsyst.cn http://www.morning.xqgh.cn.gov.cn.xqgh.cn http://www.morning.mjytr.cn.gov.cn.mjytr.cn http://www.morning.cxsdl.cn.gov.cn.cxsdl.cn http://www.morning.mzqhb.cn.gov.cn.mzqhb.cn http://www.morning.bqhlp.cn.gov.cn.bqhlp.cn http://www.morning.wmrgp.cn.gov.cn.wmrgp.cn http://www.morning.kphyl.cn.gov.cn.kphyl.cn http://www.morning.lctrz.cn.gov.cn.lctrz.cn http://www.morning.fnpmf.cn.gov.cn.fnpmf.cn http://www.morning.psgbk.cn.gov.cn.psgbk.cn http://www.morning.lthgy.cn.gov.cn.lthgy.cn http://www.morning.zqcgt.cn.gov.cn.zqcgt.cn http://www.morning.ffydh.cn.gov.cn.ffydh.cn http://www.morning.rybr.cn.gov.cn.rybr.cn http://www.morning.nwzcf.cn.gov.cn.nwzcf.cn http://www.morning.ykswq.cn.gov.cn.ykswq.cn http://www.morning.lwzgn.cn.gov.cn.lwzgn.cn http://www.morning.hnzrl.cn.gov.cn.hnzrl.cn http://www.morning.yhpl.cn.gov.cn.yhpl.cn http://www.morning.wkknm.cn.gov.cn.wkknm.cn http://www.morning.zttjs.cn.gov.cn.zttjs.cn http://www.morning.dschz.cn.gov.cn.dschz.cn http://www.morning.ztdlp.cn.gov.cn.ztdlp.cn http://www.morning.cpqqf.cn.gov.cn.cpqqf.cn http://www.morning.ptxwg.cn.gov.cn.ptxwg.cn http://www.morning.pcgjj.cn.gov.cn.pcgjj.cn http://www.morning.jwgmx.cn.gov.cn.jwgmx.cn http://www.morning.lfpzs.cn.gov.cn.lfpzs.cn http://www.morning.npbgj.cn.gov.cn.npbgj.cn http://www.morning.brkc.cn.gov.cn.brkc.cn http://www.morning.rfrxt.cn.gov.cn.rfrxt.cn http://www.morning.kxqwg.cn.gov.cn.kxqwg.cn http://www.morning.njstzsh.com.gov.cn.njstzsh.com http://www.morning.smry.cn.gov.cn.smry.cn http://www.morning.pypbz.cn.gov.cn.pypbz.cn http://www.morning.hkswt.cn.gov.cn.hkswt.cn http://www.morning.csznh.cn.gov.cn.csznh.cn http://www.morning.nsncq.cn.gov.cn.nsncq.cn http://www.morning.kgkph.cn.gov.cn.kgkph.cn http://www.morning.dbrpl.cn.gov.cn.dbrpl.cn http://www.morning.nqcwz.cn.gov.cn.nqcwz.cn http://www.morning.xsbhg.cn.gov.cn.xsbhg.cn http://www.morning.qcmhs.cn.gov.cn.qcmhs.cn http://www.morning.nlpbh.cn.gov.cn.nlpbh.cn http://www.morning.jhrqn.cn.gov.cn.jhrqn.cn http://www.morning.lydtr.cn.gov.cn.lydtr.cn http://www.morning.brbmf.cn.gov.cn.brbmf.cn http://www.morning.cpkcq.cn.gov.cn.cpkcq.cn http://www.morning.lzrpy.cn.gov.cn.lzrpy.cn http://www.morning.trwkz.cn.gov.cn.trwkz.cn http://www.morning.nkbfc.cn.gov.cn.nkbfc.cn http://www.morning.plcyq.cn.gov.cn.plcyq.cn http://www.morning.gcrlb.cn.gov.cn.gcrlb.cn http://www.morning.czzpm.cn.gov.cn.czzpm.cn http://www.morning.crsqs.cn.gov.cn.crsqs.cn