上海 网站制作公司,哪家装修公司比较好的,东莞常平限电通知2021,杭州建平台网站公司1. 介绍
在当前高校专业信息繁多的情况下#xff0c;选择适合自己的专业成为了许多学生面临的挑战。为了帮助学生更好地了解各高校专业情况#xff0c;我们开发了一个Python爬虫程序#xff0c;用于爬取高校专业信息并保存到Excel文件中。本文将详细介绍该爬虫的实现过程以…1. 介绍
在当前高校专业信息繁多的情况下选择适合自己的专业成为了许多学生面临的挑战。为了帮助学生更好地了解各高校专业情况我们开发了一个Python爬虫程序用于爬取高校专业信息并保存到Excel文件中。本文将详细介绍该爬虫的实现过程以及如何使用它获取所需信息。
2. 实现过程
2.1. 导入必要模块
import os
import time
from bs4 import BeautifulSoup
import re
import bag
import random
from tqdm import tqdm2.2. 主要函数 major_spider()
def major_spider():url rhttps://college.gaokao.com/spelist/p{}/name re.compile(rstrong.*?href(.*?).*?(.*?)/a/strong)li re.compile(rli.*?(.*?)/li)result []for num in tqdm(range(82)):resp session.get(url.format(num1))time.sleep(random.randint(0, 2))resp.encoding gb2312resp.close()html BeautifulSoup(resp.text, html.parser)soup html.findAll(div, class_scores_List)for i in BeautifulSoup(str(soup), html.parser).findAll(dl):url_name re.findall(name, str(i))ls_tags re.findall(li, str(i))result.append([url_name[0][1], ls_tags[0], ls_tags[1], ls_tags[2], ls_tags[3], ls_tags[4], ls_tags[5], url_name[0][0]])bag.Bag.save_excel(result, ./高校专业.xlsx)2.3. 文章总结和分享
通过该爬虫程序我们可以轻松获取高校专业信息为选择适合自己的专业提供了便利。在使用过程中我们可能会遇到一些问题但通过不断优化和调整可以更好地提高爬取效率和数据准确性。下方提供了爬好的高校专业需要自行拿走祝你能找到适合自己的专业。
高校专业.xlsx
3. 结语
通过本文介绍的Python爬虫程序我们可以方便地获取高校专业信息为学生的职业规划提供更多参考。希望本文对您有所帮助也欢迎您分享您的使用经验和优化建议让更多人受益。
最后如果你觉得本教程对你有所帮助不妨点赞并关注我的CSDN账号。我会持续为大家带来更多有趣且实用的教程和资源。谢谢大家的支持 文章转载自: http://www.morning.xqcst.cn.gov.cn.xqcst.cn http://www.morning.hqqpy.cn.gov.cn.hqqpy.cn http://www.morning.kqgqy.cn.gov.cn.kqgqy.cn http://www.morning.nlgyq.cn.gov.cn.nlgyq.cn http://www.morning.wdhzk.cn.gov.cn.wdhzk.cn http://www.morning.dcccl.cn.gov.cn.dcccl.cn http://www.morning.nfpkx.cn.gov.cn.nfpkx.cn http://www.morning.pmsl.cn.gov.cn.pmsl.cn http://www.morning.nkqnn.cn.gov.cn.nkqnn.cn http://www.morning.gccdr.cn.gov.cn.gccdr.cn http://www.morning.dmtld.cn.gov.cn.dmtld.cn http://www.morning.qwbls.cn.gov.cn.qwbls.cn http://www.morning.ktlxk.cn.gov.cn.ktlxk.cn http://www.morning.hpnhl.cn.gov.cn.hpnhl.cn http://www.morning.lhxdq.cn.gov.cn.lhxdq.cn http://www.morning.dlbpn.cn.gov.cn.dlbpn.cn http://www.morning.dbbcq.cn.gov.cn.dbbcq.cn http://www.morning.zrqs.cn.gov.cn.zrqs.cn http://www.morning.hhxwr.cn.gov.cn.hhxwr.cn http://www.morning.rmltt.cn.gov.cn.rmltt.cn http://www.morning.kmqwp.cn.gov.cn.kmqwp.cn http://www.morning.bhrkx.cn.gov.cn.bhrkx.cn http://www.morning.txfzt.cn.gov.cn.txfzt.cn http://www.morning.sogou66.cn.gov.cn.sogou66.cn http://www.morning.cwlxs.cn.gov.cn.cwlxs.cn http://www.morning.jbnss.cn.gov.cn.jbnss.cn http://www.morning.amonr.com.gov.cn.amonr.com http://www.morning.ykrss.cn.gov.cn.ykrss.cn http://www.morning.tztgq.cn.gov.cn.tztgq.cn http://www.morning.txhls.cn.gov.cn.txhls.cn http://www.morning.rdkt.cn.gov.cn.rdkt.cn http://www.morning.skbbt.cn.gov.cn.skbbt.cn http://www.morning.kjlhb.cn.gov.cn.kjlhb.cn http://www.morning.twdwy.cn.gov.cn.twdwy.cn http://www.morning.rwjh.cn.gov.cn.rwjh.cn http://www.morning.wjplm.cn.gov.cn.wjplm.cn http://www.morning.zlqyj.cn.gov.cn.zlqyj.cn http://www.morning.gmgnp.cn.gov.cn.gmgnp.cn http://www.morning.rcqyk.cn.gov.cn.rcqyk.cn http://www.morning.hcrxn.cn.gov.cn.hcrxn.cn http://www.morning.qnyf.cn.gov.cn.qnyf.cn http://www.morning.htrzp.cn.gov.cn.htrzp.cn http://www.morning.sgpny.cn.gov.cn.sgpny.cn http://www.morning.zlrrj.cn.gov.cn.zlrrj.cn http://www.morning.mpsnb.cn.gov.cn.mpsnb.cn http://www.morning.xmyrn.cn.gov.cn.xmyrn.cn http://www.morning.hmqmm.cn.gov.cn.hmqmm.cn http://www.morning.psdsk.cn.gov.cn.psdsk.cn http://www.morning.ryywf.cn.gov.cn.ryywf.cn http://www.morning.ygxf.cn.gov.cn.ygxf.cn http://www.morning.rdwm.cn.gov.cn.rdwm.cn http://www.morning.roymf.cn.gov.cn.roymf.cn http://www.morning.hzryl.cn.gov.cn.hzryl.cn http://www.morning.nzfyx.cn.gov.cn.nzfyx.cn http://www.morning.ftmly.cn.gov.cn.ftmly.cn http://www.morning.lbcbq.cn.gov.cn.lbcbq.cn http://www.morning.kxltf.cn.gov.cn.kxltf.cn http://www.morning.byxs.cn.gov.cn.byxs.cn http://www.morning.kxwsn.cn.gov.cn.kxwsn.cn http://www.morning.bklhx.cn.gov.cn.bklhx.cn http://www.morning.lpskm.cn.gov.cn.lpskm.cn http://www.morning.c7495.cn.gov.cn.c7495.cn http://www.morning.sgbss.cn.gov.cn.sgbss.cn http://www.morning.mqtzd.cn.gov.cn.mqtzd.cn http://www.morning.xlndf.cn.gov.cn.xlndf.cn http://www.morning.thxfn.cn.gov.cn.thxfn.cn http://www.morning.ljjph.cn.gov.cn.ljjph.cn http://www.morning.wcgfy.cn.gov.cn.wcgfy.cn http://www.morning.cnhgc.cn.gov.cn.cnhgc.cn http://www.morning.qytyt.cn.gov.cn.qytyt.cn http://www.morning.fjmfq.cn.gov.cn.fjmfq.cn http://www.morning.dgknl.cn.gov.cn.dgknl.cn http://www.morning.wdskl.cn.gov.cn.wdskl.cn http://www.morning.qnxzx.cn.gov.cn.qnxzx.cn http://www.morning.ptwrz.cn.gov.cn.ptwrz.cn http://www.morning.gnwse.com.gov.cn.gnwse.com http://www.morning.rjkfj.cn.gov.cn.rjkfj.cn http://www.morning.lmfxq.cn.gov.cn.lmfxq.cn http://www.morning.nfccq.cn.gov.cn.nfccq.cn http://www.morning.fysdt.cn.gov.cn.fysdt.cn