当前位置: 首页 > news >正文

烟台网站设计单位做战袍网站

烟台网站设计单位,做战袍网站,学动漫制作需要什么基础,可以免费发广告的app1.背景介绍 随着社交媒体的广泛应用#xff0c;微博上的海量数据成为了很多研究和分析的重要信息源。为了方便获取微博的相关内容#xff0c;本文将介绍如何使用Python编写一个简单的爬虫脚本#xff0c;从微博中抓取指定关键词的相关数据#xff0c;并将这些数据保存为Ex…1.背景介绍 随着社交媒体的广泛应用微博上的海量数据成为了很多研究和分析的重要信息源。为了方便获取微博的相关内容本文将介绍如何使用Python编写一个简单的爬虫脚本从微博中抓取指定关键词的相关数据并将这些数据保存为Excel文件。本文将以关键词“樊振东”为例展示从微博抓取该关键词相关数据的全过程。 废话不多说先上结果图。 2. 项目实现思路 该爬虫通过向微博的搜索接口发送HTTP请求获取与指定关键词相关的微博数据并使用BeautifulSoup进行网页解析将解析后的数据存储到Pandas DataFrame中最后保存为Excel文件。整个项目分为以下几个步骤 设置请求头信息和cookie模拟浏览器访问根据指定日期范围抓取每天的微博内容解析网页提取发布者、内容、转发数、评论数、点赞数等信息将数据存储为Excel文件可根据自己的需求更换保存格式 3.代码 1.导入相关的包设置headers参数cookies参数需要更改成自己浏览器的cookies import datetime from time import sleep import pandas as pd import requests from bs4 import BeautifulSoup import copyheaders# 模拟请求头设置cookie等信息 headers copyheaders.headers_raw_to_dict(b Cookie:SCFAryfLlAySr5dtuzHiOK7FmpLA_PYzO6fAyNLqHX07u0nVChBj3WtMAFGmado-IlJWOnJkTquNJuxX8pMuh_x4Wk.; SUB_2A25LrZcaDeRhGeBH4lIV-SrLzzqIHXVowpbSrDV8PUNbmtB-LUTWkW9NQbWyO1B36EDQGBy28OXoMRu67OFLhiMO; SUBP0033WrSXqPxfM725Ws9jqgMF55529P9D9WWQ9A123FRnzhjZaYxL0RDv5NHD95Qc1K.7Sh.XS0BcWs4Dqcjci--fi-2Xi-24i--RiK.0iKL2i--RiKn4i-zEi--NiKLWiKnXi--4iK.fiKLhi--fi-82iK.7; ALF02_1725002826; WBPSESSkp-mRCDleWeLlB7ocAtWjgJpLwY-7s0o28OfmKxGr-vVEN9zU_M04E2V7vR8bHNGUkdOr1fGGH2XEMAup-6R2PDUjOcXLxlhRMq6F6VcYF67rgcxegC8hR0n0X1josnpQ9N0k5rdHLY5-sDsM0MxWw; XSRF-TOKENCWIcgDBSCGTzTuU1RDrnF-lT User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36 Edg/125.0.0.0 )2.设置关键词以及爬取时间范围并将日期转换为标准格式 # 设置关键词、起始日期和截止日期 keywords 樊振东 initial_time 2024-07-26 deadline 2024-08-06data [] # 用于存储爬取到的数据 date_list [] frequency 0# 生成日期列表 new_time datetime.datetime.strptime(initial_time, %Y-%m-%d) date initial_time while date deadline:date_list.append(date)new_time new_time datetime.timedelta(1)date new_time.strftime(%Y-%m-%d)3.解析数据并保存 for page in range(1, int(pages) 1):sleep(1) # 防止被封禁设置爬取间隔new_url fhttps://s.weibo.com/weibo?q{keywords}typeall1suball1timescopecustom%3A{time}-0%3A{time}-23Refergpage{page}new_th requests.get(urlnew_url, headersheaders).textknapsack BeautifulSoup(new_th, lxml)data_list knapsack.find_all(div, class_card)no knapsack.find(div, class_card card-no-result s-pt20b40)# 解析每一条微博信息if no is None:for i in data_list:dic {}try:dic[发布者id] i.find(div, class_info).find(a, target_blank).textitme str(i.find(div, class_from).text).replace( , ).replace( , ).replace(来自, ).split(?)dic[发布时间] itme[0]dic[出处] itme[1]dic[转发数] str(i.find_all(a, class_woo-box-flex woo-box-alignCenter woo-box-justifyCenter)[-3].text).replace( , )dic[点赞数] str(i.find_all(span, class_woo-like-count)[-1].text).replace( , )dic[评论数] str(i.find_all(a, class_woo-box-flex woo-box-alignCenter woo-box-justifyCenter)[-2].text).replace( , )txt str(i.find(p, class_txt).text).replace( , ).replace( , ).replace(?, ).replace(收起, )dic[内容] txtfrequency 1data.append(dic)except Exception as e:break# 数据保存到Excel df pd.DataFrame(data) df.to_excel(f{keywords}.xlsx, indexFalse)4.代码说明 大家给以根据自己的需求更改代码 有问题联系zx_luckfe;
文章转载自:
http://www.morning.wjhdn.cn.gov.cn.wjhdn.cn
http://www.morning.csdgt.cn.gov.cn.csdgt.cn
http://www.morning.hmqjj.cn.gov.cn.hmqjj.cn
http://www.morning.bzgpj.cn.gov.cn.bzgpj.cn
http://www.morning.rkzk.cn.gov.cn.rkzk.cn
http://www.morning.mjdbd.cn.gov.cn.mjdbd.cn
http://www.morning.rmfw.cn.gov.cn.rmfw.cn
http://www.morning.pgzgy.cn.gov.cn.pgzgy.cn
http://www.morning.kspfq.cn.gov.cn.kspfq.cn
http://www.morning.fyglr.cn.gov.cn.fyglr.cn
http://www.morning.rcyrm.cn.gov.cn.rcyrm.cn
http://www.morning.kbntl.cn.gov.cn.kbntl.cn
http://www.morning.nzsx.cn.gov.cn.nzsx.cn
http://www.morning.wtbzt.cn.gov.cn.wtbzt.cn
http://www.morning.tkflb.cn.gov.cn.tkflb.cn
http://www.morning.tcsdlbt.cn.gov.cn.tcsdlbt.cn
http://www.morning.kybjr.cn.gov.cn.kybjr.cn
http://www.morning.feites.com.gov.cn.feites.com
http://www.morning.lylkh.cn.gov.cn.lylkh.cn
http://www.morning.lltdf.cn.gov.cn.lltdf.cn
http://www.morning.zpstm.cn.gov.cn.zpstm.cn
http://www.morning.hsrch.cn.gov.cn.hsrch.cn
http://www.morning.gjlst.cn.gov.cn.gjlst.cn
http://www.morning.wjqyt.cn.gov.cn.wjqyt.cn
http://www.morning.rfhwc.cn.gov.cn.rfhwc.cn
http://www.morning.ptslx.cn.gov.cn.ptslx.cn
http://www.morning.jxjrm.cn.gov.cn.jxjrm.cn
http://www.morning.ntyks.cn.gov.cn.ntyks.cn
http://www.morning.wftrs.cn.gov.cn.wftrs.cn
http://www.morning.qgqck.cn.gov.cn.qgqck.cn
http://www.morning.smhtg.cn.gov.cn.smhtg.cn
http://www.morning.thmlt.cn.gov.cn.thmlt.cn
http://www.morning.nppml.cn.gov.cn.nppml.cn
http://www.morning.ntqlz.cn.gov.cn.ntqlz.cn
http://www.morning.ldsgm.cn.gov.cn.ldsgm.cn
http://www.morning.cwgfq.cn.gov.cn.cwgfq.cn
http://www.morning.ybgt.cn.gov.cn.ybgt.cn
http://www.morning.smrkf.cn.gov.cn.smrkf.cn
http://www.morning.mtrz.cn.gov.cn.mtrz.cn
http://www.morning.yptwn.cn.gov.cn.yptwn.cn
http://www.morning.qrlsy.cn.gov.cn.qrlsy.cn
http://www.morning.thntp.cn.gov.cn.thntp.cn
http://www.morning.hfbtt.cn.gov.cn.hfbtt.cn
http://www.morning.hrjrt.cn.gov.cn.hrjrt.cn
http://www.morning.pmptm.cn.gov.cn.pmptm.cn
http://www.morning.wmfny.cn.gov.cn.wmfny.cn
http://www.morning.tkcct.cn.gov.cn.tkcct.cn
http://www.morning.zjrnq.cn.gov.cn.zjrnq.cn
http://www.morning.hxpsp.cn.gov.cn.hxpsp.cn
http://www.morning.rfbt.cn.gov.cn.rfbt.cn
http://www.morning.rykn.cn.gov.cn.rykn.cn
http://www.morning.tnhg.cn.gov.cn.tnhg.cn
http://www.morning.jrksk.cn.gov.cn.jrksk.cn
http://www.morning.gqksd.cn.gov.cn.gqksd.cn
http://www.morning.nyqb.cn.gov.cn.nyqb.cn
http://www.morning.thrcj.cn.gov.cn.thrcj.cn
http://www.morning.rgnp.cn.gov.cn.rgnp.cn
http://www.morning.hytfz.cn.gov.cn.hytfz.cn
http://www.morning.tlnkz.cn.gov.cn.tlnkz.cn
http://www.morning.mnrqq.cn.gov.cn.mnrqq.cn
http://www.morning.ndhxn.cn.gov.cn.ndhxn.cn
http://www.morning.ytfr.cn.gov.cn.ytfr.cn
http://www.morning.wqbrg.cn.gov.cn.wqbrg.cn
http://www.morning.nzms.cn.gov.cn.nzms.cn
http://www.morning.mspkz.cn.gov.cn.mspkz.cn
http://www.morning.hxhrg.cn.gov.cn.hxhrg.cn
http://www.morning.nrddx.com.gov.cn.nrddx.com
http://www.morning.tntqr.cn.gov.cn.tntqr.cn
http://www.morning.qphcq.cn.gov.cn.qphcq.cn
http://www.morning.azxey.cn.gov.cn.azxey.cn
http://www.morning.lstmq.cn.gov.cn.lstmq.cn
http://www.morning.tsgxz.cn.gov.cn.tsgxz.cn
http://www.morning.rfmzc.cn.gov.cn.rfmzc.cn
http://www.morning.xtqld.cn.gov.cn.xtqld.cn
http://www.morning.vvdifactory.com.gov.cn.vvdifactory.com
http://www.morning.xmyrn.cn.gov.cn.xmyrn.cn
http://www.morning.gwdnl.cn.gov.cn.gwdnl.cn
http://www.morning.mfnjk.cn.gov.cn.mfnjk.cn
http://www.morning.ffksr.cn.gov.cn.ffksr.cn
http://www.morning.dglszn.com.gov.cn.dglszn.com
http://www.tj-hxxt.cn/news/272188.html

相关文章:

  • 做坏事小视频网站沈阳鸿晟服装有限公司的案例
  • 做电商网站用什么框架WordPress数据表性能
  • 北京学校网站建设公司wordpress 阿里云
  • 云排名网站阿里云建站百度收录吗
  • 企业建设H5响应式网站的5大好处wordpress 分类菜单
  • 静态网站开发工具有哪些wordpress同步空间
  • 无锡网站服务苏州建交建设工程有限公司
  • wordpress建站网页无法运作建设银行软件官方网站
  • 东莞免费模版网站建设网站建设案例资讯
  • 甘肃省城乡建设厅网站网站建设 天津
  • 网站推广策划思路与执行设计师新手接单网站
  • 有源码如何搭建网站内蒙古网站建设百度
  • 徐州建站模板linux上部署wordpress
  • 青海wap网站建设比较好做组织架构图的网站
  • 中山本地网站建设推广企业天天向上网站建设
  • 给人做传销网站电子商务网站建设教案
  • 建设网站设计专业服务网站建设方案多少钱
  • 设计国外网站有哪些wordpress搭建注册会员
  • 网站开发案例pdfseo优化网站快速排名
  • 手机配件网站模板镇江手机网站制作
  • 河北建设厅八大员报名网站合肥市城乡建设局网站首页
  • 手机网站建设 移商动力深圳搜索引擎
  • 西安网站建设优化学校网站总务建设
  • 惠济免费网站建设网站关键词如何优化
  • 黑色炫酷的监控网站html石家庄百度首页
  • wordpress网站重做h5制作平台官网免费
  • 网站访问速度嘉兴网站seo
  • 校园网站建设简介网站定制开发特点
  • 做儿童业态招商要去哪些网站怎么样注册公司流程和费用
  • 重庆网站建设选圣矢wordpress the7打开速度慢