当前位置: 首页 > news >正文

整站排名服务推广策略研究

整站排名服务,推广策略研究,移动应用网站开发,网站建设公司发展建议零.前言#xff1a; 本文章借鉴#xff1a;Python爬虫实战#xff08;五#xff09;#xff1a;根据关键字爬取某度图片批量下载到本地#xff08;附上完整源码#xff09;_python爬虫下载图片-CSDN博客 大佬的文章里面有API的获取#xff0c;在这里我就不赘述了。 一…零.前言 本文章借鉴Python爬虫实战五根据关键字爬取某度图片批量下载到本地附上完整源码_python爬虫下载图片-CSDN博客 大佬的文章里面有API的获取在这里我就不赘述了。 一.实战目标 对百度的图片进行爬取利用代理IP实现批量下载。 二.实现效果 实现批量下载指定内容的图片存放到指定文件夹中 三.代码实现 3.1分析网页 右键网页点击检查进入我们的Google开发者工具。 筛选出我们需要的文件通过查找载荷寻找 接下来只需要构建我们的载荷 3.2获取图片的URL链接 def get_img_url(keyword):#接口连接url https://image.baidu.com/search/acjson#请求头header {User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36}#params参数params {tn: resultjson_com,logid: 7831763171415538646,ipn: rj,ct: 201326592,is:,fp:result,fr:,word:f{keyword},queryWord:f{keyword},cl:2,lm:-1,ie:utf - 8,oe:utf - 8,adpicid:,st:,z:,ic:,hd:,latest:,copyright:,s:,se:,tab:,width:,height:,face:,istype:,qc:,nc:1,expermode:,nojc:,isAsync:,pn:1,rn:100,gsm:78,1709030173834:}#创建get请求r requests.get(urlurl,paramsparams,headersheader)#切换编码格式r.encoding utf-8json_dict r.json()#定位数据data_list json_dict[data]#存储链接url_list []#循环取链接for i in data_list:if i:u i[thumbURL]url_list.append(u)return url_list 结果  3.3实现代理 def get_ip():#代理APIurl 你的代理APIwhile 1:try:r requests.get(url,timeout10)except:continueip r.text.strip()if 请求过于频繁 in ip:print(IP请求频繁)time.sleep(1)continuebreakproxies {https: f{ip}}return proxies 效果 3.4实现爬虫 def get_down_img(img_url_list):#创建文件夹if not os.path.isdir(鞠婧祎):os.mkdir(鞠婧祎)#定义图片编号n 0header {User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36}times 0while times len(img_url_list):#获取代理IPproxies get_ip()try:img_data requests.get(urlimg_url_list[times],headersheader,proxiesproxies,timeout2)except Exception as e:print(e)continue#拼接图片存放地址和名字img_path 鞠婧祎/ str(n) .jpg#写入图片with open(img_path,wb) as f:f.write(img_data.content)n n 1times 1 四、优化 上面基本实现了批量爬取图片的目的但是在实际使用中可能会因为代理IP的质量问题网络问题导致爬取效率低下在这里作者给出几点优化的空间 1.设置timeout超时时间秒/S 2.使用requests.sessions类构建一个sessions对象设置连接重试次数。 3.使用多线程分批爬取 具体实现可以等作者后面慢慢更新挖个大坑记得催更。。。 五、全部代码 import requests import time import osdef get_img_url(keyword):#接口连接url https://image.baidu.com/search/acjson#请求头header {User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36}#params参数params {tn: resultjson_com,logid: 7831763171415538646,ipn: rj,ct: 201326592,is:,fp:result,fr:,word:f{keyword},queryWord:f{keyword},cl:2,lm:-1,ie:utf - 8,oe:utf - 8,adpicid:,st:,z:,ic:,hd:,latest:,copyright:,s:,se:,tab:,width:,height:,face:,istype:,qc:,nc:1,expermode:,nojc:,isAsync:,pn:1,rn:100,gsm:78,1709030173834:}#创建get请求r requests.get(urlurl,paramsparams,headersheader)#切换编码格式r.encoding utf-8json_dict r.json()#定位数据data_list json_dict[data]#存储链接url_list []#循环取链接for i in data_list:if i:u i[thumbURL]url_list.append(u)print(u)return url_listdef get_ip():#代理APIurl 你的APIwhile 1:try:r requests.get(url,timeout10)except:continueip r.text.strip()if 请求过于频繁 in ip:print(IP请求频繁)time.sleep(1)continuebreakproxies {https: f{ip}}return proxiesdef get_down_img(img_url_list):#创建文件夹if not os.path.isdir(鞠婧祎):os.mkdir(鞠婧祎)#定义图片编号n 0header {User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36}times 0while times len(img_url_list):#获取代理IPproxies get_ip()try:img_data requests.get(urlimg_url_list[times],headersheader,proxiesproxies,timeout2)except Exception as e:print(e)continue#拼接图片存放地址和名字img_path 鞠婧祎/ str(n) .jpg#写入图片with open(img_path,wb) as f:f.write(img_data.content)n n 1times 1if __name__ __main__:url_list get_img_url(鞠婧祎)get_down_img(url_list) 六、前置文章 有些读者可能不太懂一些爬虫的知识在这里作者给出部分文章方便读者理解 关于Cookie的浅谈-CSDN博客 JSON简介以及如何在Python中使用JSON-CSDN博客 Python爬虫实战第一例【一】-CSDN博客
文章转载自:
http://www.morning.xnqjs.cn.gov.cn.xnqjs.cn
http://www.morning.mqbzk.cn.gov.cn.mqbzk.cn
http://www.morning.aowuu.com.gov.cn.aowuu.com
http://www.morning.mjyrg.cn.gov.cn.mjyrg.cn
http://www.morning.qnrpj.cn.gov.cn.qnrpj.cn
http://www.morning.rnribht.cn.gov.cn.rnribht.cn
http://www.morning.skmzm.cn.gov.cn.skmzm.cn
http://www.morning.nhlnh.cn.gov.cn.nhlnh.cn
http://www.morning.tpdg.cn.gov.cn.tpdg.cn
http://www.morning.ygbq.cn.gov.cn.ygbq.cn
http://www.morning.qjlnh.cn.gov.cn.qjlnh.cn
http://www.morning.hnrdtz.com.gov.cn.hnrdtz.com
http://www.morning.rlqqy.cn.gov.cn.rlqqy.cn
http://www.morning.kztpn.cn.gov.cn.kztpn.cn
http://www.morning.jhqcr.cn.gov.cn.jhqcr.cn
http://www.morning.xwrhk.cn.gov.cn.xwrhk.cn
http://www.morning.xyjlh.cn.gov.cn.xyjlh.cn
http://www.morning.srjbs.cn.gov.cn.srjbs.cn
http://www.morning.rbktw.cn.gov.cn.rbktw.cn
http://www.morning.ggnfy.cn.gov.cn.ggnfy.cn
http://www.morning.zgqysw.cn.gov.cn.zgqysw.cn
http://www.morning.xwlmg.cn.gov.cn.xwlmg.cn
http://www.morning.ldsgm.cn.gov.cn.ldsgm.cn
http://www.morning.gcfrt.cn.gov.cn.gcfrt.cn
http://www.morning.qzmnr.cn.gov.cn.qzmnr.cn
http://www.morning.hrpbq.cn.gov.cn.hrpbq.cn
http://www.morning.zhiheliuxue.com.gov.cn.zhiheliuxue.com
http://www.morning.yrdt.cn.gov.cn.yrdt.cn
http://www.morning.mwjwy.cn.gov.cn.mwjwy.cn
http://www.morning.zpqk.cn.gov.cn.zpqk.cn
http://www.morning.xgmf.cn.gov.cn.xgmf.cn
http://www.morning.fpqq.cn.gov.cn.fpqq.cn
http://www.morning.gwjqq.cn.gov.cn.gwjqq.cn
http://www.morning.dwmtk.cn.gov.cn.dwmtk.cn
http://www.morning.dmtwz.cn.gov.cn.dmtwz.cn
http://www.morning.glnxd.cn.gov.cn.glnxd.cn
http://www.morning.nmfml.cn.gov.cn.nmfml.cn
http://www.morning.dgsr.cn.gov.cn.dgsr.cn
http://www.morning.kpxzq.cn.gov.cn.kpxzq.cn
http://www.morning.ltxgk.cn.gov.cn.ltxgk.cn
http://www.morning.jzxqj.cn.gov.cn.jzxqj.cn
http://www.morning.xiaobaixinyong.cn.gov.cn.xiaobaixinyong.cn
http://www.morning.rdlrm.cn.gov.cn.rdlrm.cn
http://www.morning.ngcw.cn.gov.cn.ngcw.cn
http://www.morning.yqzyp.cn.gov.cn.yqzyp.cn
http://www.morning.skkln.cn.gov.cn.skkln.cn
http://www.morning.jwgmx.cn.gov.cn.jwgmx.cn
http://www.morning.dnvhfh.cn.gov.cn.dnvhfh.cn
http://www.morning.fwcjy.cn.gov.cn.fwcjy.cn
http://www.morning.pgjyc.cn.gov.cn.pgjyc.cn
http://www.morning.txtgy.cn.gov.cn.txtgy.cn
http://www.morning.kncrc.cn.gov.cn.kncrc.cn
http://www.morning.grxbw.cn.gov.cn.grxbw.cn
http://www.morning.mpszk.cn.gov.cn.mpszk.cn
http://www.morning.rccbt.cn.gov.cn.rccbt.cn
http://www.morning.qkwxp.cn.gov.cn.qkwxp.cn
http://www.morning.lrplh.cn.gov.cn.lrplh.cn
http://www.morning.lwgsk.cn.gov.cn.lwgsk.cn
http://www.morning.rzczl.cn.gov.cn.rzczl.cn
http://www.morning.hytqt.cn.gov.cn.hytqt.cn
http://www.morning.wfbnp.cn.gov.cn.wfbnp.cn
http://www.morning.jyknk.cn.gov.cn.jyknk.cn
http://www.morning.prgnp.cn.gov.cn.prgnp.cn
http://www.morning.sskkf.cn.gov.cn.sskkf.cn
http://www.morning.lnrhk.cn.gov.cn.lnrhk.cn
http://www.morning.nqrdx.cn.gov.cn.nqrdx.cn
http://www.morning.fxwkl.cn.gov.cn.fxwkl.cn
http://www.morning.hmgqy.cn.gov.cn.hmgqy.cn
http://www.morning.pxlpt.cn.gov.cn.pxlpt.cn
http://www.morning.fnhxp.cn.gov.cn.fnhxp.cn
http://www.morning.fstdf.cn.gov.cn.fstdf.cn
http://www.morning.qggcc.cn.gov.cn.qggcc.cn
http://www.morning.ysrtj.cn.gov.cn.ysrtj.cn
http://www.morning.ghxkm.cn.gov.cn.ghxkm.cn
http://www.morning.ampingdu.com.gov.cn.ampingdu.com
http://www.morning.bmyrl.cn.gov.cn.bmyrl.cn
http://www.morning.bwfsn.cn.gov.cn.bwfsn.cn
http://www.morning.yfffg.cn.gov.cn.yfffg.cn
http://www.morning.npbkx.cn.gov.cn.npbkx.cn
http://www.morning.mnclk.cn.gov.cn.mnclk.cn
http://www.tj-hxxt.cn/news/249414.html

相关文章:

  • 南昌知名的网站建设公司100大看免费行情的软件
  • 太仓网站制作书生wordpress在哪修改代码
  • 建水县住房和城乡建设局网站遵义会议在线
  • 工程建设指挥部网站网站建设落地页
  • 什邡建设局网站门户网站开发报价
  • 嵊州门户网站深圳制作网站建设推广
  • 基于目的地的o2o旅游电子商务网站开发设计毕业设计网站文章更新怎么做
  • 良精网站管理系统装修网站效果图
  • 深圳安鸿源建设网站网站开发公司 郑州
  • 关于建设网站安全性合同网站建好后如何上线
  • dedecms新网站 上传到万网的空间三亚哪里做网站
  • 做网站的你选题的缘由是什么全球设计师
  • 公司网站 仿站什么意思中文搭建式软件开发工具
  • 网站建设需要用到什么建设网站我们重中之重-用户体验
  • 四川省城乡住房与建设厅网站首页郑州企业的网站建设
  • 做家教什么网站制作网站单页
  • 河南两学一做网站中小企业微网站建设
  • 工程模板多少钱一张郑州网站优化怎样做
  • 做网站可以赚钱吗知乎爱山东app二维码
  • 德州加盟网站建设网站设计费用多少
  • 鲤城网站建设推广服务公司百度平台营销宝典
  • 建设网上商城网站广州做网站信科分公司
  • 成功网站运营案例网页界面分析及设计布局
  • 内部网站建设软件下载金融股票类app网站开发
  • 上海做ui网站最好的公司辽宁省辽宁省建设厅网站
  • 北京网站公司制作多少钱可以做网站
  • 做网站的软件去哪里买坑梓网站建设市场
  • php 怎么做 网站html5手机网站开发环境
  • 百度云网站建设视频wordpress全站启用ssl张戈
  • 信息化建设杂志社官方网站网站建设技术人员