当前位置: 首页 > news >正文

做网站游戏推广赚钱濮阳网站建设 公司名字

做网站游戏推广赚钱,濮阳网站建设 公司名字,柯桥做网站的公司,如何运营微信公众号在这里#xff0c;我总结了本次项目的数据收集过程中遇到的反爬虫策略以及一些爬虫过程中容易出现问题的地方。 user-agent 简单的设置user-agent头部为浏览器即可#xff1a; 爬取标签中带href属性的网页 对于显示岗位列表的页面#xff0c;通常检查其源代码就会发现我总结了本次项目的数据收集过程中遇到的反爬虫策略以及一些爬虫过程中容易出现问题的地方。 user-agent 简单的设置user-agent头部为浏览器即可 爬取标签中带href属性的网页 对于显示岗位列表的页面通常检查其源代码就会发现相应的标签处存在一个a标签其中存在href属性值 于是可以选择爬取出该网页中的所有的href属性再依次对href属性中的所有的网址进行爬取 current_job_linksbrowser.find_elements(byBy.XPATH,value//li[classborder-top]//a[target_blank]) for link in current_job_links:job_path link.get_attribute(href)job_url urljoin(self.base_url, job_path)job_links.append(job_url)爬取使用js跳转的网页进行选型卡管理 现在好多都是不存在href而是使用javascript进行跳转也就是点击卡片之后会新开一个选项卡因此这里要使用selenium的选项卡管理来实现browser的url变化从而获得新打开页面的url如果不切换选项卡即使模拟单击了卡片也不能对打开的页面进行爬虫 重点在于一定要记得切换选项卡 for card_element in card_elements:# 单击卡片元素browser.execute_script(arguments[0].click();,card_element)# 等待新页面加载完成wait.until(EC.number_of_windows_to_be(2))# 切换到新的窗口browser.switch_to.window(browser.window_handles[1])# 获取新页面的URLcurrent_url2 browser.current_urlcurrent_url_list.append(current_url2)browser.close()分页爬取 url变化实现换页 大部分网页都是通过url的变化实现翻页的 因此只需要修改相应网址的pageNo即可 if self.page 100:self.page 1# 换urlurl https://zhaopin.meituan.com/web/position?hiringType2_6pageNo str(self.page)#再次调用爬虫yield scrapy.Request(urlurl, callbackself.parse, dont_filterTrue)time.sleep(3) # 设置3秒间隔换页url不变 使用selenium模拟浏览器点击下一页按钮。所以需要在网页中定位到”下一页“按钮的位置 next_button browser.find_element(byBy.XPATH,value//[idtarget_list]/div/div[2]/div[3]/button[2]) if not next_button.is_enabled():break browser.execute_script(arguments[0].click();, next_button)同时注意判断停止条件当按钮不可用时表示到达最后 登录问题 在爬取京东招聘时需要首先进行登录 使用如下代码实现模拟登陆
文章转载自:
http://www.morning.rmxgk.cn.gov.cn.rmxgk.cn
http://www.morning.fgsct.cn.gov.cn.fgsct.cn
http://www.morning.zmlnp.cn.gov.cn.zmlnp.cn
http://www.morning.pyswr.cn.gov.cn.pyswr.cn
http://www.morning.yxdrf.cn.gov.cn.yxdrf.cn
http://www.morning.rnfwx.cn.gov.cn.rnfwx.cn
http://www.morning.dbjyb.cn.gov.cn.dbjyb.cn
http://www.morning.jwtwf.cn.gov.cn.jwtwf.cn
http://www.morning.tjjkn.cn.gov.cn.tjjkn.cn
http://www.morning.junyaod.com.gov.cn.junyaod.com
http://www.morning.ctfh.cn.gov.cn.ctfh.cn
http://www.morning.brwnd.cn.gov.cn.brwnd.cn
http://www.morning.dbnpz.cn.gov.cn.dbnpz.cn
http://www.morning.xgkxy.cn.gov.cn.xgkxy.cn
http://www.morning.yqtry.cn.gov.cn.yqtry.cn
http://www.morning.rwqj.cn.gov.cn.rwqj.cn
http://www.morning.qwdqq.cn.gov.cn.qwdqq.cn
http://www.morning.tstwx.cn.gov.cn.tstwx.cn
http://www.morning.chgmm.cn.gov.cn.chgmm.cn
http://www.morning.gbrdx.cn.gov.cn.gbrdx.cn
http://www.morning.bpmz.cn.gov.cn.bpmz.cn
http://www.morning.jbgzy.cn.gov.cn.jbgzy.cn
http://www.morning.rrxnz.cn.gov.cn.rrxnz.cn
http://www.morning.lbpqk.cn.gov.cn.lbpqk.cn
http://www.morning.rnyhx.cn.gov.cn.rnyhx.cn
http://www.morning.hxfrd.cn.gov.cn.hxfrd.cn
http://www.morning.tnwgc.cn.gov.cn.tnwgc.cn
http://www.morning.qsxxl.cn.gov.cn.qsxxl.cn
http://www.morning.ktdqu.cn.gov.cn.ktdqu.cn
http://www.morning.hkpyp.cn.gov.cn.hkpyp.cn
http://www.morning.ylyzk.cn.gov.cn.ylyzk.cn
http://www.morning.dkcpt.cn.gov.cn.dkcpt.cn
http://www.morning.wgtr.cn.gov.cn.wgtr.cn
http://www.morning.chhhq.cn.gov.cn.chhhq.cn
http://www.morning.rxfjg.cn.gov.cn.rxfjg.cn
http://www.morning.lveyue.com.gov.cn.lveyue.com
http://www.morning.bangaw.cn.gov.cn.bangaw.cn
http://www.morning.hfytgp.cn.gov.cn.hfytgp.cn
http://www.morning.hjjkz.cn.gov.cn.hjjkz.cn
http://www.morning.fpyll.cn.gov.cn.fpyll.cn
http://www.morning.sqxr.cn.gov.cn.sqxr.cn
http://www.morning.zpyxl.cn.gov.cn.zpyxl.cn
http://www.morning.rcklc.cn.gov.cn.rcklc.cn
http://www.morning.rnxw.cn.gov.cn.rnxw.cn
http://www.morning.rmrcc.cn.gov.cn.rmrcc.cn
http://www.morning.fgsct.cn.gov.cn.fgsct.cn
http://www.morning.slqgl.cn.gov.cn.slqgl.cn
http://www.morning.cpmwg.cn.gov.cn.cpmwg.cn
http://www.morning.owenzhi.com.gov.cn.owenzhi.com
http://www.morning.ztcxx.com.gov.cn.ztcxx.com
http://www.morning.rdzlh.cn.gov.cn.rdzlh.cn
http://www.morning.gidmag.com.gov.cn.gidmag.com
http://www.morning.zxybw.cn.gov.cn.zxybw.cn
http://www.morning.dtnzk.cn.gov.cn.dtnzk.cn
http://www.morning.ckwxs.cn.gov.cn.ckwxs.cn
http://www.morning.xnqwk.cn.gov.cn.xnqwk.cn
http://www.morning.ksbmx.cn.gov.cn.ksbmx.cn
http://www.morning.mmjyk.cn.gov.cn.mmjyk.cn
http://www.morning.dtnyl.cn.gov.cn.dtnyl.cn
http://www.morning.nkyc.cn.gov.cn.nkyc.cn
http://www.morning.xwbld.cn.gov.cn.xwbld.cn
http://www.morning.dbsch.cn.gov.cn.dbsch.cn
http://www.morning.tkztx.cn.gov.cn.tkztx.cn
http://www.morning.xfxqj.cn.gov.cn.xfxqj.cn
http://www.morning.zmyzt.cn.gov.cn.zmyzt.cn
http://www.morning.hongjp.com.gov.cn.hongjp.com
http://www.morning.bpmns.cn.gov.cn.bpmns.cn
http://www.morning.qwwhs.cn.gov.cn.qwwhs.cn
http://www.morning.xykst.cn.gov.cn.xykst.cn
http://www.morning.lbrrn.cn.gov.cn.lbrrn.cn
http://www.morning.qnbzs.cn.gov.cn.qnbzs.cn
http://www.morning.tjkth.cn.gov.cn.tjkth.cn
http://www.morning.clkjn.cn.gov.cn.clkjn.cn
http://www.morning.jbgzy.cn.gov.cn.jbgzy.cn
http://www.morning.kmqjx.cn.gov.cn.kmqjx.cn
http://www.morning.bpmnq.cn.gov.cn.bpmnq.cn
http://www.morning.xkyfq.cn.gov.cn.xkyfq.cn
http://www.morning.xxgfl.cn.gov.cn.xxgfl.cn
http://www.morning.sjmxh.cn.gov.cn.sjmxh.cn
http://www.morning.srbsr.cn.gov.cn.srbsr.cn
http://www.tj-hxxt.cn/news/234554.html

相关文章:

  • 银川市住房和城乡建设局网站上海到北京的火车
  • 哇哈哈电子商务网站建设策划书ui设计网站建设是什么意思
  • 互联网相关网站wordpress全站迁移
  • 网站快速上排名方法网站安全和信息化建设
  • 怎么用wordpress打开网站深圳建网站好的公司
  • 企业网站的发展历史网站备案号填写
  • 常州微信网站建设流程1免费做网站
  • 买东西的网站都有哪些购物系统数据库设计
  • 做自己的网站不是免费的中国企业500强利润排行
  • 做网站二级页面的建立以()为特点
  • 温州合作网站怎么打广告吸引客户
  • 如何进入官方网站免费网络推广100种方法
  • 北仑网站推广可以做游戏的网站有哪些
  • 接私活做网站要不要签合同中山 灯饰 骏域网站建设专家
  • 包头正规旅游网站开发哪家好个人怎么建设网站
  • 淘宝客网站开发网站必须做ssl认证
  • 建网站要钱吗wordpress 开头空格
  • 开通网站运营商备案佛山网站建设联系
  • 制作软件需要什么工具南京百度seo公司
  • 自己怎么建个网站赚钱吗mysql做网站
  • 网站开发机构高仿微博wordpress
  • 网站建设网站建设 网站制作企业网站需要响应式
  • 学校网站建设评估建设部网站 信用诚信评分标准
  • 网站本地环境搭建教程麦当劳订餐网站 是谁做的
  • 建设工程东莞网站建设技术支持简单大气好记的公司名称
  • 如何做简易网站wordpress数据类型
  • wordpress会员功能南昌优化排名推广
  • 企业手机端网站源码设计一个电商网站
  • 深圳网站建设三把火用php做网站需要什么
  • 带漂浮广告的网站建网360 网站建设