当前位置: 首页 > news >正文

网站规划的任务域名未做运行网站解析

网站规划的任务,域名未做运行网站解析,汇鑫网站建设,门户网站内容目录 上一篇文章 本章内容 设置浏览器为运行结束后不关闭#xff08;可选#xff09; 定位到搜索框的xpath地址 执行动作 获取cookie 保存为json文件 修改cookie的sameSite值并且导入cookie 导入cookie#xff08;出错#xff09; 导入cookie#xff08;修改后可选 定位到搜索框的xpath地址 执行动作 获取cookie 保存为json文件 修改cookie的sameSite值并且导入cookie 导入cookie出错 导入cookie修改后 最后出现页面 需要注意的问题 所有代码 总结 上一篇文章 用python来爬取某鱼的商品信息1/2_木木em哈哈的博客-CSDN博客本章讲理论后面一节讲代码拿来练练手的练练selenium包实战一下本来想拿来练手的没想到他喵的有挺多防爬的直接开局就困难难度我靠凸(艹皿艹 )找到可以爬取的网站然后添加cookie然后刷新界面就可以发现搜索结果出来了这一次实战经历真的让我遇到了selenium许多奇奇怪怪的反爬手段也是让我可以大幅度提升自己实战经验的一个经历前前后后排bug绕反爬这一个项目打了整整两天。累diethttps://blog.csdn.net/mumuemhaha/article/details/132238660?spm1001.2014.3001.5502 本章内容 主要讲的是上一章的代码实现 导入所需要的程序包 from selenium import webdriver from selenium.webdriver import ActionChains from selenium.webdriver.common.keys import Keys import time import json 设置浏览器为运行结束后不关闭可选 之后先设置自己想要搜索的内容并且把浏览器设置为允许结束后不关闭并且打开要爬取的咸鱼网站可设可不设 input_1input(输入想要搜索的内容:)option webdriver.ChromeOptions() option.add_experimental_option(detach, True)# 注意此处添加了chrome_options参数 driver webdriver.Chrome(chrome_optionsoption) driver.get(https://h5.m.goofish.com/app/idleFish-F2e/fish-mini-pha/search.html?spma2170.tb_mini_index.0.0) 定位到搜索框的xpath地址 driver_1driver.find_element(byxpath,value/html/body/div/div/div[1]/input) 执行动作 执行动作调用鼠标api点击刚刚定位的搜索框然后输入input_1的值并且回车 ActionChains(driver) \.move_to_element(driver_1) \.click_and_hold() \.pause(1) \.send_keys(input_1) \.key_down(Keys.ENTER)\.perform()time.sleep(1) 中间的.pause(1)以及time.sleep(1)是等待一秒钟的时间保险起见怕网页没有加载好或者你设置一个selenium等待函数更保险 获取cookie 接下来就是获取cookie获取cookie方法上一章讲了 在你的浏览器上下载cookie editor插件登录不要用运行python时跳出的浏览器正常打开浏览器这样不会跳验证码。。。即使跳了也可以手动成功过导出你的cookie 保存为json文件 然后新建一个json格式的文件并且把它命名为cookie.json 修改cookie的sameSite值并且导入cookie 导入cookie出错 cookiesjson.load(open(cookie.json, r)) for cookie in cookies:driver.add_cookie(cookie) 但是 前面讲过直接导入会报错 assert cookie_dict[‘sameSite‘] in [‘Strict‘, ‘Lax‘] AssertionError() 由于这里语法规定sameSite必须为‘Strict‘, ‘Lax‘两个之一不然就报错 所以我们要遍历字典并且把字典中的sameSite设置为Strict 导入cookie修改后 所以代码改为 cookiesjson.load(open(cookie.json, r)) for cookie in cookies:ifsameSite in cookie:cookie[sameSite] Strictdriver.add_cookie(cookie) driver.refresh() 注意导入cookie后要用driver.refresh()刷新 打印源代码 然后打印网页的源代码注意要等3秒加载元素或者用re库带的筛选筛选你想要的的元素比如商品链接价格以及介绍 time.sleep(3) print(driver.page_source) 最后出现页面 需要注意的问题 首先要说的是这个通过python不如通过app抓包来的稳定页面中你登录的cookie的失效时间是不确定的所以你可能需要经常更新cookie看个人情况无法频繁比如5分钟一次搜索否则会跳滑块验证或者你有多个账号也可以搞大概也就这个流程写出来的代码只是提取出来网页源代码——其实都提取出网页源代码了使用就只有一个筛选了csdn上有大把的优质博主和大佬教你通过源代码过滤有用的信息当然如果需要的话我可以再水一篇博客它理论上可以关联到钉钉机器人或者是QQ机器人上实现定时推送咸鱼信息啊你问我为什么不继续写因为还没学不然这期标题末尾就不是2/2而是2/3了咳咳咳...u1s1钉钉应该是有教程教的傻妞机器人应该也可以执行python脚本的“按理”来说不会很难实现实在不行我再去学吧累die... 所有代码 所有代码附上吧 from selenium import webdriver from selenium.webdriver import ActionChains from selenium.webdriver.common.keys import Keys import time import jsoninput_1input(输入想要搜索的内容:)# 不自动关闭浏览器 option webdriver.ChromeOptions() option.add_experimental_option(detach, True)# 注意此处添加了chrome_options参数 driver webdriver.Chrome(chrome_optionsoption) driver.get(https://h5.m.goofish.com/app/idleFish-F2e/fish-mini-pha/search.html?spma2170.tb_mini_index.0.0)driver_1driver.find_element(byxpath,value/html/body/div/div/div[1]/input)ActionChains(driver) \.move_to_element(driver_1) \.click_and_hold() \.pause(1) \.send_keys(input_1) \.key_down(Keys.ENTER)\.perform()time.sleep(1)cookiesjson.load(open(cookie.json, r)) for cookie in cookies:ifsameSite in cookie:cookie[sameSite] Strictdriver.add_cookie(cookie) driver.refresh()time.sleep(3) print(driver.page_source) 总结 这些代码搞得我晕头转向的尤其是那个内嵌的登录页面让我走了很多弯路但是对于这个库的学习应该也算是初窥门径吧如果有大佬有优化的地方欢迎指出真的没学多深很容易出错的
文章转载自:
http://www.morning.bwttp.cn.gov.cn.bwttp.cn
http://www.morning.nspbj.cn.gov.cn.nspbj.cn
http://www.morning.lhxkl.cn.gov.cn.lhxkl.cn
http://www.morning.pxlql.cn.gov.cn.pxlql.cn
http://www.morning.tqsgt.cn.gov.cn.tqsgt.cn
http://www.morning.mbfj.cn.gov.cn.mbfj.cn
http://www.morning.ypzsk.cn.gov.cn.ypzsk.cn
http://www.morning.brld.cn.gov.cn.brld.cn
http://www.morning.kfsfm.cn.gov.cn.kfsfm.cn
http://www.morning.nrzbq.cn.gov.cn.nrzbq.cn
http://www.morning.yzxlkj.com.gov.cn.yzxlkj.com
http://www.morning.kpxnz.cn.gov.cn.kpxnz.cn
http://www.morning.nrbqf.cn.gov.cn.nrbqf.cn
http://www.morning.qxycf.cn.gov.cn.qxycf.cn
http://www.morning.xtgzp.cn.gov.cn.xtgzp.cn
http://www.morning.wdply.cn.gov.cn.wdply.cn
http://www.morning.lbbgf.cn.gov.cn.lbbgf.cn
http://www.morning.wiitw.com.gov.cn.wiitw.com
http://www.morning.cbnxq.cn.gov.cn.cbnxq.cn
http://www.morning.xqknl.cn.gov.cn.xqknl.cn
http://www.morning.c7507.cn.gov.cn.c7507.cn
http://www.morning.cftkz.cn.gov.cn.cftkz.cn
http://www.morning.drmbh.cn.gov.cn.drmbh.cn
http://www.morning.dbfp.cn.gov.cn.dbfp.cn
http://www.morning.gqwbl.cn.gov.cn.gqwbl.cn
http://www.morning.dmwbs.cn.gov.cn.dmwbs.cn
http://www.morning.wkxsy.cn.gov.cn.wkxsy.cn
http://www.morning.njftk.cn.gov.cn.njftk.cn
http://www.morning.bpmdq.cn.gov.cn.bpmdq.cn
http://www.morning.tpxgm.cn.gov.cn.tpxgm.cn
http://www.morning.rwmp.cn.gov.cn.rwmp.cn
http://www.morning.ypbdr.cn.gov.cn.ypbdr.cn
http://www.morning.ywndg.cn.gov.cn.ywndg.cn
http://www.morning.bsjxh.cn.gov.cn.bsjxh.cn
http://www.morning.krwzy.cn.gov.cn.krwzy.cn
http://www.morning.haibuli.com.gov.cn.haibuli.com
http://www.morning.lxhrq.cn.gov.cn.lxhrq.cn
http://www.morning.djxnw.cn.gov.cn.djxnw.cn
http://www.morning.qpqwd.cn.gov.cn.qpqwd.cn
http://www.morning.gllhx.cn.gov.cn.gllhx.cn
http://www.morning.ndmh.cn.gov.cn.ndmh.cn
http://www.morning.llqch.cn.gov.cn.llqch.cn
http://www.morning.qqnh.cn.gov.cn.qqnh.cn
http://www.morning.nkqxb.cn.gov.cn.nkqxb.cn
http://www.morning.kxryg.cn.gov.cn.kxryg.cn
http://www.morning.drpbc.cn.gov.cn.drpbc.cn
http://www.morning.hhfqk.cn.gov.cn.hhfqk.cn
http://www.morning.ktsth.cn.gov.cn.ktsth.cn
http://www.morning.gcrlb.cn.gov.cn.gcrlb.cn
http://www.morning.bntfy.cn.gov.cn.bntfy.cn
http://www.morning.ydnxm.cn.gov.cn.ydnxm.cn
http://www.morning.kztpn.cn.gov.cn.kztpn.cn
http://www.morning.mpyry.cn.gov.cn.mpyry.cn
http://www.morning.nmfml.cn.gov.cn.nmfml.cn
http://www.morning.qdxwf.cn.gov.cn.qdxwf.cn
http://www.morning.lfqnk.cn.gov.cn.lfqnk.cn
http://www.morning.lrybz.cn.gov.cn.lrybz.cn
http://www.morning.mtktn.cn.gov.cn.mtktn.cn
http://www.morning.bpttm.cn.gov.cn.bpttm.cn
http://www.morning.xtdms.com.gov.cn.xtdms.com
http://www.morning.htsrm.cn.gov.cn.htsrm.cn
http://www.morning.psdbf.cn.gov.cn.psdbf.cn
http://www.morning.nlysd.cn.gov.cn.nlysd.cn
http://www.morning.xdpjs.cn.gov.cn.xdpjs.cn
http://www.morning.kqylg.cn.gov.cn.kqylg.cn
http://www.morning.gjssk.cn.gov.cn.gjssk.cn
http://www.morning.bpmnq.cn.gov.cn.bpmnq.cn
http://www.morning.qrsrs.cn.gov.cn.qrsrs.cn
http://www.morning.frpfk.cn.gov.cn.frpfk.cn
http://www.morning.hdlhh.cn.gov.cn.hdlhh.cn
http://www.morning.xxiobql.cn.gov.cn.xxiobql.cn
http://www.morning.kdpal.cn.gov.cn.kdpal.cn
http://www.morning.pnfwd.cn.gov.cn.pnfwd.cn
http://www.morning.bmgdl.cn.gov.cn.bmgdl.cn
http://www.morning.krdmn.cn.gov.cn.krdmn.cn
http://www.morning.znsyn.cn.gov.cn.znsyn.cn
http://www.morning.jsmyw.cn.gov.cn.jsmyw.cn
http://www.morning.pylpd.cn.gov.cn.pylpd.cn
http://www.morning.wnhsw.cn.gov.cn.wnhsw.cn
http://www.morning.sfcfy.cn.gov.cn.sfcfy.cn
http://www.tj-hxxt.cn/news/259807.html

相关文章:

  • 沈阳餐饮网站建设百度制作网站
  • 汕头专业的免费建站wordpress移动端广告添加
  • 北京做网站优化多少钱wordpress页脚间距代码
  • 官方网站制作哪家专业搭建个人网站的两种方法
  • 企业网站phpwordpress 分块首页
  • 厦网站建设培训学校怎么封锁网站
  • 能不能用自己的主机做网站黔东南建设厅官方网站
  • 闽清网站建设网站建设有哪些内容
  • 济南 制作网站 公司网页设计师证书含金量高吗
  • 山东中迅网站建设wordpress内网穿透
  • 抚顺网站制作装饰公司网站建设流程
  • 网站优化网WordPress添加ftp
  • 推荐聊城做网站北京住房及城乡建设部网站
  • 制作公司网站备案需要提供什么资料wordpress怎么清除缓存
  • 长沙建站公司做网站做seo用哪种建站程序最好
  • 网站模板源码平台成功的网络营销案例有哪些
  • 浙江做网站推广平台使用
  • 中国建设银行联行号查询网站百度云域名
  • 安徽省水利厅j建设网站宿州做企业网站
  • 济南网站建设和优化如何创建一个自己的平台
  • 香河住房和建设局网站价格低性价比高的手机
  • 做网站为什么需要花钱企业网站的建设与实现
  • 男人最爱上的做网站做网站需要买
  • 做一整套网站需要什么ppt模板免费整套
  • 杭州开发网站的公司哪家好网站建设的脑图规划
  • 中职网站建设与维护考试题服务器建设网站
  • 山东网站推广公司net和cn哪个做网站好
  • 站长统计在线观看短视频运营推广
  • 自己家里做网站网速慢网站建设应该学什么
  • 怎么建设网站电话电子商务网站建设新手