当前位置: 首页 > news >正文

肇庆网站制作设计网站查询网

肇庆网站制作设计,网站查询网,wordpress q8hpk,公司门户网站的设计与实现注意:模拟登陆时,必须保证settings.py里的 COOKIES_ENABLED (Cookies中间件) 处于开启状态 COOKIES_ENABLED True 或 # COOKIES_ENABLED False 策略一:直接POST数据(比如需要登陆的账户信息) 只要是需要提供post数据的&#xff…

注意:模拟登陆时,必须保证settings.py里的 COOKIES_ENABLED (Cookies中间件) 处于开启状态

COOKIES_ENABLED = True 或 # COOKIES_ENABLED = False

策略一:直接POST数据(比如需要登陆的账户信息)

只要是需要提供post数据的,就可以用这种方法。下面示例里post的数据是账户密码:

# -*- coding: utf-8 -*-
import scrapyclass Renren1Spider(scrapy.Spider):name = "renren1"allowed_domains = ["renren.com"]def start_requests(self):url = 'http://www.renren.com/PLogin.do'# FormRequest 是Scrapy发送POST请求的方法yield scrapy.FormRequest(url = url,formdata = {"email" : "mr_mao_hacker@163.com", "password" : "axxxxxxxe"},callback = self.parse_page)def parse_page(self, response):with open("mao2.html", "w") as filename:filename.write(response.body)
策略二:标准的模拟登陆步骤

正统模拟登录方法:

  1. 首先发送登录页面的get请求,获取到页面里的登录必须的参数(比如说zhihu登陆界面的 _xsrf)

  2. 然后和账户密码一起post到服务器,登录成功

# -*- coding: utf-8 -*-
import scrapyclass Renren2Spider(scrapy.Spider):name = "renren2"allowed_domains = ["renren.com"]start_urls = ("http://www.renren.com/PLogin.do",)# 处理start_urls里的登录url的响应内容,提取登陆需要的参数(如果需要的话)def parse(self, response):# 提取登陆需要的参数#_xsrf = response.xpath("//_xsrf").extract()[0]# 发送请求参数,并调用指定回调函数处理yield scrapy.FormRequest.from_response(response,formdata = {"email" : "mr_mao_hacker@163.com", "password" : "axxxxxxxe"},#, "_xsrf" = _xsrf},callback = self.parse_page)# 获取登录成功状态,访问需要登录后才能访问的页面def parse_page(self, response):url = "http://www.renren.com/422167102/profile"yield scrapy.Request(url, callback = self.parse_newpage)# 处理响应内容def parse_newpage(self, response):with open("xiao.html", "w") as filename:filename.write(response.body)
策略三:直接使用保存登陆状态的Cookie模拟登陆

如果实在没办法了,可以用这种方法模拟登录,虽然麻烦一点,但是成功率100%

# -*- coding: utf-8 -*-
import scrapyclass RenrenSpider(scrapy.Spider):name = "renren"allowed_domains = ["renren.com"]start_urls = ('http://www.renren.com/111111','http://www.renren.com/222222','http://www.renren.com/333333',)cookies = {"anonymid" : "ixrna3fysufnwv","_r01_" : "1","ap" : "327550029","JSESSIONID" : "abciwg61A_RvtaRS3GjOv","depovince" : "GW","springskin" : "set","jebe_key" : "f6fb270b-d06d-42e6-8b53-e67c3156aa7e%7Cc13c37f53bca9e1e7132d4b58ce00fa3%7C1484060607478%7C1%7C1486198628950","t" : "691808127750a83d33704a565d8340ae9","societyguester" : "691808127750a83d33704a565d8340ae9","id" : "327550029","xnsid" : "f42b25cf","loginfrom" : "syshome"}# 可以重写Spider类的start_requests方法,附带Cookie值,发送POST请求def start_requests(self):for url in self.start_urls:yield scrapy.FormRequest(url, cookies = self.cookies, callback = self.parse_page)# 处理响应内容def parse_page(self, response):print "===========" + response.urlwith open("deng.html", "w") as filename:filename.write(response.body)
http://www.tj-hxxt.cn/news/116298.html

相关文章:

  • 辽宁大连直客部七部电话厦门seo优化外包公司
  • 网络公司制作网站查关键词排名网
  • 做的最好的微电影网站易推广
  • 艺阳科技网站建设神马关键词快速排名软件
  • app开发网站建设软文广告推广
  • 网站开发 明细外贸出口平台网站
  • 甘肃网站建设公司2022年网络流行语
  • 开办网站原因给公司建网站需要多少钱
  • cms是什么公司简称网站优化课程培训
  • 电子商务网站建设前期营销网站搭建
  • 独立做网站需要学什么条件seo入门课程
  • 支付宝 收费 网站开发网络推广和竞价怎么做
  • 网站建设需要多久外包公司到底值不值得去
  • 莲花网站火星时代教育培训机构官网
  • 网站的商桥怎么做系统优化的方法
  • 什么网站可以发布有偿做项目百度手机助手免费下载
  • 青羊区建设和交通网站百度竞价优缺点
  • 互动网站建设seo域名如何优化
  • 做网站会什么问题优化大师免费下载
  • 成都 专业 网站建设济南百度推广优化
  • 自己怎么做点击量好的网站全网搜索指数查询
  • 网站建设的内容百度网盘搜索引擎入口哪里
  • 刷网站跳出率百度推广怎么优化排名
  • wordpress 获取菜单seo分析师招聘
  • 学网站建设的学校发帖效果好的网站
  • 怎么做网站 知乎杭州网站推广优化
  • 创建网站基本流程seo关键词优化策略
  • 做网站必须要dreamever东莞网站营销
  • 社交型网站开发怎么做营销
  • 低价建设手机网站公司网站设计定制