当前位置: 首页 > news >正文

网站建设公司怎么选择东莞搜索网络优化

网站建设公司怎么选择,东莞搜索网络优化,网站建设维护毕业论文,建设主题网站一般要经历的顺序一、前言 有的时候,Scrapy的callback方法直接被略过了,不去执行其中的回调方法,可能排查好久都排查不出来,我来教大家集中解决方法。 yield Request(urlurl, callbackself.parse_detail, cb_kwargs{item: item})二、解决方法 1…

一、前言

有的时候,Scrapy的callback方法直接被略过了,不去执行其中的回调方法,可能排查好久都排查不出来,我来教大家集中解决方法。

yield Request(url=url, callback=self.parse_detail, cb_kwargs={'item': item})

二、解决方法

1、url可能被过滤掉了,如果是被scrapy过滤掉了,那就只需要在这个 scrapy.Request() 函数中将参数放入dont_filter=True加入进去。

2、如果发现还是不行,就可能是因为allowed_domains这个赋值的时候赋值的是别的url,其实可以直接把这个注释掉直接不用。

3、仍然无法使用的话,首先那就要看网站协议了,直接在网站中查看输入:https://www.tencent.com/robots.txt 这里就可以看到:

在这里插入图片描述

这里是没有限制的,那么的话按照前两个按照操作就可以正常的回调了

4、如果不行就要打开配置文件settings.py,这里的False表示忽略网站的robots.txt协议,默认为True:

ROBOTSTXT_OBEY = False

把这个设置为False再试下就可以进行回调了。

5、重点来了!!!!如果以下方法还是没有解决问题的话,并且执行日志如下种形式:在这里插入图片描述你有没有想过一种可能,其实你的代码是能正常执行回调函数的!!

你没有看错,你的代码就是对的!!!!那日志里面为什么不出现执行回调函数的信息呢??

原因:程序不是进不了回调方法,是并发数设置的太大,然后页面数量又比较多,Scrapy框架呢又是先把全部页面的请求排到队列中,然后才会去执行回调中的函数,所以前面的日志都是发出请求的日志,只有全部页面都发出请求进入队列之后,才会去爬取数据进入回调方法,所以等久一点就能看到进入回调的日志了。(注意:Scrapy不是先把全部页面的请求排到队列中,然后才会去执行回调中的函数,我这里只是为了方便解释才这么说的,反正大概就是这个意思)

解决方法:如果你认为是进入不了回调方法,并且爬取的页面数量又比较多的话,可以把并发数设置小一点再测试。

在这里插入图片描述

我设置成128之后,完美看到进入回调函数的日志!!

参考文章:https://www.cnblogs.com/zhengxianfa/p/16741295.html

http://www.tj-hxxt.cn/news/106367.html

相关文章:

  • 中国建设执业资格注册中心网站磁力兔子
  • 泊头那家做网站西安外包公司排行
  • 网络工程解决方案公司seo关键词排名优化是什么
  • 做网站开源seo网站内部优化方案
  • 公司网站是否做地方分站seo和sem是什么意思
  • 分类目录网站程序关键词排名优化顾问
  • 长沙专业网络推广公司苏州百度关键词优化
  • 有什么做美食的网站优化大师官方网站
  • 网站排名消失嘉兴百度seo
  • 长春做网站要多少钱网络广告四个特征
  • 网站设计框架图品牌营销是什么
  • 专门教做西餐的网站seo网上培训课程
  • 图片展示网站搭建网络舆情处置的五个步骤
  • 建设景区网站要有的内容计算机培训课程
  • 抚州网站建设郑州seo软件
  • 网站模板可以自己做吗百度会员登录入口
  • 营销型网站建设步骤宁波网站推广找哪家公司
  • 微信表情包制作网站河南省疫情最新情况
  • 宝安做网站多少钱百度广告点击软件源码
  • 菏泽的给公司做网站的网络营销的实现方式包括
  • 网站如何备案icp海外推广是做什么的
  • dw做网站常用标签baidu百度
  • 深圳龙岗做网站的公司网站友情链接自动上链
  • 安徽省建设局网站海外推广服务
  • wordpress用户名在哪看seo怎么做
  • 教你做文案的网站推荐最新国际新闻热点事件
  • wordpress数据库缓存玉溪seo
  • 建工网校一级建造师东莞seo代理
  • 织梦做双语网站长沙网络推广小公司
  • 专题网站可以做什么微信推广怎么做