当前位置: 首页 > news >正文

合肥网站制作哪家有名怎么做一个属于自己的网站

合肥网站制作哪家有名,怎么做一个属于自己的网站,什么网站算是h5做的,企业官方网站系统建设1.时间的处理 获取当前时间的字符串 # 创建一个datetime对象并设置为当前时间,该时间少8小时 dt datetime.datetime.now() # 将datetime转换为本地时区 local_tz pytz.timezone(Asia/Shanghai) local_dt local_tz.localize(dt) # 将datetime对象格式化为ISO 86…

1.时间的处理

获取当前时间的字符串

# 创建一个datetime对象并设置为当前时间,该时间少8小时
dt = datetime.datetime.now()
# 将datetime转换为本地时区
local_tz = pytz.timezone('Asia/Shanghai')
local_dt = local_tz.localize(dt)
# 将datetime对象格式化为ISO 8601格式的字符串
iso_date_string = local_dt.isoformat()
# 从字符串中删除'T'分隔符
date_string = iso_date_string.replace('T', ' ')
# 从字符串中删除'.091979+08:00'毫秒和时区信息
date_string = date_string.split('.')[0]

将 datetime 对象 datetime.datetime(2023, 5, 24, 14, 18, 20, 91979) 转换为字符串 '2023-05-24T14:18:20.091979'

# 创建一个datetime对象并设置为当前时间,该时间少8小时
dt = datetime.datetime.now()
# 将datetime转换为本地时区
local_tz = pytz.timezone('Asia/Shanghai')
local_dt = local_tz.localize(dt)
# 将datetime对象格式化为ISO 8601格式的字符串
iso_date_string = local_dt.isoformat()
# 从字符串中删除'T'分隔符
date_string = iso_date_string.replace('T', ' ')
# 从字符串中删除'.091979+08:00'毫秒和时区信息
date_string = date_string.split('.')[0]

 2.获取scrapy爬虫结束后的统计信息

在pipelines文件的类,添加一下代码

# 1.在settings 启用统计信息中间件 STATS_CLASS = 'scrapy.statscollectors.MemoryStatsCollector'
# 2.用于连接信号,以便在爬虫关闭时调用spider_closed方法
@classmethod
def from_crawler(cls, crawler):pipeline = cls()crawler.signals.connect(pipeline.spider_closed, signal=scrapy.signals.spider_closed)return pipeline# 3.获取爬虫运行的统计信息,并将其保存到JSON文件中
def spider_closed(self, spider):stats = spider.crawler.stats.get_stats()with open('./log/stats.json', 'w') as f:json.dump(stats, f)

注:close_spider方法和spider_closed方法是 Scrapy框架中表示爬虫结束的两种方法,它们有以下区别:

close_spider方法:

在爬虫完成数据抓取后调用,可以用于执行一些清理操作,例如关闭数据库连接或写入总结性数据等。此方法可以由用户手动调用,也可以在 Scrapy 引擎检测到爬虫结束时自动调用。

spider_closed方法:

当爬虫关闭时被 Scrapy 引擎自动调用,比close_spider更适合做资源释放或其他清理工作。

因此,close_spider方法和spider_closed方法在实现上可以相似,但它们基于两个不同的场景,需要根据具体情况使用。

如果您只需要在爬虫结束时执行一些常规的清理工作,则应该使用 spider_closed 方法;如果您需要手动启动传输,或者需要在某个特定时间点执行代码,则可能需要使用 close_spider 方法。

3.数据保存前、后操作

数据保存到redis前,在__init__方法 初始化redis对象,删除redis已经存在的旧数据;

数据保存到redis后,在爬虫结束方法退出driver,否则下次再跑就会报502超时链接不到docker selenium的driver,因为docker的driver的进程没有释放。

class DeveloperDocsScrapyPipeline:# __init__方法是可选的,作为类的初始化方法def __init__(self) -> None:self.redis_items_key = "developer-docs:link-data:items"self._redis = operate_redis()self._redis.del_redis_key(self.redis_items_key)def spider_closed(self, spider):driver.close()# 需要退出,否则,docker的进程不退出,下次执行会超时driver.quit()

http://www.tj-hxxt.cn/news/125822.html

相关文章:

  • asp 通过ftp 网站搬家百度营销
  • 设计师交流平台有哪些seo tdk
  • 安徽做网站seo 服务
  • 建设外贸网站要多少钱企业网站建设服务
  • 如何做外国网站销售怎样在百度上做免费推广
  • 优质网站建设报价百度官方官网
  • 微信网站开发多少钱长春最专业的seo公司
  • 全运会网站建设方案关键词优化seo多少钱一年
  • wordpress 在线敏感词seo广告投放
  • 手机网站要备案吗百度seo是什么
  • 烟台外贸网站建设谷歌官方网站登录入口
  • 西安网站建设有那些公司网络违法犯罪举报网站
  • 厦门模板建站平台今天特大新闻最新消息
  • 网站文章更新怎么做合肥做网络推广的公司
  • 局网站建设情况长沙百度快速排名
  • 金融公司网站开发费用入什么科目百度指数疫情
  • 唐山建设招聘信息网站公司域名查询官网
  • 做网站哪个软件好用百度广告竞价
  • 上海微网站设计网站制作报价
  • 邯郸网站设计哪家好百度资源平台链接提交
  • 七个常委名字百度网站优化培训
  • html是建网站导航栏怎么做整合营销传播案例
  • 南宁市住房和城乡建设部网站搜索推广和信息流推广的区别
  • 怎么做水果网站东莞网站推广运营公司
  • 建个企业网站要多少钱推特最新消息今天
  • 山东建设工程信息网站百度收录怎么做
  • 上海公安网站备案株洲专业seo优化
  • 做网站过程中的自身不足深圳将进一步优化防控措施
  • 专业的公司网站制作服务seo搜索优化待遇
  • dw网站引导页怎么做seo l