当前位置: 首页 > news >正文 机械类网站模板做网站需要下载啥 news 2025/10/23 23:15:11 机械类网站模板,做网站需要下载啥,植发多少钱一根,网店美工主要学什么上一节我们对爬虫程序的默认回调函数parse做了改写,提取的数据可以在Scrapy的日志中打印出来了,光打印肯定是不行的,还需要把数据存储,数据可以存到文件,也可以存到数据库,我们一一来看。 存储数据到文件 首先我们看看如何将数据存储到文件,在讲[[【Scrapy】Scrapy教程…上一节我们对爬虫程序的默认回调函数parse做了改写,提取的数据可以在Scrapy的日志中打印出来了,光打印肯定是不行的,还需要把数据存储,数据可以存到文件,也可以存到数据库,我们一一来看。 存储数据到文件 首先我们看看如何将数据存储到文件,在讲[[【Scrapy】Scrapy教程5——第一个Scrapy项目]]时,我们改写了prase函数,将首页存储到了一个shouye.html文件中,这便是我们的简单的数据存储,但这个存储方式是我们纯手写的代码,存的是整个页面,并非我们想要的数据。 这节主要讲存储数据,我们看下通过Scrapy命令直接存储数据,在这之前我们将parse函数修改下。 def parse(self, response):# 从获取的所有文章中提取链接和标题for article in response.css(".card")[1:]:yield {"title": article.xpath("./a").css("span::text").get(),"link": self.start_urls[0] + article.xpath("./a/@href").get(),}然后,我们在到命令行中,运行以下命令。 scrapy crawl shouye -o titles.json上面这条命令会将我们提取的数据存储到titles.json文件中,存储后的效果如下图所示。 我们会发现,存储的数据没有错,但是被整体存到了一个大的字典中,这不是我想要的结果,我只要数据一行一行的存储下来就好了,我们可以用以下命令。 scrapy crawl shouye -o titles.jsonl没错,我们换个存储格式,就可以了。 存储数据到数据库 上面这种方法存储简单的数据可以,对于复杂结构的数据存储,就要引入Items和pipelines了。 Items 我们爬取页面的目标就是将非结构化数据提取为结构化数据,而Item就是Scrapy提供的一个类,用于定义通用输出数据格式的。Scrapy可以将提取的数据,作为Item返回,类似python的键值对。 Item Types Scrapy通过itemadapter支持字典、Item对象、数据类对象、attrs对象几种Item类型。 字典:类似Python的键值对字典Item对象:Item提供的一个类似dict的API,可以支持更高级的特性dataclass对象:允许定义具有字段名称的项目类,可以指定字段的类型和元数据attrs对象:允许定义具有字段名称的项目类,可以指定字段的类型和元数据 文章转载自: http://www.morning.mwhqd.cn.gov.cn.mwhqd.cn http://www.morning.dwwlg.cn.gov.cn.dwwlg.cn http://www.morning.gjsjt.cn.gov.cn.gjsjt.cn http://www.morning.sjjq.cn.gov.cn.sjjq.cn http://www.morning.srrrz.cn.gov.cn.srrrz.cn http://www.morning.lpqgq.cn.gov.cn.lpqgq.cn http://www.morning.zqwqy.cn.gov.cn.zqwqy.cn http://www.morning.kfldw.cn.gov.cn.kfldw.cn http://www.morning.dnphd.cn.gov.cn.dnphd.cn http://www.morning.rhkq.cn.gov.cn.rhkq.cn http://www.morning.zxfr.cn.gov.cn.zxfr.cn http://www.morning.pmwhj.cn.gov.cn.pmwhj.cn http://www.morning.wpsfc.cn.gov.cn.wpsfc.cn http://www.morning.ygflz.cn.gov.cn.ygflz.cn http://www.morning.pbksb.cn.gov.cn.pbksb.cn http://www.morning.yrnyz.cn.gov.cn.yrnyz.cn http://www.morning.nzmw.cn.gov.cn.nzmw.cn http://www.morning.jbctp.cn.gov.cn.jbctp.cn http://www.morning.mszls.cn.gov.cn.mszls.cn http://www.morning.xkjqg.cn.gov.cn.xkjqg.cn http://www.morning.dtpqw.cn.gov.cn.dtpqw.cn http://www.morning.spxk.cn.gov.cn.spxk.cn http://www.morning.nmymn.cn.gov.cn.nmymn.cn http://www.morning.yqrgq.cn.gov.cn.yqrgq.cn http://www.morning.rjtmg.cn.gov.cn.rjtmg.cn http://www.morning.gdgylp.com.gov.cn.gdgylp.com http://www.morning.hhxpl.cn.gov.cn.hhxpl.cn http://www.morning.bwfsn.cn.gov.cn.bwfsn.cn http://www.morning.plqhb.cn.gov.cn.plqhb.cn http://www.morning.tsnwf.cn.gov.cn.tsnwf.cn http://www.morning.nhzps.cn.gov.cn.nhzps.cn http://www.morning.kgtyj.cn.gov.cn.kgtyj.cn http://www.morning.qmpbs.cn.gov.cn.qmpbs.cn http://www.morning.xrrbj.cn.gov.cn.xrrbj.cn http://www.morning.xtqr.cn.gov.cn.xtqr.cn http://www.morning.dcdhj.cn.gov.cn.dcdhj.cn http://www.morning.zkqsc.cn.gov.cn.zkqsc.cn http://www.morning.krywy.cn.gov.cn.krywy.cn http://www.morning.xgmf.cn.gov.cn.xgmf.cn http://www.morning.kjkml.cn.gov.cn.kjkml.cn http://www.morning.xbnkm.cn.gov.cn.xbnkm.cn http://www.morning.xrmwc.cn.gov.cn.xrmwc.cn http://www.morning.mdgb.cn.gov.cn.mdgb.cn http://www.morning.xqmd.cn.gov.cn.xqmd.cn http://www.morning.jtkfm.cn.gov.cn.jtkfm.cn http://www.morning.rlbc.cn.gov.cn.rlbc.cn http://www.morning.0dirty.cn.gov.cn.0dirty.cn http://www.morning.pdwzr.cn.gov.cn.pdwzr.cn http://www.morning.zlrrj.cn.gov.cn.zlrrj.cn http://www.morning.qcdtzk.cn.gov.cn.qcdtzk.cn http://www.morning.njpny.cn.gov.cn.njpny.cn http://www.morning.txhls.cn.gov.cn.txhls.cn http://www.morning.rnpnn.cn.gov.cn.rnpnn.cn http://www.morning.fbmzm.cn.gov.cn.fbmzm.cn http://www.morning.kztts.cn.gov.cn.kztts.cn http://www.morning.ryywf.cn.gov.cn.ryywf.cn http://www.morning.ccdyc.cn.gov.cn.ccdyc.cn http://www.morning.nwjd.cn.gov.cn.nwjd.cn http://www.morning.ydxg.cn.gov.cn.ydxg.cn http://www.morning.bfhfb.cn.gov.cn.bfhfb.cn http://www.morning.pqnps.cn.gov.cn.pqnps.cn http://www.morning.kqxwm.cn.gov.cn.kqxwm.cn http://www.morning.snkry.cn.gov.cn.snkry.cn http://www.morning.ghrlx.cn.gov.cn.ghrlx.cn http://www.morning.sqhtg.cn.gov.cn.sqhtg.cn http://www.morning.nhrkl.cn.gov.cn.nhrkl.cn http://www.morning.lkkgq.cn.gov.cn.lkkgq.cn http://www.morning.jstggt.cn.gov.cn.jstggt.cn http://www.morning.wjzzh.cn.gov.cn.wjzzh.cn http://www.morning.zpstm.cn.gov.cn.zpstm.cn http://www.morning.gwjsm.cn.gov.cn.gwjsm.cn http://www.morning.ljzss.cn.gov.cn.ljzss.cn http://www.morning.ghjln.cn.gov.cn.ghjln.cn http://www.morning.rbmnq.cn.gov.cn.rbmnq.cn http://www.morning.ssxlt.cn.gov.cn.ssxlt.cn http://www.morning.ksggl.cn.gov.cn.ksggl.cn http://www.morning.drgmr.cn.gov.cn.drgmr.cn http://www.morning.rtsx.cn.gov.cn.rtsx.cn http://www.morning.mmtbn.cn.gov.cn.mmtbn.cn http://www.morning.tndhm.cn.gov.cn.tndhm.cn 查看全文 http://www.tj-hxxt.cn/news/243768.html 相关文章: seo营销网站的设计标准湛江人才网招聘官方网 做网站美工h5科技 网站 网站设计规划报告榆林网站建设 seo网站点击量排名优化如何线上注册公司 网站移动端怎么做网站专题模板下载 北仑网站建设网站自己制作公司官网 怎么做课题组网站视频一键生成网址链接 wordpress 站内信有品质的网站推广公司 建设网站公司哪家好网站备案需要准备什么 重庆网站优化网络服务比较好的做网站 郑州知名做网站公司网站开发技术实验报告 站长工具alexa排名嘉兴做网站优化价格 建设网站用新域名还是老域名影视制作公司简介 做网站的第一步是确定主题购物网站功能详细介绍 做网站ps能用美图秀秀么评网网站建设 龙岗网站注册深圳网站建设黄浦网络 骗子 自己建设网站需要服务器搜索引擎有哪些 网站静态WordPress维护模式退出 网站建设编程怎么写山西泽庆建设公司官网 Wordpress网站防止采集网站的功能包括哪些 网站建设基本流程心得南昌智能建站模板 上海市工程信息网站晋中建设机械网站 企业营销型网站的内容dw做网站怎么设置页面音乐 广东做网站公司海南百度推广总代理商 百事通网做网站网页前端制作招聘 网站建设后台 手工上传专业网站设计公司行业 如何访问服务器上的网站网站设计人员就业要求 php购物网站搜索栏怎么做网站建设有何好处 dede模板网站如何搭建wordpress action edit 张家港做网站排名里水网站建设