当前位置: 首页 > news >正文

网站开发 音乐插入企业网站推广有哪些方式

网站开发 音乐插入,企业网站推广有哪些方式,网站后台域名,黄骅招聘网最新招工信息Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖 掘,信息处理或存储历史数据等一系列的程序中。 1. 安装scrapy: pip install scrapy 注意:需要安装在python解释器相同的位置,例如&#xf…

Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖
掘,信息处理或存储历史数据等一系列的程序中。

1. 安装scrapy:

pip install scrapy

注意:需要安装在python解释器相同的位置,例如:D:\Program Files\Python3.11.4\Scripts

若安装时报错缺少twisted,解决方法:安装twisted合适的版本  twisted下载路径

下载 twisted后,安装twisted:pip install twisted路径

 查看python版本:终端输入python

若报错win32错误,解决方法:pip install pypiwin32

若是仍然报错,可安装anaconda,若使用anaconda,pycharm里的解释器也需要换成anaconda的的路径  Anaconda 安装

(注意:安装anaconda时,安装路径下不能有任何文件,否则可能会导致不能用  )

2.  使用scrapy创建项目:

scrapy startproject 项目名字         (项目名字不能用数字开头,不能包含中文)

项目结构:
spidersinit_.py自定义的爬虫文件.py   ---》由我们自己创建,是实现爬虫核心功能的文件
init__.py
items.py          ---》定义数据结构的地方(爬取的数据有哪些),是一个继承自                scrapy.Item的类
middlewares.py    ---》中间件 代理
pipelines.py      ---》管道文件,里面只有一个类,用于处理下载数据的,后续处理默认是300优先级,值越小优先级越高 (1-10)
settings.py       ---》配置文件 比如: 是否遵守robots协议,user-Agent定义等

3.  创建爬虫文件

在spiders下创建,进入spiders目录: cd .\项目名字\项目名字\spiders

 scripy genspider 爬虫文件的名字  要爬取的网页       (一般情况下不需要添加http协议)

 

4.  运行爬虫程序 

scrapy crawl 爬虫的名字     (名字为程序中的name)

 

 例子:

# spider下的爬虫文件
import scrapyclass TongchengSpider(scrapy.Spider):name = "tongcheng"allowed_domains = ["https://sz.58.com/sou/?key=%E5%89%8D%E7%AB%AF%E5%BC%80%E5%8F%91&classpolicy=classify_E%2Cuuid_YZWJGz6dw5SYe54A6jYeyfiY5J4TPdc8&search_uuid=YZWJGz6dw5SYe54A6jYeyfiY5J4TPdc8&search_type=input"]start_urls = ["https://sz.58.com/sou/?key=%E5%89%8D%E7%AB%AF%E5%BC%80%E5%8F%91&classpolicy=classify_E%2Cuuid_YZWJGz6dw5SYe54A6jYeyfiY5J4TPdc8&search_uuid=YZWJGz6dw5SYe54A6jYeyfiY5J4TPdc8&search_type=input"]def parse(self, response):print("学习scrapy")content = response.text   # 获取的是响应的字符串content1 = response.body  # 获取的是二进制数据# span = response.xpath("xpath语法")  # 可以直接是xpath方法来解析response中的内容span = response.xpath('//div[@id="filter"]/div[@class="tabs"]/a/span')[0]  # xpathprint("=================================================================")print(span.extract())   # 提取seletor对象的data的属性值print(span.extract_first())  # 提取的seletor列表的第一个数据

http://www.tj-hxxt.cn/news/121149.html

相关文章:

  • 玉溪市网站建设推广百度入口
  • 网络建设公司哪家好如何做seo
  • seo优化软件免费版深圳百度推广排名优化
  • django做网站快吗百度客服
  • seo网站建设哪家专业如何制作网站和网页
  • 做网站与不做网站的区别奶茶网络营销策划方案
  • 政府门户网站群建设方案seo优化软件大全
  • 纯html5 网站重庆企业seo
  • 宁波网站公司哪里好怎样在百度上做广告
  • 制作外贸网站公司浏览器下载安装2022最新版
  • 怎么学做淘宝电商网站吗培训机构需要什么资质
  • 丰田车营销网站建设的纲要计划书真正免费的网站建站平台运营
  • 长沙教育类网站建设魔贝课凡seo
  • 河南省新闻出版学校广西seo公司
  • b2b网站建设注意事项怎么推广网址
  • 怎么做专门卖二手衣服的网站广州高端网站建设公司
  • 浦城县规划建设和旅游局网站网站广告调词软件
  • 郑州网站制作-中国互联2021最近比较火的营销事件
  • 校园网站怎么做淘宝关键词排名优化技巧
  • 泉州网站建设方案优化郑州网站制作推广公司
  • 网站做多长时间才有流量合肥优化
  • 成都网站建设服务商seo查询是什么
  • 提供手机网站开发营销类网站
  • php如何制作网站域名注册 阿里云
  • 用wordpress做的网站有哪些太原seo软件
  • 做恋爱方面的网站百度代理公司怎么样
  • 网站做适配手机要多久网络营销推广系统
  • 用wordpress案例附子seo教程
  • wordpress 数据库名贵济南seo外包公司
  • 天津专业网站制作设计佛山全市核酸检测