郑州网站制作报价,企业网站源码搜一品资源,成都网站建设好多科技,企业seo指的是学习路线#xff1a;爬虫基础知识-requests模块-数据提取-selenium-反爬与反反爬-MongoDB数据库-scrapy-appium。
对应视频链接(百度网盘)#xff1a;正在整理中
爬虫基础知识#xff1a;
1.爬虫的概念
总结#xff1a;模拟浏览器#xff0c;发送请求#xff0c;获取…学习路线爬虫基础知识-requests模块-数据提取-selenium-反爬与反反爬-MongoDB数据库-scrapy-appium。
对应视频链接(百度网盘)正在整理中
爬虫基础知识
1.爬虫的概念
总结模拟浏览器发送请求获取响应。 2.爬虫的作用 数据采集 软件测试 抢票 网站上的投票 网络安全 3.爬虫的分类 数量 是否获取数据 url与数据的关系 4.爬虫的流程 url 发请求获取响应 解析 5.http复习 http以及https的概念和区别 HTTPSH比HTTP更安全但是性能更低 6.常见的请求头与响应头 请求头 host 域名 Connection 长连接 Upgrade-Insecure-Requests 升级为HTTPS请求 ***User-Agent 用户代理提供系统信息和浏览器信息 ***Referer 页面跳转处防盗链(图片/视频) ***Cookie 状态保持 响应头 Set-Cookie 7.状态码 所有的状态码都不可信一切以是否从抓包得到的响应中获取到数据为准 network中抓包得到的源码才是判断依据elements中的源码是渲染之后的源码
8.浏览器请求的过程 发送所有请求进行渲染 爬虫 只发送指定请求不会渲染 骨骼文件html静态文件 肌肉文件js/ajax请求 皮肤css/font/图片
源代码 控制台 所有源代码 响应 Network点刷新可以看到响应