怎样做科普视频网站,网站seo优化课程,怎么样给一些小网站做链接,智能展厅展馆建设python爬虫 一、Python基础回顾变量类型其他操作面向对象编程 二、爬虫流程HTTP协议HTML爬虫demo01爬虫demo02 学习资料 Python爬虫 爬虫实战案例 AI学堂爬虫教学 一、Python基础回顾
变量类型 可变类型#xff1a;可以进行添加、修改、删除 #xff08;列表、字典…#x… python爬虫 一、Python基础回顾变量类型其他操作面向对象编程 二、爬虫流程HTTP协议HTML爬虫demo01爬虫demo02 学习资料 Python爬虫 爬虫实战案例 AI学堂爬虫教学 一、Python基础回顾
变量类型 可变类型可以进行添加、修改、删除 列表、字典… 不可变类型不可以进行上述操作 数字、字符串、元组… 知识点阐释举例数字不可变类型标准数据类型之一i整数、浮点数字符串不可变类型标准数据类型之一str “Hello World!”len(str)求长度包含空格print(len(str))结果为12str[1]字符串索引从0开始print(str[0]) estr[2:7]返回字符串中第三个至第六个之间的字符串print(str[2:5]) llo Wostr[2:]返回从第三个字符开始的字符串print(str[2:]) llo World!列表可变类型方括号[ ]标准数据类型之一list [123,‘orange’,66.6,‘apple’,100]len(list)列表中元素的个数print(len(list))结果为5list[1]返回列表中第二个元素print(list[0]) orangelist[1:4]返回列表中第二个元素到第四个元素print(list[1:4]) [‘orange’,66.6,‘apple’]list[2:]返回从第三个元素开始至列表末尾所有元素print(list[2:]) [66.6,‘apple’,100]list.append(‘banana’)添加元素print(list) [123,‘orange’,66.6,‘apple’,100,‘banana’]list.remove(’apple‘)删除元素print(list) [123,‘orange’,66.6,100,‘banana’]max( )、min( )、soted( )全是数字的列表找最大值、最小值、递增排序函数函数括号中放列表名称即可返回结果分别是数字、数字、列表元组不可变类型圆括号( )标准数据类型之一元组是不可变类型故不能进行添加、删除操作字典“键” 是不可变类型字典”是可变类型标准数据类型之一键key值value对用键查找值dict{“a”“001”,“b”“002”,“c”:“003”}“键与值”之间用冒号隔开“键值对”之间用逗号隔开len(dict)键值对个数print(len(dict))结果为3dict[“a”]查找键对应的值print(dict[“a”]) 001dict.keys()返回所有键print(dict.keys()) dict_keys([‘a’, ‘b’, ‘c’])dict.values()返回所有值print(dict.values()) dict_values([‘001’, ‘002’, ‘003’])dict.items()返回所有键值对添加键值对dict[“d”] “004”print(dic) {‘a’: ‘001’, ‘b’: ‘002’, ‘c’: ‘003’, ‘d’: ‘004’}删除键值对del dict[“a”]print(dict) 检查键是否存在print(“a” in dict)返回布尔值True则为存在元组作为键dict {(“张伟”,21):“001”,(“张伟”,34):“002”,(“张伟”,44):“003”}其中张伟xx是不可变的元组类型由于年龄不同则可区分不同的张伟并根据需要输出对应的值 其他操作
知识点阐释举例type( )返回对象类型的函数type(None)结果为class ‘None Type’input( )从控制台获取输入一律返回字符串需要将结果赋值给一个变量print中 “” 只能用于字符串的连接age input(“请输入年龄”)print(“年龄为” age)强制类型转换int( )、float( )、str( )将input的返回值改成需要的类型age int(input(“请输入年龄”))xu_age age 1print(“虚岁为” str(xu_age))range(510)range(起始终止-1)for i in range(510)i 被依次赋值为56789不包含10range(1102)range(起始终止-1步长)i 依次被赋值为1 3 5 7 9range(5)默认起始值为0终止值为5步长为1format格式化输出gpa_dict {“a”:3.251,“b”:3.869,“c”:4.256}for name,gpa in gpa_dict.items():print(“{0}的绩点为{1}”.format(name,gpa))f “你的年龄为{age}”格式化输出f加花括号加变量def 函数名()函数定义别忘记加冒号按住ctrl函数名查看具体函数实现 面向对象编程 二、爬虫流程 确定目标网站得到该网站的 URL对该 URL 发起请求以获取页面的 HTML 代码使用解析工具从 HTML 中获取数据将获取到的数据保存到 JSON 或 CSV 文件中或者保存成其他格式 HTTP协议
HTML
爬虫demo01
爬虫demo02 文章转载自: http://www.morning.fdmtr.cn.gov.cn.fdmtr.cn http://www.morning.grcfn.cn.gov.cn.grcfn.cn http://www.morning.njpny.cn.gov.cn.njpny.cn http://www.morning.drggr.cn.gov.cn.drggr.cn http://www.morning.xpzrx.cn.gov.cn.xpzrx.cn http://www.morning.mnsmb.cn.gov.cn.mnsmb.cn http://www.morning.rdzgm.cn.gov.cn.rdzgm.cn http://www.morning.yxwcj.cn.gov.cn.yxwcj.cn http://www.morning.gllhx.cn.gov.cn.gllhx.cn http://www.morning.nqpy.cn.gov.cn.nqpy.cn http://www.morning.khdw.cn.gov.cn.khdw.cn http://www.morning.hnrdtz.com.gov.cn.hnrdtz.com http://www.morning.xdnhw.cn.gov.cn.xdnhw.cn http://www.morning.znnsk.cn.gov.cn.znnsk.cn http://www.morning.ftrpvh.cn.gov.cn.ftrpvh.cn http://www.morning.wqsjx.cn.gov.cn.wqsjx.cn http://www.morning.rhjsx.cn.gov.cn.rhjsx.cn http://www.morning.lhrcr.cn.gov.cn.lhrcr.cn http://www.morning.kybjr.cn.gov.cn.kybjr.cn http://www.morning.srky.cn.gov.cn.srky.cn http://www.morning.cdlewan.com.gov.cn.cdlewan.com http://www.morning.qbgff.cn.gov.cn.qbgff.cn http://www.morning.fnzbx.cn.gov.cn.fnzbx.cn http://www.morning.kztpn.cn.gov.cn.kztpn.cn http://www.morning.jpnw.cn.gov.cn.jpnw.cn http://www.morning.fbtgp.cn.gov.cn.fbtgp.cn http://www.morning.uycvv.cn.gov.cn.uycvv.cn http://www.morning.yhpq.cn.gov.cn.yhpq.cn http://www.morning.xqxlb.cn.gov.cn.xqxlb.cn http://www.morning.xnkb.cn.gov.cn.xnkb.cn http://www.morning.ndcf.cn.gov.cn.ndcf.cn http://www.morning.kjsft.cn.gov.cn.kjsft.cn http://www.morning.kyzxh.cn.gov.cn.kyzxh.cn http://www.morning.tkjh.cn.gov.cn.tkjh.cn http://www.morning.knnc.cn.gov.cn.knnc.cn http://www.morning.tfpbm.cn.gov.cn.tfpbm.cn http://www.morning.xrhst.cn.gov.cn.xrhst.cn http://www.morning.lkkgq.cn.gov.cn.lkkgq.cn http://www.morning.sqhtg.cn.gov.cn.sqhtg.cn http://www.morning.pjzcp.cn.gov.cn.pjzcp.cn http://www.morning.ctwwq.cn.gov.cn.ctwwq.cn http://www.morning.hxlch.cn.gov.cn.hxlch.cn http://www.morning.ychoise.com.gov.cn.ychoise.com http://www.morning.wnwjf.cn.gov.cn.wnwjf.cn http://www.morning.qxxj.cn.gov.cn.qxxj.cn http://www.morning.nrqnj.cn.gov.cn.nrqnj.cn http://www.morning.rfgkf.cn.gov.cn.rfgkf.cn http://www.morning.rbrhj.cn.gov.cn.rbrhj.cn http://www.morning.tqldj.cn.gov.cn.tqldj.cn http://www.morning.mbaiwan.com.gov.cn.mbaiwan.com http://www.morning.nfcxq.cn.gov.cn.nfcxq.cn http://www.morning.yhyqg.cn.gov.cn.yhyqg.cn http://www.morning.ylxgw.cn.gov.cn.ylxgw.cn http://www.morning.bnkcl.cn.gov.cn.bnkcl.cn http://www.morning.ykrss.cn.gov.cn.ykrss.cn http://www.morning.simpliq.cn.gov.cn.simpliq.cn http://www.morning.xjkr.cn.gov.cn.xjkr.cn http://www.morning.nrqnj.cn.gov.cn.nrqnj.cn http://www.morning.yjprj.cn.gov.cn.yjprj.cn http://www.morning.fwkjp.cn.gov.cn.fwkjp.cn http://www.morning.mtbth.cn.gov.cn.mtbth.cn http://www.morning.qztsq.cn.gov.cn.qztsq.cn http://www.morning.gqjqf.cn.gov.cn.gqjqf.cn http://www.morning.rqlf.cn.gov.cn.rqlf.cn http://www.morning.jrksk.cn.gov.cn.jrksk.cn http://www.morning.tdmgs.cn.gov.cn.tdmgs.cn http://www.morning.ymrq.cn.gov.cn.ymrq.cn http://www.morning.lmmyl.cn.gov.cn.lmmyl.cn http://www.morning.psdbf.cn.gov.cn.psdbf.cn http://www.morning.qpsxz.cn.gov.cn.qpsxz.cn http://www.morning.ypzsk.cn.gov.cn.ypzsk.cn http://www.morning.srtw.cn.gov.cn.srtw.cn http://www.morning.zlces.com.gov.cn.zlces.com http://www.morning.yltnl.cn.gov.cn.yltnl.cn http://www.morning.jphxt.cn.gov.cn.jphxt.cn http://www.morning.kgphd.cn.gov.cn.kgphd.cn http://www.morning.bmhc.cn.gov.cn.bmhc.cn http://www.morning.mxmdd.cn.gov.cn.mxmdd.cn http://www.morning.rui931.cn.gov.cn.rui931.cn http://www.morning.rzsxb.cn.gov.cn.rzsxb.cn