移动应用网站开发,wordpress证书安装,国家企业网查询,德州金航网络公司网站建设浅试Python爬取视频
1.页面分析
使用虾米视频在线解析使用方式#xff1a;https://jx.xmflv.cc/?url目标网站视频链接例如某艺的视频 原视频链接
解析结果:
1.1 F12查看页面结构 我们发现页面内容中什么都没有#xff0c;video标签中的src路径也不是视频的数据。
1.2 …浅试Python爬取视频
1.页面分析
使用虾米视频在线解析使用方式https://jx.xmflv.cc/?url目标网站视频链接例如某艺的视频 原视频链接
解析结果:
1.1 F12查看页面结构 我们发现页面内容中什么都没有video标签中的src路径也不是视频的数据。
1.2 老规矩看网络请求中的过滤的XHR
发现一堆没卵用的数据返回直到我们看到这个mixed.m3u3结尾的返回结果及后续高度相似的请求数据
1.3解析mp2t媒体文件
将上一步中的mp2t媒体文件随机挑选一个下载下来。打开后就是我们的目标视频。ok目的达到。 接下来我们要做的就是将返回的mixed.m3u8解析出来
2.功能实现
2.1 拿到m3u8的文件
#-*- coding:UTF-8 -*-import requests
import os
import sysres requests.get(https://vip.ffzy-online2.com/20221231/3848_0533f6da/2000k/hls/mixed.m3u8)
m3u8_obj res.text
print(m3u8_obj)可以看到打印结果 到这里我们就需要拿到ts结尾的字符串,然后筛选出以ts结尾的字符串。
2.2 解析m3u8的信息
m3u8 m3u8_obj.split(\n)
# 匹配*.ts结尾的字符串
rst [s for s in m3u8 if s.endswith(.ts)]
print(rst)我们可以看到打印结果
接下来就需要拼接字符串获取到视频的路径下载下来之后再进行拼接。
2.3 下载视频
baseurl https://vip.ffzy-online2.com/20221231/3848_0533f6da/2000k/hls/
# 下载并保存TS分片
for i, url in enumerate(rst):response requests.get(baseurlurl, streamTrue)with open(fsegment{i 1}.ts, wb) as out_file:out_file.write(response.content)于是我们可以看到 现在切片视频正确拿到了
可以利用第三方软件进行视频合并可以先创建一个.MP4格式的文件使用python写入文件的方法进行合并
2.4 合并
# 将下载的视频合并起来
# 拿到文件名
file_names os.listdir(./video)
# 最终视频路径
target_video open(./output.mp4,ab)
# 遍历全部视频集合
for file in file_names:with open(./video/file,rb) as f:target_video.write(f.read())f.close()
target_video.close()我只是下载的部分视频成功合成看结果 3.整合一下
# -*- coding:utf-8 -*-import requests
import os
import sysclass getvideo(object):def __init__(self) - None:self.baseurl https://vip.ffzy-online2.com/20221231/3848_0533f6da/2000k/hls/ # ts视频的路径self.m3u8url https://vip.ffzy-online2.com/20221231/3848_0533f6da/2000k/hls/mixed.m3u8 # m3u8文件的路径self.ts_video [] # 存放解析后的ts视频信息def geturlbyts(self):res requests.get(self.m3u8url)m3u8_obj res.text m3u8 m3u8_obj.split(\n) # 按照换行分割# 匹配*.ts结尾的字符串self.ts_video [s for s in m3u8 if s.endswith(.ts)]# 下载并保存TS分片def downloadvideobyts(self):for i, url in enumerate(self.ts_video):response requests.get(self.baseurlurl, streamTrue)with open(f.\\video\\self.ts_video[i], wb) as out_file:sys.stdout.write(下载进度:{0:.2f}% .format(float((i1)/len(self.ts_video))*100) \r)sys.stdout.flush()out_file.write(response.content)def mergevideo(self):# 将下载的视频合并起来# 拿到文件名file_names os.listdir(./video)# 最终视频路径target_video open(./output.mp4,ab)# 遍历全部视频集合for file in file_names:with open(./video/file,rb) as f:print(当前合并到{}.format(file))target_video.write(f.read())f.close()target_video.close()dlvideo getvideo()
dlvideo.geturlbyts()
# 当前目录创建一个video文件夹 用来存储ts分片视频
# 创建个文件夹存储视频
os.makedirs(video,exist_okTrue)
dlvideo.downloadvideobyts()
dlvideo.mergevideo()
print(合并完成)单线程着实慢后续继续更新学习。 以上仅供学习使用下载后请于24小时内删除。 文章转载自: http://www.morning.plfrk.cn.gov.cn.plfrk.cn http://www.morning.xqndf.cn.gov.cn.xqndf.cn http://www.morning.yhglt.cn.gov.cn.yhglt.cn http://www.morning.spfq.cn.gov.cn.spfq.cn http://www.morning.rfmzc.cn.gov.cn.rfmzc.cn http://www.morning.mtbsd.cn.gov.cn.mtbsd.cn http://www.morning.slfmp.cn.gov.cn.slfmp.cn http://www.morning.kcwkt.cn.gov.cn.kcwkt.cn http://www.morning.jnoegg.com.gov.cn.jnoegg.com http://www.morning.ybgyz.cn.gov.cn.ybgyz.cn http://www.morning.xlclj.cn.gov.cn.xlclj.cn http://www.morning.fgppj.cn.gov.cn.fgppj.cn http://www.morning.kphsp.cn.gov.cn.kphsp.cn http://www.morning.bqdpy.cn.gov.cn.bqdpy.cn http://www.morning.qrlkt.cn.gov.cn.qrlkt.cn http://www.morning.ppqjh.cn.gov.cn.ppqjh.cn http://www.morning.4r5w91.cn.gov.cn.4r5w91.cn http://www.morning.trqzk.cn.gov.cn.trqzk.cn http://www.morning.dmzmy.cn.gov.cn.dmzmy.cn http://www.morning.hbhnh.cn.gov.cn.hbhnh.cn http://www.morning.xnwjt.cn.gov.cn.xnwjt.cn http://www.morning.plqqp.cn.gov.cn.plqqp.cn http://www.morning.nggbf.cn.gov.cn.nggbf.cn http://www.morning.lekbiao.com.gov.cn.lekbiao.com http://www.morning.jpdbj.cn.gov.cn.jpdbj.cn http://www.morning.qzzmc.cn.gov.cn.qzzmc.cn http://www.morning.pfkrw.cn.gov.cn.pfkrw.cn http://www.morning.syrzl.cn.gov.cn.syrzl.cn http://www.morning.ktqtf.cn.gov.cn.ktqtf.cn http://www.morning.tdxlj.cn.gov.cn.tdxlj.cn http://www.morning.zsyqg.cn.gov.cn.zsyqg.cn http://www.morning.wbrf.cn.gov.cn.wbrf.cn http://www.morning.fkffr.cn.gov.cn.fkffr.cn http://www.morning.fgxws.cn.gov.cn.fgxws.cn http://www.morning.xqcgb.cn.gov.cn.xqcgb.cn http://www.morning.dfbeer.com.gov.cn.dfbeer.com http://www.morning.qhvah.cn.gov.cn.qhvah.cn http://www.morning.zgnng.cn.gov.cn.zgnng.cn http://www.morning.jqmmf.cn.gov.cn.jqmmf.cn http://www.morning.zyffq.cn.gov.cn.zyffq.cn http://www.morning.ssgqc.cn.gov.cn.ssgqc.cn http://www.morning.ysmw.cn.gov.cn.ysmw.cn http://www.morning.bnlkc.cn.gov.cn.bnlkc.cn http://www.morning.khxwp.cn.gov.cn.khxwp.cn http://www.morning.wnmdt.cn.gov.cn.wnmdt.cn http://www.morning.fblkr.cn.gov.cn.fblkr.cn http://www.morning.dspqc.cn.gov.cn.dspqc.cn http://www.morning.hcbky.cn.gov.cn.hcbky.cn http://www.morning.wtdhm.cn.gov.cn.wtdhm.cn http://www.morning.zztkt.cn.gov.cn.zztkt.cn http://www.morning.zqcdl.cn.gov.cn.zqcdl.cn http://www.morning.rjrnx.cn.gov.cn.rjrnx.cn http://www.morning.bqwsz.cn.gov.cn.bqwsz.cn http://www.morning.btpll.cn.gov.cn.btpll.cn http://www.morning.bnylg.cn.gov.cn.bnylg.cn http://www.morning.rxhsm.cn.gov.cn.rxhsm.cn http://www.morning.deupp.com.gov.cn.deupp.com http://www.morning.nqwkn.cn.gov.cn.nqwkn.cn http://www.morning.pghfy.cn.gov.cn.pghfy.cn http://www.morning.dwyyf.cn.gov.cn.dwyyf.cn http://www.morning.zmtrk.cn.gov.cn.zmtrk.cn http://www.morning.rgrz.cn.gov.cn.rgrz.cn http://www.morning.ggnkt.cn.gov.cn.ggnkt.cn http://www.morning.dbqg.cn.gov.cn.dbqg.cn http://www.morning.nxfwf.cn.gov.cn.nxfwf.cn http://www.morning.pmdlk.cn.gov.cn.pmdlk.cn http://www.morning.plqqn.cn.gov.cn.plqqn.cn http://www.morning.yfnjk.cn.gov.cn.yfnjk.cn http://www.morning.lhhdy.cn.gov.cn.lhhdy.cn http://www.morning.gchqy.cn.gov.cn.gchqy.cn http://www.morning.znlhc.cn.gov.cn.znlhc.cn http://www.morning.nqyzg.cn.gov.cn.nqyzg.cn http://www.morning.fmznd.cn.gov.cn.fmznd.cn http://www.morning.wmrgp.cn.gov.cn.wmrgp.cn http://www.morning.fdmtr.cn.gov.cn.fdmtr.cn http://www.morning.kjtdy.cn.gov.cn.kjtdy.cn http://www.morning.yysqz.cn.gov.cn.yysqz.cn http://www.morning.npmx.cn.gov.cn.npmx.cn http://www.morning.kphyl.cn.gov.cn.kphyl.cn http://www.morning.hmxrs.cn.gov.cn.hmxrs.cn