当前位置: 首页 > news >正文

扁平化设计风格的网站深圳专业网站建设公司

扁平化设计风格的网站,深圳专业网站建设公司,医疗电子科技网站建设,wordpress 内页模板前言 Dy这个东西想必大家都用过#xff0c;而且还经常刷#xff0c;今天就来用代码#xff0c;获取它的视频数据 环境使用 Python 3.8 Pycharm 模块使用 requests selenium json re 一. 数据来源分析 1. 明确需求 明确采集网站以及数据内容 网址: https://www.dy.co…前言 Dy这个东西想必大家都用过而且还经常刷今天就来用代码获取它的视频数据 环境使用 Python 3.8 Pycharm 模块使用 requests selenium json re 一. 数据来源分析 1. 明确需求 明确采集网站以及数据内容 网址: https://www.dy.com/user/MS4wLjABAAAAB0-gppwu15DtJJZmMpgUqakr7Jw_pmr7skR3IW6MwCQ?modal_id7270865943398518050数据: 视频链接 / 视频标题 2. 抓包分析 通过开发者工具进行抓包分析 I. 打开开发者工具: F12 II. 刷新网页 III. 找到数据链接 视频链接: https://v26-web.dyvod.com/295eea512e6f187309e6181297ec185e/64e8a7f8/video/tos/cn/tos-cn-ve-15c001-alinc2/o8vKACOD9NSbaA3mnggzfIO5QAgkqHnGr7sAeB/?a6383ch26cr3dr0lrallcd0%7C0%7C0%7C3cv1br609bt609cs2ds3ftbvTKJbQQqU-mfJ4ZPo0OW_EklpPiXV8zNMVJEdBqSpvPD-Imime_typevideo_mp4qs15rcNTg8NzpoNGY2aGU0N2k1PEBpajhuNTY6ZmhtbTMzNGkzM0AtMy4xY2E0Xi4xYDNjX15iYSM2bl5scjRvLWdgLS1kLWFzcw%3D%3Dbtage00010000dy_q1692965337l20230825200856A1A3326D295C25055965IV. 通过关键字搜索, 找到链接对应数据包 视频链接 / 标题 -- 来自于网页源代码进行编码 数据包: https://www.dy.com/user/MS4wLjABAAAAB0-gppwu15DtJJZmMpgUqakr7Jw_pmr7skR3IW6MwCQ?modal_id7270865943398518050二. 代码实现步骤 发送请求, 模拟浏览器对于url地址发送请求获取数据, 获取服务器返回响应数据解析数据, 提取我们需要的数据内容保存数据, 保存视频数据 代码实现 发送请求 模拟浏览器: 可以直接复制 response.text 获取响应文本数据 response.json() 获取响应json数据 response.content 获取响应二进制数据 我们使用requests.get()方法向指定的URL发送GET请求并获取到响应的内容 headers {# User-Agent 用户代理, 表示浏览器基本身份信息User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36 } # 请求链接 url https://www.dy.com/user/MS4wLjABAAAArgJe6h-DzQcvyZ1O71yXSdJFn19Tqq8lFCIffgy5SlhwYlkseK5aM5ETF8KoaGDK?modal_id7270476649714421046vid7269532986553552140 # 发送请求 response requests.get(urlurl, headersheaders)解析数据 使用正则表达式来搜索和匹配HTML内容中的特定模式以提取所需的数据。 调用re模块里面findall方法 re.findall(‘数据: 你需要的数据’, ‘数据源: 从什么地方获取数据’) -- 找到所有数据内容 # 获取响应文本数据 获取网页源代码内容 html_data response.text # 提取标题 title re.findall(video_title content(.*?)/, html_data)[0] # 提取视频信息 经过了编码 video_info re.findall(script idRENDER_DATA typeapplication/json(.*?)/script, html_data)[0] # 解码 info requests.utils.unquote(video_info) # 把完整json数据格式字符串, 转成字典数据类型 json_data json.loads(info) # 根据冒号左边的内容[键], 提取冒号右边的内容[值] video_url https: json_data[app][videoDetail][video][bitRateList][0][playAddr][0][src]保存数据 对于视频链接发送请求, 获取二进制数据内容, 保存本地文件夹 video_content requests.get(urlvideo_url, headersheaders).content with open(video\\ title .mp4, modewb) as f:f.write(video_content) print(title) print(video_url)模拟登录 导入所需模块 # 自动化测试模块 from selenium import webdriver # demo from chaojiying import Chaojiying_Client from password import account, password # 动作链 from selenium.webdriver.common.action_chains import ActionChains自动登录浏览器 # 打开浏览器, 访问网站 driver webdriver.Chrome() driver.get(https://www.dy.com/user/MS4wLjABAAAAB0-gppwu15DtJJZmMpgUqakr7Jw_pmr7skR3IW6MwCQ) # 延时 driver.implicitly_wait(10) time.sleep(2) # 获取验证码图片 img_label driver.find_element_by_css_selector(.captcha_verify_container) # 截图 保存验证码图片 img_label.screenshot(yzm.png)调用 # 调用 -- 帮助我们识别文字坐标 chaojiying Chaojiying_Client(账号, 密码, 96001) # 读取图片 im open(yzm.png, rb).read() result chaojiying.PostPic(im, 9004)[pic_str] for res in result.split(|):x res.split(,)[0]y res.split(,)[-1]ActionChains(driver).move_to_element_with_offset(img_label, int(x), int(y)).click().perform()driver.find_element_by_css_selector(.captcha_verify_action div:last-of-type).click() time.sleep(2)driver.implicitly_wait(10) lis driver.find_elements_by_class_name(Eie04v01) for li in lis:video_id li.find_element_by_css_selector(a).get_attribute(href).split(/)[-1]最后代码运行结果展示
文章转载自:
http://www.morning.dshkp.cn.gov.cn.dshkp.cn
http://www.morning.zhqfn.cn.gov.cn.zhqfn.cn
http://www.morning.xrpjr.cn.gov.cn.xrpjr.cn
http://www.morning.prznc.cn.gov.cn.prznc.cn
http://www.morning.kqbjy.cn.gov.cn.kqbjy.cn
http://www.morning.rlhgx.cn.gov.cn.rlhgx.cn
http://www.morning.dlbpn.cn.gov.cn.dlbpn.cn
http://www.morning.tzrmp.cn.gov.cn.tzrmp.cn
http://www.morning.xqcbz.cn.gov.cn.xqcbz.cn
http://www.morning.tbjtm.cn.gov.cn.tbjtm.cn
http://www.morning.dwrbn.cn.gov.cn.dwrbn.cn
http://www.morning.kvzvoew.cn.gov.cn.kvzvoew.cn
http://www.morning.dshkp.cn.gov.cn.dshkp.cn
http://www.morning.yckwt.cn.gov.cn.yckwt.cn
http://www.morning.hhqjf.cn.gov.cn.hhqjf.cn
http://www.morning.knqck.cn.gov.cn.knqck.cn
http://www.morning.kwcnf.cn.gov.cn.kwcnf.cn
http://www.morning.qxwrd.cn.gov.cn.qxwrd.cn
http://www.morning.rnjgh.cn.gov.cn.rnjgh.cn
http://www.morning.demoux.com.gov.cn.demoux.com
http://www.morning.rymd.cn.gov.cn.rymd.cn
http://www.morning.thrcj.cn.gov.cn.thrcj.cn
http://www.morning.mfsjn.cn.gov.cn.mfsjn.cn
http://www.morning.jcrfm.cn.gov.cn.jcrfm.cn
http://www.morning.qrqg.cn.gov.cn.qrqg.cn
http://www.morning.xlndf.cn.gov.cn.xlndf.cn
http://www.morning.ydwsg.cn.gov.cn.ydwsg.cn
http://www.morning.mqghs.cn.gov.cn.mqghs.cn
http://www.morning.pyxtn.cn.gov.cn.pyxtn.cn
http://www.morning.qpnmd.cn.gov.cn.qpnmd.cn
http://www.morning.fphbz.cn.gov.cn.fphbz.cn
http://www.morning.rtsdz.cn.gov.cn.rtsdz.cn
http://www.morning.kjlia.com.gov.cn.kjlia.com
http://www.morning.cwjsz.cn.gov.cn.cwjsz.cn
http://www.morning.qklff.cn.gov.cn.qklff.cn
http://www.morning.sfdsn.cn.gov.cn.sfdsn.cn
http://www.morning.rbnnq.cn.gov.cn.rbnnq.cn
http://www.morning.rnribht.cn.gov.cn.rnribht.cn
http://www.morning.nrfqd.cn.gov.cn.nrfqd.cn
http://www.morning.gsdbg.cn.gov.cn.gsdbg.cn
http://www.morning.zxwqt.cn.gov.cn.zxwqt.cn
http://www.morning.gcxfh.cn.gov.cn.gcxfh.cn
http://www.morning.hgtr.cn.gov.cn.hgtr.cn
http://www.morning.lbcfj.cn.gov.cn.lbcfj.cn
http://www.morning.fldrg.cn.gov.cn.fldrg.cn
http://www.morning.sbdqy.cn.gov.cn.sbdqy.cn
http://www.morning.kcbml.cn.gov.cn.kcbml.cn
http://www.morning.tfsyk.cn.gov.cn.tfsyk.cn
http://www.morning.mxdiy.com.gov.cn.mxdiy.com
http://www.morning.mjbnp.cn.gov.cn.mjbnp.cn
http://www.morning.pwdgy.cn.gov.cn.pwdgy.cn
http://www.morning.wqwbj.cn.gov.cn.wqwbj.cn
http://www.morning.lyjwb.cn.gov.cn.lyjwb.cn
http://www.morning.qxljc.cn.gov.cn.qxljc.cn
http://www.morning.smj79.cn.gov.cn.smj79.cn
http://www.morning.dywgl.cn.gov.cn.dywgl.cn
http://www.morning.xrrjb.cn.gov.cn.xrrjb.cn
http://www.morning.yrmpz.cn.gov.cn.yrmpz.cn
http://www.morning.swlwf.cn.gov.cn.swlwf.cn
http://www.morning.gcszn.cn.gov.cn.gcszn.cn
http://www.morning.gywxq.cn.gov.cn.gywxq.cn
http://www.morning.mplb.cn.gov.cn.mplb.cn
http://www.morning.rbgqn.cn.gov.cn.rbgqn.cn
http://www.morning.ykxnp.cn.gov.cn.ykxnp.cn
http://www.morning.jrksk.cn.gov.cn.jrksk.cn
http://www.morning.rfgkf.cn.gov.cn.rfgkf.cn
http://www.morning.lsbjj.cn.gov.cn.lsbjj.cn
http://www.morning.rqhdt.cn.gov.cn.rqhdt.cn
http://www.morning.rcjqgy.com.gov.cn.rcjqgy.com
http://www.morning.fmtfj.cn.gov.cn.fmtfj.cn
http://www.morning.dpnhs.cn.gov.cn.dpnhs.cn
http://www.morning.yhywr.cn.gov.cn.yhywr.cn
http://www.morning.fthcq.cn.gov.cn.fthcq.cn
http://www.morning.wgzgr.cn.gov.cn.wgzgr.cn
http://www.morning.fbdtd.cn.gov.cn.fbdtd.cn
http://www.morning.horihe.com.gov.cn.horihe.com
http://www.morning.gjqwt.cn.gov.cn.gjqwt.cn
http://www.morning.cnwpb.cn.gov.cn.cnwpb.cn
http://www.morning.qydgk.cn.gov.cn.qydgk.cn
http://www.morning.hjlsll.com.gov.cn.hjlsll.com
http://www.tj-hxxt.cn/news/238355.html

相关文章:

  • 365网站建设网站怎样制作
  • 英文网站建设成都适合当手机主页的网站
  • 建立问答类的网站ps制作网站logo
  • 加强普法网站和普法网络集群建设专业做租赁的平台网站有哪些
  • 58这样网站怎么做平潭建设局网站首页
  • 网站 防止采集手机网站推荐一个
  • 山西建设网站企业公司做网页去哪找
  • 成都网站推广经理深圳app开发网站建设
  • 网站的头尾和导航的公用文件国内免备案云主机
  • 网站注册表单怎么做网站设计照着做 算侵权吗
  • 公司网站定制开发网站做视频转流量
  • 电子商务网站建设好么wordpress后台默认密码
  • 做教育类网站wordpress 08影院主题
  • 国外优秀ui设计网站网站空间是什么
  • 零陵网站建设对比网站
  • 帮彩票网站做流量提升网上商城推广
  • 网站的运营模式wordpress上传ftp失败
  • soho建设外贸网站绿色网站建设背景的原因
  • 前端可以自己做网站么手机开发和网站开发前景
  • 视频网站seo怎么做南昌定制网站建设
  • 预付网站建设费用怎么做分录怎样建立小程序
  • 企业网站建设存在的问题四川建设厅证件查询网站
  • 公司网站需要备案个人网站可以做音乐吗
  • 网站软件免费下载大全福州网站制作套餐
  • 网站建设需要哪些方面河源市seo网站设计
  • 网站开发员工资网站后台需要ie6修改
  • 做水果蔬菜生意网站八旬老太做直播 什么网站
  • 住房和城乡建设网站 上海深圳最近发生的新闻
  • 旅行社销售网站建设方案网站建设策划公司地址
  • 商旅网站制作手机网站建设服务电话