怎么做网站内容调研,设计类的软件有哪些,广州做网站推广的公司,淄博周村学校网站建设公司you-get是一个简单易上手的爬虫小工具#xff0c;可以从网络中爬取多媒体信息#xff0c;包括图片、音频和视频。you-get的github项目地址为#xff1a;https://github.com/soimort/you-get
一、安装
以下为相关依赖#xff0c;需要分别安装#xff1a;
Python 3 (必须…you-get是一个简单易上手的爬虫小工具可以从网络中爬取多媒体信息包括图片、音频和视频。you-get的github项目地址为https://github.com/soimort/you-get
一、安装
以下为相关依赖需要分别安装
Python 3 (必须) FFmpeg(必须) Libav (可选)RTMPDump (可选)
推荐使用PyPI镜像中的pip包管理器安装
pip3 install you-get
二、升级
如果需要升级可使用以下命令
pip3 install --upgrade you-get
三、使用
1.视频画质与格式
直接输入you-get空格网址即可。
网址两端的双引号其实不必要但是强烈推荐这样防止某些网站的字符串中有奇奇怪怪的东西导致you-get误判报错。
$ you-get https://www.youtube.com/watch?vjNQXAC9IVRw
site: YouTube
title: Me at the zoo
stream:- itag: 43container: webmquality: mediumsize: 0.5 MiB (564215 bytes)# download-with: you-get --itag43 [URL]Downloading zoo.webm ...
100.0% ( 0.5/0.5 MB) ├████████████████████████████████████████┤[1/1] 7 MB/sSaving Me at the zoo.en.srt ...Done.
此时下载的视频默认为最高画质DEFAULT。如这个视频带有字幕将被一同下载并以SubRip格式保存。
如需下载其他画质可以使用 --info/-i以查看所有可用画质与格式并使用给出的对应 --itag 代码下载
$ you-get -i https://www.youtube.com/watch?vjNQXAC9IVRw
site: YouTube
title: Me at the zoo
streams: # Available quality and codecs[ DEFAULT ] _________________________________- itag: 43container: webmquality: mediumsize: 0.5 MiB (564215 bytes)# download-with: you-get --itag43 [URL]- itag: 18container: mp4quality: medium# download-with: you-get --itag18 [URL]- itag: 5container: flvquality: small# download-with: you-get --itag5 [URL]- itag: 36container: 3gpquality: small# download-with: you-get --itag36 [URL]- itag: 17container: 3gpquality: small# download-with: you-get --itag17 [URL]
2.下载路径
默认下载路径即you-get的安装文件夹但是很乱且不好找。
可以使用 --output-dir/-o 设定路径, --output-filename/-O 设定输出文件名:
you-get -o D:\桌面\百度图片\视频 https://www.bilibili.com/video/BV1p4411d7/四、常见QA
1.B站的视频下载报错
① 优先更新you-get低版本的you-get有时不适用
② 由于B站更新了链接点击流量统计所以有时会报错。可以把B站的网站链接中所有BV号之后的内容全部删除如
B站默认的链接
https://www.bilibili.com/video/BV1jb411W7c3/?spm_id_from333.337.search-card.all.clickvd_source9a70128ce0e23fdc92b35d3a812c66d5删除分享者ID跟踪后的链接
https://www.bilibili.com/video/BV1jb411W7c3/?spm_id_from333.337.search-card.all.click删除点击统计仅保留原视频BV号的链接
https://www.bilibili.com/video/BV1jb411W7c3/
③ 记得用双引号把网址字符串括起来防止you-get误判
④ 有时候代理导致报错把梯子关了。
2.vd source不是内部或外部命令也不是可运行的程序 或批处理文件。
这个错误可能是由于you-get的安装位置没有添加到环境变量中导致的。
① 首先查找you-get的安装位置
pip show you-get
② 在返回的结果中找到Location即安装位置
Name: you-get
Version: 0.4.1650
Summary: Dumb downloader that scrapes the web
Home-page: https://you-get.org/
Author: Mort Yao
Author-email: mort.yaogmail.com
License: MIT
Location: c:\users\hp\appdata\roaming\python\python310\site-packages
Requires:
Required-by:
③ 将该路径添加到系统的环境变量中
etx PATH%PATH%;c:\users\hp\appdata\roaming\python\python310\site-packages\scripts
注意%PATH%;和\scripts之间的路径即为Location中给出的位置
④ 此时再重新打开终端并运行you-get应该就不会报错了如果还有报错那大概率是被网址中的字符串干扰了例如B站的链接就会有这种情况这时用双引号把网站括起来即可。