首页 > 其他分享 >wget命令解析

wget命令解析

时间:2023-04-25 22:15:02浏览次数:34  
标签:文件 -- 命令 url FILE wget 解析 下载

wget命令是Linux系统用于从Web下载文件的命令行工具,支持 HTTP、HTTPS及FTP协议下载文件,
而且wget还提供了很多选项,例如下载多个文件、后台下载,使用代理等等,使用非常方便。
接下来就介绍一下wget的使用方法。

wget命令的使用
语法格式
wget [options] [url]
#示例,默认下载目录当前目录下
wget https://down.sandai.net/thunder11/XunLeiWebSetup11.3.10.1912gw.exe
 
# wget 命令 参数:
-o 选项将下载信息存入日志文件
wget -o download.log url
 
-O 选项以其他名称保存下载的文件
wget -O /home/ym/demo.tar url
 
-P 选项将文件下载到指定目录
wget -P /home/ym url
 
-c 选项断点续传,文件较大,网络断开未下载完成时,-c选项可以恢复下载,无需从头下载
wget -c url
 
-b 选项在后台下载文件
wget -b url  #默认下载日志重定向到当前目录下wget-log文件中,使用`tail -f wget-log`查看
 
-i 选项下载多个文件
#创建一个文本文件download_list.txt,将所有url添加到该文件,每个url必须单独一行
wget -i download_list.txt
 
--limit-rate 选项限制下载速度,默认wget命令会以全速下载,但有时下载一个非常大的资源,可能会占用大量的可用带宽,影响其他使用网络的任务,这时就要限制下载速度
wget --limit-rate=1m url  #下载速度限制为1m/s
 
-Q 选项限制总下载文件大小
wget -Q5m -i filelist.txt #下载的文件超过5M而退出下载,你可以使用。注意:这个参数对单个文件下载不起作用,只能递归下载时才有效。
 
--tries 选项增加重试次数,如果网络有问题或下载一个大文件有可能会下载失败,wget默认重试20次,我们可以使用-tries选项来增加重试次数。
wget --tries=30 url
 
通过FTP下载如果要从受密码保护的FTP服务器下载文件,需要指定用户名和密码,格式如下:
wget ftp-url #匿名ftp下载
wget --ftp-user=USERNAME --ftp-password=PASSWORD url #使用wget用户名和密码认证的ftp下载

wget命令参数

-V,  --version           显示wget的版本后退出
  -h,  --help              打印语法帮助
  -b,  --background        启动后转入后台执行
  -e,  --execute=COMMAND   执行`.wgetrc'格式的命令,wgetrc格式参见/etc/wgetrc或~/.wgetrc
* 记录和输入文件 
  -o,  --output-file=FILE     把记录写到FILE文件中
  -a,  --append-output=FILE   把记录追加到FILE文件中
  -d,  --debug                打印调试输出
  -q,  --quiet                安静模式(没有输出)
  -v,  --verbose              冗长模式(这是缺省设置)
  -nv, --non-verbose          关掉冗长模式,但不是安静模式
  -i,  --input-file=FILE      下载在FILE文件中出现的URLs
  -F,  --force-html           把输入文件当作HTML格式文件对待
  -B,  --base=URL             将URL作为在-F -i参数指定的文件中出现的相对链接的前缀
       --sslcertfile=FILE     可选客户端证书
       --sslcertkey=KEYFILE   可选客户端证书的KEYFILE
       --egd-file=FILE        指定EGD socket的文件名
* 下载 
       --bind-address=ADDRESS   指定本地使用地址(主机名或IP,当本地有多个IP或名字时使用)
  -t,  --tries=NUMBER           设定最大尝试链接次数(0 表示无限制).
  -O   --output-document=FILE   把文档写到FILE文件中
  -nc, --no-clobber             不要覆盖存在的文件或使用.#前缀
  -c,  --continue               接着下载没下载完的文件
       --progress=TYPE          设定进程条标记
  -N,  --timestamping           不要重新下载文件除非比本地文件新
  -S,  --server-response        打印服务器的回应
       --spider                 不下载任何东西
  -T,  --timeout=SECONDS        设定响应超时的秒数
  -w,  --wait=SECONDS           两次尝试之间间隔SECONDS秒
       --waitretry=SECONDS      在重新链接之间等待1...SECONDS秒
       --random-wait            在下载之间等待0...2*WAIT秒
  -Y,  --proxy=on/off           打开或关闭代理
  -Q,  --quota=NUMBER           设置下载的容量限制
       --limit-rate=RATE        限定下载输率
* 目录 
  -nd  --no-directories            不创建目录
  -x,  --force-directories         强制创建目录
  -nH, --no-host-directories       不创建主机目录
  -P,  --directory-prefix=PREFIX   将文件保存到目录 PREFIX/...
       --cut-dirs=NUMBER           忽略 NUMBER层远程目录
* HTTP 选项 
       --http-user=USER      设定HTTP用户名为 USER.
       --http-passwd=PASS    设定http密码为 PASS.
  -C,  --cache=on/off        允许/不允许服务器端的数据缓存 (一般情况下允许).
  -E,  --html-extension      将所有text/html文档以.html扩展名保存
       --ignore-length       忽略 `Content-Length'头域
       --header=STRING       在headers中插入字符串 STRING
       --proxy-user=USER     设定代理的用户名为 USER
       --proxy-passwd=PASS   设定代理的密码为 PASS
       --referer=URL         在HTTP请求中包含 `Referer: URL'头
  -s,  --save-headers        保存HTTP头到文件
  -U,  --user-agent=AGENT    设定代理的名称为 AGENT而不是 Wget/VERSION.
       --no-http-keep-alive  关闭 HTTP活动链接 (永远链接).
       --cookies=off         不使用 cookies.
       --load-cookies=FILE   在开始会话前从文件 FILE中加载cookie
       --save-cookies=FILE   在会话结束后将 cookies保存到 FILE文件中
* FTP 选项 
  -nr, --dont-remove-listing   不移走 `.listing'文件
  -g,  --glob=on/off           打开或关闭文件名的 globbing机制
       --passive-ftp           使用被动传输模式 (缺省值).
       --active-ftp            使用主动传输模式
       --retr-symlinks         在递归的时候,将链接指向文件(而不是目录)
* 递归下载 
  -r,  --recursive          递归下载--慎用!
  -l,  --level=NUMBER       最大递归深度 (inf 或 0 代表无穷).
       --delete-after       在现在完毕后局部删除文件
  -k,  --convert-links      转换非相对链接为相对链接
  -K,  --backup-converted   在转换文件X之前,将之备份为 X.orig
  -m,  --mirror             等价于 -r -N -l inf -nr.
  -p,  --page-requisites    下载显示HTML文件的所有图片
* 递归下载中的包含和不包含(accept/reject) 
  -A,  --accept=LIST                分号分隔的被接受扩展名的列表
  -R,  --reject=LIST                分号分隔的不被接受的扩展名的列表
  -D,  --domains=LIST               分号分隔的被接受域的列表
       --exclude-domains=LIST       分号分隔的不被接受的域的列表
       --follow-ftp                 跟踪HTML文档中的FTP链接
       --follow-tags=LIST           分号分隔的被跟踪的HTML标签的列表
  -G,  --ignore-tags=LIST           分号分隔的被忽略的HTML标签的列表
  -H,  --span-hosts                 当递归时转到外部主机
  -L,  --relative                   仅仅跟踪相对链接
  -I,  --include-directories=LIST   允许目录的列表
  -X,  --exclude-directories=LIST   不被包含目录的列表
  -np, --no-parent                  不要追溯到父目录

 

标签:文件,--,命令,url,FILE,wget,解析,下载
From: https://www.cnblogs.com/chentiao/p/17354089.html

相关文章

  • CentOS7修改开机启动模式:命令行模式(runlevel=3)
    1.打开文件/etc/inittab: sudo/etc/inittab显示当前的runlevel:systemctlget-default设置默认的运行级别:systemcltset-defaultXX.target。XX可以是multi-user或者graphical按照提示在终端中执行命令:systemctlset-defaultmulti-user.target注意:按照inittab文件中的提......
  • 快速上手Linux核心命令(五):文本处理三剑客
    @目录前言正则表达式第一剑客grep第二剑客sed第三剑客awk小结剑仙镇楼~O(∩_∩)O前言上一篇中已经预告,我们这篇主要说Linux文本处理三剑客。他们分别是grep、sed、awk。既然能被业界称为三剑客,可见其在Linux命令中占有举足轻重得地位。所以呢,这里也专门写一篇文章说一说......
  • 命令行上的数据科学第二版:十、多语言数据科学
    通晓多种语言的人就是能讲多种语言的人。在我看来,通晓多种语言的数据科学家是指使用多种编程语言、工具和技术来获取、清理、探索和建模数据的人。命令行刺激了多语言方法。命令行并不关心工具是用哪种编程语言编写的,只要它们遵循Unix的理念。我们在第四章中非常清楚地看到了这一......
  • linux下查询命令的技巧
    1、whichwhich命令是在PATH变量指定的路径中,搜索某个系统命令的位置,并返回第一个搜索结果。也就是说,使用which命令,就可以看到系统命令是否存在,以及执行的到底是哪一个位置的命令。命令格式:which可执行文件名称which指令会在PATH变量指定的路径中,搜索某个系统命令的位置,并返回......
  • 资源解析器!支持喜马拉雅VIP和付费音频解析
    购买了喜马拉雅VIP会员,结果发现收听的资源不支持下载到本地,这就导致自己想用其他设备进行收听VIP音频就受到很大的限制。 比如我女儿使用的毛毛虫点读笔,如果我想让她用毛毛虫点读笔播放喜马拉雅上的资源,就成了一个难题。 如果想解决音频下载的问题,就得借助下面这个音频解析......
  • 为Helm生成针对于bash shell的自动补全脚本,helm命令补全
    在当前shell会话中加载自动补全:source<(helmcompletionbash)为每个新的会话加载自动补全,执行一次:helmcompletionbash>/etc/bash_completion.d/helm ......
  • Django之路由层 (有名和无名分组 反向解析 路由分发 名称空间)
    目录一、路由匹配django2.X及以上path第一个参数写什么就匹配什么django1.X第一个参数是正则表达式PS:无论什么版本django都自带加斜杠后缀的功能也可以取消,这里如果在浏览器地址栏没有写完整的/index/,而是/index,这里还是可以找到的,因为Django会帮你二次查找,浏览器会有303......
  • Turndown 源码解析:二、规则
    规则集包含一系列规则,决定各种标签如何反编译。单个规则的格式是:{ filter:String|String[]|function(node), replacement:function(node,content,options),}filter字段用于判断节点是否适用单条规则。如果它是字符串,则判断node.nodeName===filter;如果它是字符串数......
  • centos7下安装ifconfig 命令
    1,查找安装包 [root@localhostnetwork-scripts]#yumsearchifconfig已加载插件:fastestmirrorLoadingmirrorspeedsfromcachedhostfile*base:centos.ustc.edu.cn*extras:centos.ustc.edu.cn*updates:centos.ustc.edu.cn===================================......
  • Apache POI库解析Excel文件
    以下是使用ApachePOI库解析Excel文件的示例代码:1、添加POI依赖在pom.xml文件中添加以下依赖:org.apache.poipoi5.1.0org.apache.poipoi-ooxml5.1.02、创建解析器java@ComponentpublicclassExcelParser{publicList<User>parse(InputStreaminputStream,Stri......