标签 wget 下的文章

wget的所有参数列表

用法: wget [选项]… [URL]… 长选项所必须的参数在使用短选项时也是必须的。 启动: -V, –version 显示 Wget 的版本信息并退出。 -h, –help 打印此帮助。 -b, –background 启动后转入后台。 -e, –execute=COMMAND 运行一个“.wgetrc”风格的命令。 日志和输入文件: -o, –output-file=FILE 将日志信息写入 FILE。 -a, –append-output=FILE 将信息添加至 FILE。 -d, –debug 打印大量调试信息。 -q, & ...

解决wget下载文件名乱码的一些方法

在下载用apache或者nginx做的索引目录时,遇到文件名乱码问题。搜索了不少资料,尝试了好几种方案,大家可以结合使用。 一般情况下加上–restrict-file-names=nocontrol参数就可以用了。 其实除了下面方法一和方法二外,还有一个大家可以自由发挥的,我是没有研究透,编码实在太让自己头疼了。 有一个前提,要注意索引目录显示出来的是什么编码,比如有些网站是UTF-8(这个应该比较正规,中文不会出现很大麻烦,可以用方法二搞定),有些是GBK,可能跟文件的编码,或者apache、nginx的设置有关吧。 1、下载的时候保存成ascii,跟 ...

用wget下载整个网站或索引目录

一直不知道nginx或者apache建立的索引目录是怎么下载的,偶然听到一个朋友说wget可以,在网上一查果真行,哎哎,终于可以满足自己的下载欲望了。记录命令使用情况如下。 $ wget -c -r -nd -np -k -L -p -A c,h www.xxx.com/doc/path/ -c 断点续传 -r 递归下载,下载指定网页某一目录下(包括子目录)的所有文件 -nd 递归下载时不创建一层一层的目录,把所有的文件下载到当前目录 -np 递归下载时不搜索上层目录。 如wget -c -r www.xxx.com/doc/path/ 没有加参数-np,就会同时下载path的上一级目录pub下的其它文件 -k 将绝对链接转为 ...