使用wget克隆网站

使用方法

我们可以使用man wget命令查看帮助文档。

操作命令及参数解释如下:

wget -m -p -E -k -K -np -v https://www.baidu.com/

# 参数解释
-m	:	镜像,选择该选项适用于Web站点
-p	:	页面获取的先决条件,该选项确保包含了请求的图片和css脚本文件被下载(可以更好复制html5站点)
-E	:	适用于拓展,可以在本地另存一个html文件
-k	:	转换链接,确保文件本转换,适用于本地浏览
-K	:	转换备份文件,将以orig为后缀作为原始文件
-np	:	不要到上一层子目录中
-v	:	显示过程,不显示过程为-nv

克隆结果

# 克隆后在当前目录下会出现一个与网站同名的子目录,树形结构如下
www.baidu.com
├── index.html
├── index.html.orig
└── robots.txt

0 directories, 3 files

使用HTTrack克隆网站

使用方法

httrack

# 进入软件后需要输入项目名
baidu
# 克隆后的存放地址
/home/oopsdc/Desktop
# 要克隆的网站地址
www.baidu.com
# 有6个选项,此处我们选2,具有向导递归层级的镜像网站
2
# 接下来的部分全选默认选项
默认回车

克隆结果

baidu
├── backblue.gif
├── cookies.txt
├── fade.gif
├── hts-cache [error opening dir]
├── hts-log.txt
├── index.html
└── www.baidu.com
    ├── index.html
    ├── s2d49.html
    ├── s2f7f.html
    ├── s412d.html
    ├── s5084.html
    ├── s5e09.html
    ├── s6fa8.html
    └── sa132.html

2 directories, 13 files

文章许可:本文采用CC BY-NC-SA 4.0许可协议,转载请注明出处。