使用wget克隆网站

使用方法

我们可以使用man wget命令查看帮助文档。

操作命令及参数解释如下：

wget -m -p -E -k -K -np -v https://www.baidu.com/

# 参数解释
-m	:	镜像，选择该选项适用于Web站点
-p	:	页面获取的先决条件，该选项确保包含了请求的图片和css脚本文件被下载(可以更好复制html5站点)
-E	:	适用于拓展，可以在本地另存一个html文件
-k	:	转换链接，确保文件本转换，适用于本地浏览
-K	:	转换备份文件，将以orig为后缀作为原始文件
-np	:	不要到上一层子目录中
-v	:	显示过程，不显示过程为-nv

克隆结果

# 克隆后在当前目录下会出现一个与网站同名的子目录，树形结构如下
www.baidu.com
├── index.html
├── index.html.orig
└── robots.txt

0 directories, 3 files

使用HTTrack克隆网站

使用方法

httrack

# 进入软件后需要输入项目名
baidu
# 克隆后的存放地址
/home/oopsdc/Desktop
# 要克隆的网站地址
www.baidu.com
# 有6个选项，此处我们选2，具有向导递归层级的镜像网站
2
# 接下来的部分全选默认选项
默认回车

克隆结果

baidu
├── backblue.gif
├── cookies.txt
├── fade.gif
├── hts-cache [error opening dir]
├── hts-log.txt
├── index.html
└── www.baidu.com
    ├── index.html
    ├── s2d49.html
    ├── s2f7f.html
    ├── s412d.html
    ├── s5084.html
    ├── s5e09.html
    ├── s6fa8.html
    └── sa132.html

2 directories, 13 files

文章许可：本文采用CC BY-NC-SA 4.0许可协议，转载请注明出处。

使用wget克隆网站#

使用方法#

克隆结果#

使用HTTrack克隆网站#

使用方法#

克隆结果#

使用wget克隆网站

使用方法

克隆结果

使用HTTrack克隆网站

使用方法

克隆结果