软件包简介
HTTrack,用于将web站点复制到本地,离线浏览器工具。
HTTrack是一个离线浏览器实用工具,可将Web站点下载到本地目录,并递归构建所有目录,从服务器获取html、图像、其他文件到计算机中。
HTTrack按原始站点的相对链接结构进行组织。只需在浏览器中打开“镜像”中的一个网页,就可以从链接到链接浏览网站,就像在线查看一样。HTTrack还可以更新现有的镜像站点,恢复中断的下载。
HTTrack是完全可配置的,并具有集成的帮助系统。
安装HTTrack
从发行版的源中安装
#!/bin/bash # Kali GNU/Linux Rolling apt-get install httrack
使用源码编译安装
参考源码目录下的INSTALL文件。
安装的可执行程序
httrack
主程序文件,复制站点到本地。
常用命令
httrack www.someweb.com/bob/ 复制www.someweb.com/bob/,而且只复制该站点。 httrack www.someweb.com/bob/ www.anothertest.com/mike/ +*.com/*.jpg -mime:application/* 将两个站点(使用共享链接)一起镜像,并保存所有出现在.com的站点上的.jpg文件。 httrack www.someweb.com/bob/bobby.html +* -r6 从bobby.html开始,获取所有的文件,连接深度为6,有可能到达网站的所有地方。 httrack www.someweb.com/bob/bobby.html --spider -P proxy.myhost.com:8080 在指定的站点上运行Spider,并使用代理。 httrack --update 更新当前目录中的镜像。 httrack 进入交互模式,然后填写相关的参数。 httrack --continue 在当前目录中,继续对网址进行镜像复制。
参考文献
- Homepage: http://www.httrack.com
- Github Repo: https://github.com/xroche/httrack
- ChangeLog: https://github.com/xroche/httrack/blob/master/history.txt
- FORUM: https://forum.httrack.com/
- Documentation: http://www.httrack.com/html/index.html