「httrack」

  CREATED BY JENKINSBOT

软件包简介

HTTrack,用于将web站点复制到本地,离线浏览器工具。

HTTrack是一个离线浏览器实用工具,可将Web站点下载到本地目录,并递归构建所有目录,从服务器获取html、图像、其他文件到计算机中。

HTTrack按原始站点的相对链接结构进行组织。只需在浏览器中打开“镜像”中的一个网页,就可以从链接到链接浏览网站,就像在线查看一样。HTTrack还可以更新现有的镜像站点,恢复中断的下载。

HTTrack是完全可配置的,并具有集成的帮助系统。

安装HTTrack

从发行版的源中安装

#!/bin/bash

# Kali GNU/Linux Rolling
apt-get install httrack

使用源码编译安装
参考源码目录下的INSTALL文件。

安装的可执行程序

httrack
主程序文件,复制站点到本地。

常用命令

httrack www.someweb.com/bob/
复制www.someweb.com/bob/,而且只复制该站点。

httrack www.someweb.com/bob/ www.anothertest.com/mike/ +*.com/*.jpg -mime:application/*
将两个站点(使用共享链接)一起镜像,并保存所有出现在.com的站点上的.jpg文件。

httrack www.someweb.com/bob/bobby.html +* -r6
从bobby.html开始,获取所有的文件,连接深度为6,有可能到达网站的所有地方。

httrack www.someweb.com/bob/bobby.html --spider -P proxy.myhost.com:8080
在指定的站点上运行Spider,并使用代理。

httrack --update
更新当前目录中的镜像。

httrack
进入交互模式,然后填写相关的参数。

httrack --continue
在当前目录中,继续对网址进行镜像复制。

参考文献