spider-web 网页版爬虫

授权协议:GPL操作系统:跨平台 开发语言:Java
spider-web 是爬虫的网页版,使用xml配置,支持大部分页面的爬取,支持爬取内容的保存、下载等。 其中配置文件格式为: <?xml version= 1.0 encoding= UTF...