HtmlSucker HTML 正文提取工具

授权协议:WTFPL操作系统:跨平台 开发语言:Java
HtmlSucker 是一个用来从一个网页中提取文章信息的小工具包,例如从网页中提取文章标题、作者、发布时间、 封面图以及文章正文内容。基于 jsoup 库进行 HTML 解析。 HtmlSuc...