HTML4J 是一个 Java 解析 HTML 的类库。示例代码: Reader re = ... // Create the document HTMLDoc doc ...<
libhtml 是一个微型的 C 程序库,用来解析、序列化和生成 HTML 4.01-strict 和 XHTML 1.0-strict 文档。<
XSS HTMLFilter这是一个采用Java实现的开源类库。用于分析用户提交的输入,消除潜在的跨站点脚本攻击(XSS),恶意的HTML,或简单的HTML格式错误。 示例代码: // retr...<
XIST 是一个可扩展的 HTML 和 XML 生成器,同时包含一个 XML 解析器,使用很简单的 Python 树 API,每个 XML 元素类型都被映射到 Python 的类中。你可以把 X...<
RenderSnake 是一个轻量级的Java类库用来通过Java方法生产html页面,包含4个核心类库: HtmlCanvas , a class that has methods for a...<
简介 Jumony是一套基于.NET Framework 3.5的HTML分析处理引擎,使得可以在C#中方便简单的操纵HTML文档,同时也可以充当Web的页面引擎使用。 目标 Jumony希望在...<
解析HTML和CSS,并且能输出成image,PDF等格式. Flying Saucer is an XML/CSS renderer, which means it takes XML fil...<
Scrender是一个用来生成网页缩略图的Java类库,基于SWT开发。它实质上是调用本地浏览器引擎对要进行截图的网站进行渲染,然后保存该网页的缩略图。 示例代码请看这里。<
Html Agility Pack 是CodePlex 上的一个开源项目。它提供了标准的DOM API 和XPath 导航--即使 HTML 不是适当的格式! 示例代码: HtmlDocume...<
JoyHTML的目的是解析HTML文本当中的链接和正文,利用超链接密度法为主要判断依据的标记窗算法,采用DOM树解析模式。<