Common Crawl InputFormat 配送实现

授权协议:未知操作系统:跨平台 开发语言:Java Java
commoncrawl 源码库是用于 Hadoop 的自定义 InputFormat 配送实现。 Common Crawl 提供一个示例程序 BasicArcFileReaderSample.j...