bytengine是一个分布式的内容存储系统,基于redis、mongodb、Go、python。 Bytengine 将内容存储在一个伪分层的文件系统中,使用内置的类似SQL的方式做查询。服务...<
运行在Hadoop集群上的Storm——即Storm-YARN的源代码。<
DPark 是 Spark 的 Python 克隆,是一个Python实现的分布式计算框架,可以非常方便地实现大规模数据处理和迭代计算。 DPark 由豆瓣实现,目前豆瓣内部的绝大多数数据分析都...<
宙斯(zeus)是什么 宙斯是一个完整的Hadoop的作业平台 从Hadoop任务的调试运行到生产任务的周期调度 宙斯支持任务的整个生命周期 从功能上来说,支持: Hadoop MapReduc...<
Apache Knox 网关是一个应用程序网关,用于与Apache Hadoop部署的REST API和UI进行交互。 Knox网关为与Apache Hadoop集群的所有REST和HTTP交互...<
因为有了 Savanna ,两个最大的开源项目 Hadoop 和 OpenStack 可以在一起工作。这是红帽、Hortonworks 和 Mirantis 新开发的 OpenStack 组件。...<
Lealone 为 HBase 提供一个分布式SQL引擎,尝试将BigTable(HBase)和 RDBMS (H2数据库) 结合的项目。 Lealone 发音 [li:ləʊn] 这是我新造...<
Scalding 是一个 Scala 库简化了 Hadoop MapReduce 作业开发。基于 Cascading 构建。Scalding 跟 Pig 类似,但提供更紧密的 Scala 集成。...<
Phoniex 可以让开发者在HBase数据集上使用SQL查询。Phoenix查询引擎会将SQL查询转换为一个或多个HBase scan,并编排执行以生成标准的JDBC结果集,对于简单查询来说,...<
RHadoop 是由 Revolution Analytics 发起的一个开源项目,它可以将统计语言 R 与 Hadoop 结合起来。目前该项目包括三个R packages,分别为支持用R来编写...<