Apache Falcon 提供了一个用于治理和编排 Hadoop 内部和周边数据流的数据处理框架。该框架为获取和处理数据集、复制与保留数据集、重新定向位于非Hadoop扩展中的数据集、维护审核...<
JBoss Data Virtualization(JDV)是数据集成解决方案,在有多个数据资源的时候,把他们作为单个数据资源对待,在规定的格式传递正确的数据,在正确的时间传递给任意的应用或者用...<
OpenSOC:安全大数据分析框架。OpenSOC已经加入Apache工程改名为Apache Metron。 思科在 BroCON 大会上亮相了其安全大数据分析架构 OpenSOC,引起了广泛关...<
Wormhole 是大众点评的大数据传输工具,目前支持类似 hdfs, hive, hbase, mysql, greenplum, sqlserver, mongodb, sftp, sale...<
什么是SF1R SF1R是一个分布式的存储搜索一体化海量数据引擎。SF1R来自于iZENECloud团队多年的 研发成果,并且已经在商业网站上经受住了严苛的考验。2014年,iZENECloud...<
TARE全称是Targeted Advertising and Recommender Engine。做为定向广告和推荐一体化引擎,TARE解决的是大规模点击率预估问题。TARE有两个组成部分:...<
BreakoutDetection(Breakout Detection)是 Twitter 的开源的,可以便捷和快速检测 Breakout 的 R 包。 BreakoutDetection 通...<
Luigi 是一个 Python 模块,可以帮你构建复杂的批量作业管道。处理依赖决议、工作流管理、可视化展示等等,内建 Hadoop 支持。<
Apache Kylin 是一个开源的分布式的 OLAP 分析引擎,来自 eBay 公司开发,基于 Hadoop 提供 SQL 接口和 OLAP 接口,支持 TB 到 PB 级别的数据量。 Ap...<
S3mper 是通过一致的,二级索引对亚马逊 S3 索引做额外的一致性检查。 S3mper 利用面向方面编程和 AspectJ 实现来引导 Hadoop 文件系统实现(主要是实现 NativeS...<