Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的 Hadoop 资源管理器,前不久被提升为高层次的Hadoop...<
是发端于卡内基梅隆大学的一个开源项目 —— GraphLab ,主要目标是在单台机器上进行大数据量的图计算<
GraphBuilder由英特尔研究院(Intel Labs)开发,是首个针对大数据的可扩展的开源Java库,可以将大数据集构建成图形——能够反映数据之间关系的网络状结构图,帮助行业和学术界的科...<
Netflix(一家在线影片租赁商)近日开源了其 Hystrix 库,这是一个针对分布式系统的延迟和容错库。 Hystrix 供分布式系统使用,提供延迟和容错功能,隔离远程系统、访问和第三方程序...<
beatles 是一个中小规模即时流数据分析集群。 分析规则抽象于SQL,计算规则采用 MapReduce 模式。<
LinkedIn最近发布了一套源无关的分布式数据同步系统Databus。简单说,就是把交易数据同步到各个不同的应用中。一个大的特色是这系统采用pull模式从log中取得数据,以达到对生产系统最小影响。<
OpenDremel 是 Google Dremel 的开源实现,目前该项目已经合并到了 Apache Drill。<
Cloudera 发布实时查询开源项目 Impala (黑斑羚)!多款产品实测表明,比原来基于MapReduce的Hive SQL查询速度提升3~90倍。Impala是Google Dremel...<
Pastry 是 Go 语言编写的一个分布式哈希表,Pastry 使用 OS X 10.8.1, Go 1.0.3 开发,但经过验证支持 Ubuntu 12.04 LTS (64-bit), G...<
Mrs是 MapReduce编程模型的一个轻量级实现,但同样拥有高性能,可用于并行计算。它专门为计算密集型程序优化,特别是那些拥有迭代的程序。它的目标是可 以简单的安装和使用。Mrs采用 Pyt...<