Atlas 是一个可伸缩和可扩展的核心功能治理服务。企业可以利用它高效的管理 Hadoop 以及整个企业数据生态的集成。 核心功能包括:数据分类、集中审计、搜索、安全和策略引擎 架构:<
Paracel 是一个分布式计算框架,用于解决机器学习的问题:逻辑回归、SVD、矩阵分解(BFGS,sgd,als,cg),LDA,Lasso...首先,Paracel 拆分成大规模数据集和大量...<
avpath 可以像 xpath/jspath 那样去选择、更新、插入、删除 Avro 形式的数据。它可以作为 Java/Scala 的 API 库,或者用作 Avro 记录数据服务。它的表达和...<
Chana 是基于 Akka 的 Avro 数据存储。此项目的名称来自于中文“刹那”,这个词音译自梵文“Kasna”,意思为“一瞬间”。 示例代码: function onNameUpdated...<
Microservices infrastructure 是一个为快速部署全球分布式服务的现代平台。 基础平台包括可以用来管理集群和资源节点数量的控制节点。容器可以自动在 DNS 上注册,从而使...<
Twitter开源了数据实时分析平台Heron。 Twitter使用Storm实时分析海量数据已经有好几年了,并在2011年将其开源。该项目稍后开始在Apache基金会孵化,并在2015年秋天成...<
Robust Distributed System Nucleus (rDSN) 是用于快速构建的,管理高性能,健壮的分布式系统。 rDSN 的早期版本在 Bing 中使用,用来构建分布式数据服...<
Tormenta 是 Storm 分布式计算机系统的 Scala 扩展包。Tormenta 在 Storm 的 Kafka 和 Kestrel spouts消息 上添加了一个安全类型的包装器。此...<
ldpush 是一个跨厂商的分布网络配置工具。它能够发送 ACLs 或其他配置命令到网络中去,也可以用来发送命令列表的设备和收集结果。<
astore 是基于 Akka 开发的 Avro 数据存储,持久化功能还在开发中。 脚本示例(要求 JDK 1.8) function onNameUpdated() { var age...<