Metacat 是一个联合的元数据 API 服务,可以访问 Hive、RDS、Teradata、Redshift、S3 和 Cassandra。 Metacat 为您提供您所拥有的数据信息,包括...<
发源地开源云采集引擎 发源地云采集引擎是由发源地研发团队开发的一套开源分布式云采集工具化引擎,致力于让用户快捷挖掘大数据矿山背后的价值! 发源地云采集引擎完全基于云端,集数据采集、清洗、去重、加...<
Apache Fluo 是 Google Percolator(搜索索引)的开源实现,允许用户对存储在 Apache Accumulo 中的大型数据集进行增量更新,而无需重新处理所有的数据。与批...<
Laxcus 是一个多集群多用户多任务通用数据管理系统,支持百万级计算机节点,提供 EB 级可计算数据的存储和计算能力,综合云管理、大数据、数据库、中间件、容器五个领域的技术和功能,集运行、开发...<
Apache Edgent 是一种编程模型和具有微内核风格的运行时,可嵌入到网关和小型的物联网设备中。Apache Edgent 能用于对来自器材、车辆、系统、应用、设备和传感器(例如树莓派或智...<
Weld 使用 Rust 语言编写,可以使用 LLVM 编译器框架,为整个数据分析工作流生成高效的并行运行的代码。CSAIL 曾开发出了几个将速度推向极限的大数据加速项目,比如 Milk 和 T...<
HPAT 是一个基于编译器的大数据框架,使用 Python 编写。 高性能分析工具包(HPAT)是一个基于编译器的框架,用于群集/云环境中的大数据分析和机器学习,既易于使用又非常快速;它比 Ap...<
KSQL 用于 Apache Kafka 的流数据 SQL 引擎 注意:项目还处于开发者预览版,请暂时勿用于生产集群中。 KSQL 是 Apache Kafka 的开源流 SQL 引擎。 它为 ...<
睿思BI-OLAP系统支持对数据表的OLAP查询,无需编写任何的代码,用户只需要通过语义层的定义就可以轻松搭建自己的多维数据模型并进行数据多维查询及可视化。 产品优势 简单易用 :系统十分易用,...<
tinympi4j 是一款微型的 java 分布式离线计算框架, 实现原理如图: 特性 简单直观, 没有任何学习难度 slave支持多个任务并发/并行执行 使用HTTP协议通信 场景: 找素数/...<