Data Brewery 是一组 Python 框架和工具,用于数据处理和分析。主要功能包括:聚合数据浏览、报表和多维建模。提供一组 OLAP HTTP 服务的轻量级 Python 框架。此外还...<
Superset 是 Airbnb (知名在线房屋短租公司)开源的数据探查与可视化平台(曾用名 Panoramix、Caravel ),该工具在可视化、易用性和交互性上非常有特色,用户可以轻松对...<
Pinot 是一个实时分布式的 OLAP 数据存储和分析系统。LinkedIn 使用它实现低延迟可伸缩的实时分析。Pinot 从离线数据源(包括 Hadoop 和各类文件)和在线数据源(如 Ka...<
百度开源的新一代一站式敏捷 BI 平台,提供报表和 OLAP 服务。 如何快速构建BI-Platform 构建前提:需在指定环境中安装maven 3 以上、java8 项目模块功能描述: fil...<
Apache NiFi 是一个易于使用、功能强大而且可靠的数据处理和分发系统。Apache NiFi 是为数据流设计。它支持高度可配置的指示图的数据路由、转换和系统中介逻辑。 架构: 集群管理器...<
Druid 是一个高性能实时分析数据库。它是为大型数据集上实时探索查询的引擎,提供专为 OLAP 设计的开源分析数据存储系统,它的设计意图是在面对代码部署、机器故障以及其他产品系统遇到不测时能保...<
Saiku 是一个模块化的开源分析套件,它提供轻量级的OLAP(联机分析处理),并且可嵌入、可扩展、可配置。 构建: mvn clean install -DskipTests mvn c...<
ELKI(Environment for Developing KDD-Applications Supported by Index-Structures)主要用来聚类和找离群点。ELKI是类...<
1:mdrill是阿里妈妈-adhoc-海量数据多维自助即席查询平台下的一个子项目。 2:mdrill旨在帮助用户在几秒到几十秒的时间内,分析百亿级别的任意维度组合的数据。 3:mdrill是一...<
SPMF 是一个基于JAVA的开源数据挖掘平台,它实现了51个常用的数据挖掘算法,覆盖: sequential pattern mining, association rule mining, ...<