OpenMining是由Python编写的商务智能应用服务器,为商务智能中大数据的处理提供了便捷的操作,以此来提高用户挖掘商业情报的效率。<
prophet是一个可以通过 Python 和 R 语言使用的预测工具 Prophet。并非所有的预测问题都可以通过同一种程序(procedure)解决。Prophet 是为我们在 Facebo...<
Apache Arrow是Apache基金会下一个全新的开源项目,同时也是顶级项目。它的目的是作为一个跨平台的数据层来加快大数据分析项目的运行速度。 用户在应用大数据分析时除了将Hadoop等大...<
Apache Griffin是一个应用于分布式数据系统中的开源数据质量解决方案。在Hadoop, Spark, Storm等分布式系统中,提供了一整套统一的流程来定义和检测数据集的质量并及时报告...<
streamDM,是由华为诺亚方舟实验室开源的使用 Spark Streaming 挖掘大数据的开源软件。 大数据流学习 大数据流学习(Big Data stream learning)比批量或...<
Apache Beam 是 Apache 软件基金会越来越多的数据流项目中最新增添的成员,是 Google 在2016年2月份贡献给 Apache 基金会的孵化项目。 这个项目的名称表明了设计:...<
一个封装了Hadoop Client的简单、方便的API,已经在生产环境中经受日千万级别次IO操作的检验。 支持以下功能: 1)自定义HDFS目录前缀 2)支持时间目录格式 3)支持按文件固定大...<
Ciao取“Cloud Integrated Advanced Orchestrator”首字母命名,是一款云集成化先进编排工具。通过这套新方案,企业客户能够将各类元素汇聚至单一模式当中——包括...<
概览 Trafodion提供了一个基于Hadoop平台的交易型分布式SQL引擎。它是一个擅长处理交易型负载的Hadoop大数据解决方案。其主要特性包括: 完整的ANSI SQL 92/99语言支...<
让天下没有难做的大数据模型! 功能 下面是弥勒佛框架解决的问题类型,括号中的斜体代表尚未实现以及预计实现的时间 监督式学习:最大熵分类模型(max entropy classifier),决策树...<