Python clone of Spark, a MapReduce alike framework in Python
大数据学习,从零开始学习大数据,包含大数据学习各阶段学习视频、面试资料
GridDB is a next-generation open source database that makes time series ...
基于开源的flink,对其实时sql进行扩展;主要实现了流与维表的join,支持原生...
.NET for Apache® Spark™ makes Apache Spark™ easily accessible to .NET de...
An easy-to-use BI server built for SQL lovers. Power data analysis in SQ...
Distributed Big Data Orchestration Service
Apache Spark & Python (pySpark) tutorials for Big Data Analysis and Mach...
:dart: :star2:[大数据面试题]分享自己在网络上收集的大数据相关的面试题以及...
Google, Naver multiprocess image web crawler (Selenium)
:truck: Agile Data Preparation Workflows made easy with Pandas, Dask, cu...
【A common used C++ DAG framework】 一个通用的、无三方依赖的、跨平台的、...
大数据知识仓库涉及到数据仓库建模、实时计算、大数据、数据中台、系统设计、...
A batch scheduler of kubernetes for high performance workload, e.g. AI/M...
学习记录的一些笔记,以及所看得一些电子书eBooks、视频资源和平常收纳的一些...