Spark History Server Alternatives

Name: KubedAI/spark-history-server
Brand: KubedAI/spark-history-server
SKU: project/KubedAI/spark-history-server
Rating: 4.42 (10 reviews)

Helm Chart for deploying Spark history server in Amazon EKS for S3 Spark Event Logs

Categories > Cloud Computing > Docker

Suggest Alternative

Stars

Alternatives

License

apache-2.0

Open Issues

Most Recent Commit

over 2 years ago

Programming Language

Shell

Dependent Repos

Dependent Packages

Total Releases

Categories

Programming Languages > Shell

Virtualization > Docker

Data Processing > Spark

Cloud Computing > S3

Package Managers > Helm

Build Tools > Helm Charts

Site

Repo

Alternatives To KubedAI/spark-history-server

Project Name	Stars	Repos Using This	Packages Using This	Most Recent Commit	Total Releases	Latest Release	Open Issues	License	Language
san089/goodreads_etl_pipeline	593	0	0	over 6 years ago	0		0	mit	Python
An end-to-end GoodReads Data Pipeline for Building Data Lake, Data Warehouse and Analytics Platform.
svenkreiss/pysparkling	253	7	1	over 3 years ago	69	November 13, 2022	9	other	Python
A pure Python implementation of Apache Spark's RDD and DStream interfaces.
RumbleDB/rumble	194	0	0	about 3 years ago	4	December 03, 2019	134	other	Java
⛈️ RumbleDB 1.21.0 "Hawthorn blossom" 🌳 for Apache Spark \| Run queries on your large-scale, messy JSON-like data (JSON, text, CSV, Parquet, ROOT, AVRO, SVM...) \| No install required (just a jar to download) \| Declarative Machine Learning and more
geotrellis/geotrellis-chatta-demo	44	0	0	almost 8 years ago	0		11		JavaScript
Demo of GeoTrellis - weighted overlay and zonal summary for University of Tennessee at Chattanooga.
tharwaninitin/etlflow	43	0	11	almost 3 years ago	37	July 19, 2023	0	apache-2.0	Scala
EtlFlow is an ecosystem of functional libraries in Scala based on ZIO for running complex Auditable workflows which can interact with Google Cloud Platform, AWS, Kubernetes, Databases, SFTP servers, On-Prem Systems and more.
nareshk1290/Udacity-Data-Engineering	42	0	0	over 6 years ago	0		1		Jupyter Notebook
Udacity Data Engineering Nano Degree (DEND)
yamrcraft/etl-light	38	0	0	about 9 years ago	0		0	mit	Scala
A light Kafka to HDFS/S3 ETL library based on Apache Spark
rayyan17/jobAnalytics_and_search	22	0	0	over 4 years ago	0		8	mit	Python
JobAnalytics system consumes data from multiple sources and provides valuable information to both job hunters and recruiters.
hortonworks-spark/cloud-integration	21	0	0	over 3 years ago	0		4	apache-2.0	Scala
Spark cloud integration: tests, cloud committers and more
guidok91/spark-movies-etl	21	0	0	almost 3 years ago	0		2		Python
Spark data pipeline that ingests and transforms movie ratings data.

Alternatives To KubedAI/spark-history-server

Select To Compare

san089/goodreads_etl_pipeline ⭐ 593

An end-to-end GoodReads Data Pipeline for Building Data Lake, Data Warehouse and Analytics Platform.

dependent packages 0 total releases 0 most recent commit over 6 years ago

svenkreiss/pysparkling ⭐ 253

A pure Python implementation of Apache Spark's RDD and DStream interfaces.

dependent packages 1 total releases 69 most recent commit over 3 years ago downloads badge

RumbleDB/rumble ⭐ 194

⛈️ RumbleDB 1.21.0 "Hawthorn blossom" 🌳 for Apache Spark | Run queries on your large-scale, messy JSON-like data (JSON, text, CSV, Parquet, ROOT, AVRO, SVM...) | No install required (just a jar to download) | Declarative Machine Learning and more

dependent packages 0 total releases 4 most recent commit about 3 years ago

geotrellis/geotrellis-chatta-demo ⭐ 44

Demo of GeoTrellis - weighted overlay and zonal summary for University of Tennessee at Chattanooga.

dependent packages 0 total releases 0 most recent commit almost 8 years ago

tharwaninitin/etlflow ⭐ 43

EtlFlow is an ecosystem of functional libraries in Scala based on ZIO for running complex Auditable workflows which can interact with Google Cloud Platform, AWS, Kubernetes, Databases, SFTP servers, On-Prem Systems and more.

dependent packages 11 total releases 37 most recent commit almost 3 years ago

nareshk1290/Udacity-Data-Engineering ⭐ 42

Udacity Data Engineering Nano Degree (DEND)

dependent packages 0 total releases 0 most recent commit over 6 years ago

yamrcraft/etl-light ⭐ 38

A light Kafka to HDFS/S3 ETL library based on Apache Spark

dependent packages 0 total releases 0 most recent commit about 9 years ago

rayyan17/jobAnalytics_and_search ⭐ 22

JobAnalytics system consumes data from multiple sources and provides valuable information to both job hunters and recruiters.

dependent packages 0 total releases 0 most recent commit over 4 years ago

hortonworks-spark/cloud-integration ⭐ 21

Spark cloud integration: tests, cloud committers and more

dependent packages 0 total releases 0 most recent commit over 3 years ago

guidok91/spark-movies-etl ⭐ 21

Spark data pipeline that ingests and transforms movie ratings data.

dependent packages 0 total releases 0 most recent commit almost 3 years ago

Suggest An Alternative To spark-history-server

Alternative Project Comparisons

KubedAI/spark-history-server vs Goodreads_etl_pipeline

KubedAI/spark-history-server vs Pysparkling

KubedAI/spark-history-server vs Rumble

KubedAI/spark-history-server vs Geotrellis Chatta Demo

KubedAI/spark-history-server vs Etlflow

KubedAI/spark-history-server vs Udacity Data Engineering

KubedAI/spark-history-server vs Etl Light

KubedAI/spark-history-server vs Jobanalytics_and_search

KubedAI/spark-history-server vs Cloud Integration

KubedAI/spark-history-server vs Spark Movies Etl

Popular S3 Projects

minio/minio⭐ 59,981

MinIO is a high-performance, S3 compatible object store, open sourced under GNU AGPLv3 license.

rclone/rclone⭐ 58,067

"rsync for cloud storage" - Google Drive, S3, Dropbox, Backblaze B2, One Drive, Swift, Hubic, Wasabi, Google Cloud Storage, Azure Blob, Azure Files, Yandex Files

seaweedfs/seaweedfs⭐ 19,155

SeaweedFS is a fast distributed storage system for blobs, objects, files, and data lake, for billions of files! Blob store has O(1) disk seek, cloud tiering. Filer supports Cloud Drive, cross-DC active-active replication, Kubernetes, POSIX FUSE mount, S3 API, S3 Gateway, Hadoop, WebDAV, encryption, Erasure Coding.

ceph/ceph⭐ 16,154

Ceph is a distributed object, block, and file storage platform

dutchcoders/transfer.sh⭐ 14,640

Easy and fast file sharing from the command-line.

Popular Spark Projects

apache/spark⭐ 37,661

Apache Spark - A unified analytics engine for large-scale data processing

donnemartin/data-science-ipython-notebooks⭐ 25,668

Data science Python notebooks: Deep learning (TensorFlow, Theano, Caffe, Keras), scikit-learn, Kaggle, big data (Spark, Hadoop MapReduce, HDFS), matplotlib, pandas, NumPy, SciPy, Python essentials, AWS, and various command lines.

getredash/redash⭐ 24,479

Make Your Company Data Driven. Connect to any data source, easily visualize, dashboard and share your data.

yeasy/docker_practice⭐ 23,279

Learn and understand Docker&Container technologies, with real DevOps practice!

DataTalksClub/data-engineering-zoomcamp⭐ 19,461

Free Data Engineering course!

Popular Cloud Computing Categories

Amazon Web Services

Cloud Computing

Azure

Lambda Functions

Heroku

Serverless

Google Cloud Platform

Aws Lambda

Aws Ecs