Apache Spark
![spark logo](https://raw.githubusercontent.com/github/explore/6f5025830918df26b37d23b3ffffbc35725fe15f/topics/spark/spark.png)
Apache Spark is an open source distributed general-purpose cluster-computing framework. It provides an interface for programming entire clusters with implicit data parallelism and fault tolerance.
Here are 8,437 public repositories matching this topic...
Data science Python notebooks: Deep learning (TensorFlow, Theano, Caffe, Keras), scikit-learn, Kaggle, big data (Spark, Hadoop MapReduce, HDFS), matplotlib, pandas, NumPy, SciPy, Python essentials, AWS, and various command lines.
-
Updated
Mar 20, 2024 - Python
Make Your Company Data Driven. Connect to any data source, easily visualize, dashboard and share your data.
-
Updated
Aug 3, 2024 - Python
Learn and understand Docker&Container technologies, with real DevOps practice!
-
Updated
Jul 30, 2024 - Go
flink learning blog.http:// 54tianzhisheng.cn/Hàm Flink nhập môn, khái niệm, nguyên lý, thực chiến, tính năng điều ưu, nguyên mã phân tích chờ nội dung. Đề cập Flink Connector, Metrics, Library, DataStream API, Table API & SQL chờ nội dung học tập trường hợp, còn có Flink rơi xuống đất ứng dụng đại hình hạng mục trường hợp ( PVUV, nhật ký tồn trữ, chục tỷ số liệu thật khi đi trọng, theo dõi báo động ) chia sẻ. Hoan nghênh đại gia duy trì ta chuyên mục 《 đại số liệu thật khi tính toán động cơ Flink thực chiến cùng tính năng ưu hoá 》
-
Updated
May 25, 2024 - Java
List of Data Science Cheatsheets to rule the world
-
Updated
Jul 18, 2024
Distributed training framework for TensorFlow, Keras, PyTorch, and Apache MXNet.
-
Updated
Aug 1, 2024 - Python
【 đại xưởng phỏng vấn chuyên mục 】 một phần Java lập trình viên yêu cầu kỹ thuật chỉ nam, nơi này có phỏng vấn đề, hệ thống giá cấu, chức trường túi gấm, chủ lưu trung gian kiện chờ, làm ngươi trở thành càng ngưu chính mình!
-
Updated
Oct 28, 2023
Suite of tools for deploying and training deep learning models using the JVM. Highlights include model import for keras, tensorflow, and onnx/pytorch, a modular and tiny c++ library for running math code and a java based math library on top of the core c++ library. Also includes samediff: a pytorch/tensorflow like library for running deep learn...
-
Updated
Aug 3, 2024 - Java
🧙 Build, run, and manage data pipelines for integrating and transforming data.
-
Updated
Aug 2, 2024 - Python
An open-source storage framework that enables building a Lakehouse architecture with compute engines including Spark, PrestoDB, Flink, Trino, and Hive and APIs
-
Updated
Aug 3, 2024 - Scala
H2O is an Open Source, Distributed, Fast & Scalable Machine Learning Platform: Deep Learning, Gradient Boosting (GBM) & XGBoost, Random Forest, Generalized Linear Modeling (GLM with Elastic Net), K-Means, PCA, Generalized Additive Models (GAM), RuleFit, Support Vector Machine (SVM), Stacked Ensembles, Automatic Machine Learning (AutoML), etc.
-
Updated
Aug 3, 2024 - Jupyter Notebook
Alluxio, data orchestration for analytics and machine learning in the cloud
-
Updated
Aug 2, 2024 - Java
A Flexible and Powerful Parameter Server for large-scale machine learning
-
Updated
Jan 16, 2024 - Java
Created byMatei Zaharia
ReleasedMay 26, 2014
- Followers
- 420 followers
- Repository
- apache/spark
- Website
- spark.apache.org
- Wikipedia
- Wikipedia