This intermediate-level course empowers learners to apply, analyze, and evaluate machine learning models using Apache PySpark’s distributed computing framework. Designed for data professionals familiar with Python and basic ML concepts, the course explores real-world implementation of both regression and classification techniques, along with unsupervised clustering.

Découvrez de nouvelles compétences avec 30 % de réduction sur les cours dispensés par des experts du secteur. Économisez maintenant.


PySpark: Apply & Evaluate Predictive ML Models
Ce cours fait partie de Spécialisation Spark and Python for Big Data with PySpark

Instructeur : EDUCBA
Inclus avec
Ce que vous apprendrez
Build and evaluate regression models in PySpark using linear, GLM, and ensemble methods.
Apply logistic regression, decision trees, and Random Forests for classification.
Implement K-Means clustering and assess scalable ML workflows with PySpark.
Compétences que vous acquerrez
- Catégorie : Statistical Machine Learning
- Catégorie : Random Forest Algorithm
- Catégorie : Predictive Analytics
- Catégorie : Predictive Modeling
- Catégorie : Regression Analysis
- Catégorie : Supervised Learning
- Catégorie : Apache Spark
- Catégorie : Unsupervised Learning
- Catégorie : Data Pipelines
- Catégorie : Applied Machine Learning
- Catégorie : PySpark
- Catégorie : Classification And Regression Tree (CART)
- Catégorie : Machine Learning Algorithms
Détails à connaître

Ajouter à votre profil LinkedIn
septembre 2025
7 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 2 modules dans ce cours
This module introduces learners to foundational and advanced regression modeling techniques using PySpark's MLlib. Learners begin with basic linear regression workflows including data preparation, feature assembly, and prediction. They then progress to more complex models such as Generalized Linear Regression and ensemble techniques like Random Forest Regression. The module culminates with logistic regression models designed for binary classification, enabling learners to construct and evaluate scalable machine learning pipelines for predictive analytics in distributed environments.
Inclus
11 vidéos4 devoirs
This module equips learners with the ability to build, train, and evaluate classification and clustering models using PySpark's machine learning library. It covers practical applications of multinomial logistic regression for multi-class problems, decision tree classifiers for rule-based predictions, ensemble methods like Random Forests for improved generalization, and unsupervised clustering techniques using the K-Means algorithm. Through hands-on demonstrations, learners gain proficiency in data preparation, model configuration, prediction interpretation, and model performance evaluation in large-scale distributed environments.
Inclus
5 vidéos3 devoirs
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
En savoir plus sur Data Analysis
- Statut : Essai gratuit
- Statut : Essai gratuit
Edureka
- Statut : Essai gratuit
University of Pennsylvania
- Statut : Prévisualisation
Edureka
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?





Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
To access the course materials, assignments and to earn a Certificate, you will need to purchase the Certificate experience when you enroll in a course. You can try a Free Trial instead, or apply for Financial Aid. The course may offer 'Full Course, No Certificate' instead. This option lets you see all course materials, submit required assessments, and get a final grade. This also means that you will not be able to purchase a Certificate experience.
When you enroll in the course, you get access to all of the courses in the Specialization, and you earn a certificate when you complete the work. Your electronic Certificate will be added to your Accomplishments page - from there, you can print your Certificate or add it to your LinkedIn profile.
If you subscribed, you get a 7-day free trial during which you can cancel at no penalty. After that, we don’t give refunds, but you can cancel your subscription at any time. See our full refund policy.
Plus de questions
Aide financière disponible,