Curso PySpark

Domina PySpark: SparkSession, Spark Connect, RDDs, DataFrames, Pandas API, Spark SQL, Structured Streaming, MLlib, Delta Lake, testing y producción

Certificado profesional
PySpark
PySpark
Framework
9 horas
15 módulos
16 lecciones
Apache Software Foundation
Documentación oficial
Actualizado: 18/04/2026

¡Desbloquea el curso completo!

IA
Ejercicios
Certificado
Entrar

Descripción del curso PySpark

PySpark es la API de Python para Apache Spark que permite el procesamiento distribuido de grandes volúmenes de datos: SparkSession, Spark Connect, RDDs, DataFrames, Pandas API on Spark, Spark SQL, transformaciones avanzadas, Structured Streaming, MLlib con sistemas de recomendación e integraciones ML, Delta Lake, testing y despliegue en producción.

Explorar más tecnologías

Descubre más tecnologías de programación y desarrollo de software

Alan Sastre - Autor del curso

Alan Sastre

Ingeniero de Software y formador, CEO en CertiDevs

Ingeniero de software especializado en Full Stack y en Inteligencia Artificial. Como CEO de CertiDevs, PySpark es una de sus áreas de expertise. Con más de 15 años programando, 6K seguidores en LinkedIn y experiencia como formador, Alan se dedica a crear contenido educativo de calidad para desarrolladores de todos los niveles.