Descripción del curso PySpark
PySpark es la API de Python para Apache Spark que permite el procesamiento distribuido de grandes volúmenes de datos: SparkSession, Spark Connect, RDDs, DataFrames, Pandas API on Spark, Spark SQL, transformaciones avanzadas, Structured Streaming, MLlib con sistemas de recomendación e integraciones ML, Delta Lake, testing y despliegue en producción.
Lecciones y tutoriales de PySpark
Módulos del curso
Explora todos los módulos disponibles en este curso de PySpark
Explorar más tecnologías
Descubre más tecnologías de programación y desarrollo de software
Alan Sastre
Ingeniero de Software y formador, CEO en CertiDevs
Ingeniero de software especializado en Full Stack y en Inteligencia Artificial. Como CEO de CertiDevs, PySpark es una de sus áreas de expertise. Con más de 15 años programando, 6K seguidores en LinkedIn y experiencia como formador, Alan se dedica a crear contenido educativo de calidad para desarrolladores de todos los niveles.