Aprender PySpark RDDs: Resilient Distributed Datasets

Módulo del curso de PySpark

PySpark
PySpark
Módulo del curso
Actualizado: 19/04/2026

Módulo: RDDs: Resilient Distributed Datasets

Este módulo forma parte del curso de PySpark. .

Domina los RDDs de Apache Spark: creación con parallelize y textFile, transformaciones map/filter/flatMap/reduceByKey, acciones collect/count/take y persistencia con cache.

Explora más sobre PySpark

Descubre más recursos de PySpark

Alan Sastre - Autor del curso

Alan Sastre

Ingeniero de Software y formador, CEO en CertiDevs

Ingeniero de software especializado en Full Stack y en Inteligencia Artificial. Como CEO de CertiDevs, PySpark es una de sus áreas de expertise. Con más de 15 años programando, 6K seguidores en LinkedIn y experiencia como formador, Alan se dedica a crear contenido educativo de calidad para desarrolladores de todos los niveles.