Módulo: RDDs: Resilient Distributed Datasets
Este módulo forma parte del curso de PySpark. .
Domina los RDDs de Apache Spark: creación con parallelize y textFile, transformaciones map/filter/flatMap/reduceByKey, acciones collect/count/take y persistencia con cache.
Otros módulos de este curso
RDDs: Resilient Distributed Datasets
Todos los módulos del curso
Navega entre los módulos de PySpark
RDDs: Resilient Distributed Datasets
Estás aquíExplora más sobre PySpark
Descubre más recursos de PySpark
Alan Sastre
Ingeniero de Software y formador, CEO en CertiDevs
Ingeniero de software especializado en Full Stack y en Inteligencia Artificial. Como CEO de CertiDevs, PySpark es una de sus áreas de expertise. Con más de 15 años programando, 6K seguidores en LinkedIn y experiencia como formador, Alan se dedica a crear contenido educativo de calidad para desarrolladores de todos los niveles.