Curso Ciencia de datos con Pandas y Python

Pandas para datos tabulares: estructuras, filtrado, agrupación, limpieza, I/O moderno, visualización y buenas prácticas.

Certificado profesional
Curso de programación
25 horas
Intermedio
Actualizado: 19/04/2026

¡Desbloquea el curso completo!

Asistente IA
Ejercicios código
Certificado
Empezar curso

Curso Ciencia de datos con Pandas y Python con certificado

Este certificado recorre Pandas como herramienta central para análisis de datos en Python: desde Series y DataFrames hasta groupby, tablas dinámicas, limpieza de calidad de datos, I/O moderno (incluido backend PyArrow), visualización con Matplotlib y Seaborn, y rendimiento con Copy-on-Write y buenas prácticas de código.

Público objetivo

  • Programadores Python que necesitan analizar y transformar datos tabulares de forma profesional.
  • Analistas de datos y perfiles técnicos que automatizan flujos que antes vivían en Excel o SQL.
  • Científicos de datos e ingenieros de datos que requieren preprocesamiento sólido antes de modelado o pipelines.

Contenido del roadmap

Introducción e instalación

  • Contexto de Pandas en el ecosistema de datos en Python, instalación y comprobación del entorno.

Estructuras de datos

  • Series y DataFrames: creación, indexación, tipos nullable y backends eficientes.

Manipulación de datos

  • Transformaciones, filtrado, texto y categóricas, fechas, y combinación de tablas.

Agrupación y tablas dinámicas

  • GroupBy, agregaciones, pivot, melt y operaciones de reshaping.

Limpieza y preparación

  • Valores faltantes, duplicados, outliers y codificación de categóricas.

Entrada/salida e integraciones

  • Lectura y escritura en formatos habituales y enlace con Matplotlib y Seaborn.

Rendimiento y buenas prácticas

  • Copy-on-Write, PyArrow, patrones de código mantenible y evaluación final.

Objetivos de aprendizaje

Al completar este roadmap, serás capaz de:

  • Construir y transformar Series y DataFrames con criterio de tipos y memoria.
  • Filtrar, ordenar, agrupar y pivotar datos para obtener resúmenes accionables.
  • Limpiar conjuntos de datos: ausencias, errores, duplicados y valores atípicos.
  • Importar y exportar datos usando opciones modernas alineadas con PyArrow cuando aplique.
  • Visualizar resultados desde DataFrames con Matplotlib y Seaborn.
  • Aplicar prácticas de rendimiento y estilo recomendadas en Pandas actuales.

Explorar más cursos de programación

Descubre más cursos y hojas de ruta de programación

Alan Sastre - Autor del curso

Alan Sastre

Ingeniero de Software y formador, CEO en CertiDevs

Ingeniero de software especializado en Full Stack y en Inteligencia Artificial. Como CEO de CertiDevs, se dedica a crear hojas de ruta y cursos de programación estructurados. Con más de 15 años programando, 6K seguidores en LinkedIn y experiencia como formador, Alan diseña contenido educativo de calidad para desarrolladores de todos los niveles.