Ejercicio de programación con Pandas: Tratamiento de valores faltantes

Código
Práctica

Aprende a identificar e imputar valores faltantes en columnas numéricas utilizando Pandas. Ejercicio práctico con solución detallada.

Tienes un DataFrame de Pandas con varias columnas (numéricas, categóricas y de fecha) que contienen algunos valores faltantes. Debes realizar las siguientes tareas:

  1. Identificar los valores faltantes en cada columna del DataFrame.
  2. Convertir la columna ‘Fecha’ a tipo datetime utilizando pd.to_datetime().
  3. Crear una nueva columna que indique si un valor estaba originalmente ausente en la columna numérica 'Valor'.
  4. Imputar los valores faltantes en las columnas numéricas utilizando la mediana de cada columna.
  5. Imputar los valores faltantes en las columnas categóricas utilizando la categoría más frecuente (moda).
  6. Imputar los valores faltantes en las columnas de tipo fecha utilizando la técnica de imputación hacia adelante ("forward fill").
  7. Imprimir el DataFrame resultante.

Datos:

'Valor': [1, 2, np.nan, 4, 5, 6, np.nan, 8, 9, 10],
'Categoria': ['A', np.nan, 'B', 'A', 'C', 'B', 'A', np.nan, 'C', 'A'],
'Fecha': [pd.NaT, '2023-01-02', '2023-01-03', pd.NaT, '2023-01-05', '2023-01-06', pd.NaT, '2023-01-08', '2023-01-09', pd.NaT]
Empezar ejercicio de programación

Todos los ejercicios de programación de Pandas

Evalúa tus conocimientos con ejercicios de programación en Pandas de tipo Test, Puzzle, Código y Proyecto con VSCode.

Certificados de superación de Pandas

Supera todos los retos de Pandas y obtén estos certificados de superación para mejorar tu currículum y tu empleabilidad.

Tutorial para resolver este ejercicio de programación

pandas

Pandas

Tratamiento de valores faltantes

Limpieza y preparación de datos

Otros tutoriales de programación con Pandas