Descripción
El objetivo de este ejercicio es evaluar la capacidad para identificar y tratar valores faltantes en un conjunto de datos utilizando Pandas. Se debe demostrar la habilidad para aplicar técnicas de imputación en columnas numéricas.
Tienes un DataFrame de Pandas con varias columnas (numéricas, categóricas y de fecha) que contienen algunos valores faltantes. Debes realizar las siguientes tareas:
Guarda tu progreso
Inicia sesión para no perder tu progreso y accede a miles de tutoriales, ejercicios prácticos y nuestro asistente de IA.
Más de 25.000 desarrolladores ya confían en CertiDevs
- Identificar los valores faltantes en cada columna del DataFrame.
- Convertir la columna
‘Fecha’
a tipodatetime
utilizandopd.to_datetime()
. - Crear una nueva columna que indique si un valor estaba originalmente ausente en la columna numérica
'Valor'
. - Imputar los valores faltantes en las columnas numéricas utilizando la mediana de cada columna.
- Imputar los valores faltantes en las columnas categóricas utilizando la categoría más frecuente (moda).
- Imputar los valores faltantes en las columnas de tipo fecha utilizando la técnica de imputación hacia adelante ("forward fill").
- Imprimir el DataFrame resultante.
Datos:
'Valor': [1, 2, np.nan, 4, 5, 6, np.nan, 8, 9, 10],
'Categoria': ['A', np.nan, 'B', 'A', 'C', 'B', 'A', np.nan, 'C', 'A'],
'Fecha': [pd.NaT, '2023-01-02', '2023-01-03', pd.NaT, '2023-01-05', '2023-01-06', pd.NaT, '2023-01-08', '2023-01-09', pd.NaT]
Solución al ejercicio de programación en Pandas
¡Desbloquea la solución completa!
Completa el ejercicio de programación en Pandas para acceder a la solución paso a paso, explicaciones detalladas y mejores prácticas.
Practica con ejercicios de programación en Pandas
Mejora tus habilidades con cientos de ejercicios de práctica, recibe retroalimentación instantánea y obtén tu certificación cuando estés listo.
Asistente de IA
Aprende de tus errores
Progreso
Mide tu avance
Certificación
Valida tus habilidades
Únete a miles de desarrolladores mejorando sus habilidades en Pandas