Ejercicio de programación con Pandas: Tratamiento de valores faltantes
Código
0h 20m
Aprende a identificar e imputar valores faltantes en columnas numéricas utilizando Pandas. Ejercicio práctico con solución detallada.
Tienes un DataFrame de Pandas con varias columnas (numéricas, categóricas y de fecha) que contienen algunos valores faltantes. Debes realizar las siguientes tareas:
- Identificar los valores faltantes en cada columna del DataFrame.
- Convertir la columna
‘Fecha’
a tipodatetime
utilizandopd.to_datetime()
. - Crear una nueva columna que indique si un valor estaba originalmente ausente en la columna numérica
'Valor'
. - Imputar los valores faltantes en las columnas numéricas utilizando la mediana de cada columna.
- Imputar los valores faltantes en las columnas categóricas utilizando la categoría más frecuente (moda).
- Imputar los valores faltantes en las columnas de tipo fecha utilizando la técnica de imputación hacia adelante ("forward fill").
- Imprimir el DataFrame resultante.
Datos:
'Valor': [1, 2, np.nan, 4, 5, 6, np.nan, 8, 9, 10],
'Categoria': ['A', np.nan, 'B', 'A', 'C', 'B', 'A', np.nan, 'C', 'A'],
'Fecha': [pd.NaT, '2023-01-02', '2023-01-03', pd.NaT, '2023-01-05', '2023-01-06', pd.NaT, '2023-01-08', '2023-01-09', pd.NaT]
Todos los ejercicios de programación de Pandas
Evalúa tus conocimientos con ejercicios de programación en Pandas de tipo Test, Puzzle, Código y Proyecto con VSCode.
Introducción e instalación de pandas
Test
Operaciones de filtrado, búsqueda y ordenación
Código
Operaciones de cadena de texto y categóricas
Puzzle
Manipulación de DataFrames
Test
Codificación de variables categóricas a numéricas
Código
Tipos de datos en DataFrames
Test
Identificar y corregir errores y duplicados
Código
Operaciones matemáticas y estadísticas
Código
Evaluación código conocimiento general de Pandas
Código
Evaluación multirespuesta Conocimiento general de Pandas
Test
Integración de Pandas con Matplotlib
Código
Operaciones con fechas
Test
Entrada de datos externos y salida de datos con Pandas
Puzzle
Análisis de datos de eventos deportivos con Pandas en Python
Proyecto
Identificar y corregir outliers
Código
Series
Puzzle
Integración de Pandas con Seaborn
Código
Operaciones de conjuntos
Puzzle
Identificación de valores faltantes
Código
Certificados de superación de Pandas
Supera todos los retos de Pandas y obtén estos certificados de superación para mejorar tu currículum y tu empleabilidad.
Tutorial para resolver este ejercicio de programación
Pandas
Tratamiento de valores faltantes
Limpieza y preparación de datos