Ejercicio de programación con Pandas: Tratamiento de valores faltantes
Código
0h 20m
Aprende a identificar e imputar valores faltantes en columnas numéricas utilizando Pandas. Ejercicio práctico con solución detallada.
Tienes un DataFrame de Pandas con varias columnas (numéricas, categóricas y de fecha) que contienen algunos valores faltantes. Debes realizar las siguientes tareas:
- Identificar los valores faltantes en cada columna del DataFrame.
- Convertir la columna
‘Fecha’
a tipodatetime
utilizandopd.to_datetime()
. - Crear una nueva columna que indique si un valor estaba originalmente ausente en la columna numérica
'Valor'
. - Imputar los valores faltantes en las columnas numéricas utilizando la mediana de cada columna.
- Imputar los valores faltantes en las columnas categóricas utilizando la categoría más frecuente (moda).
- Imputar los valores faltantes en las columnas de tipo fecha utilizando la técnica de imputación hacia adelante ("forward fill").
- Imprimir el DataFrame resultante.
Datos:
'Valor': [1, 2, np.nan, 4, 5, 6, np.nan, 8, 9, 10],
'Categoria': ['A', np.nan, 'B', 'A', 'C', 'B', 'A', np.nan, 'C', 'A'],
'Fecha': [pd.NaT, '2023-01-02', '2023-01-03', pd.NaT, '2023-01-05', '2023-01-06', pd.NaT, '2023-01-08', '2023-01-09', pd.NaT]
Todos los ejercicios de programación de Pandas
Evalúa tus conocimientos con ejercicios de programación en Pandas de tipo Test, Puzzle, Código y Proyecto con VSCode.
Introducción e instalación de pandas
Test
Operaciones de filtrado, búsqueda y ordenación
Código
Operaciones de cadena de texto y categóricas
Puzzle
Manipulación de DataFrames
Test
Codificación de variables categóricas a numéricas
Código
Tipos de datos en DataFrames
Test
Identificar y corregir errores y duplicados
Código
Operaciones matemáticas y estadísticas
Código
Evaluación código conocimiento general de Pandas
Código
Evaluación multirespuesta Conocimiento general de Pandas
Test
Integración de Pandas con Matplotlib
Código
Operaciones con fechas
Test
Entrada de datos externos y salida de datos con Pandas
Puzzle
Análisis de datos de eventos deportivos con Pandas en Python
Proyecto
Identificar y corregir outliers
Código
Series
Puzzle
Integración de Pandas con Seaborn
Código
Operaciones de conjuntos
Puzzle
Identificación de valores faltantes
Código
DataFrames
Código
Análisis de datos de ventas con Numpy y Pandas
Proyecto
Certificados de superación de Pandas
Supera todos los retos de Pandas y obtén estos certificados de superación para mejorar tu currículum y tu empleabilidad.
Tutorial para resolver este ejercicio de programación
Pandas
Tratamiento de valores faltantes
Limpieza y preparación de datos