Ejercicio de programación con Pandas: Identificación de valores faltantes
0h 20m
Aprende a identificar y contar valores faltantes en un DataFrame de Pandas de Python con este ejercicio de programación. Evalúa tus habilidades en limpieza y preparación de datos.
Dado el siguiente conjunto de datos, escribe un script en Python que no solo identifique los valores faltantes (NaN
o None
) en un DataFrame, sino que también realice un análisis más profundo de la distribución y el impacto de estos valores faltantes.
Datos:
data = {
'Nombre': ['Ana', 'Luis', 'Carlos', None, 'Marta', 'Elena', None, 'Jorge', 'Sonia', 'Pablo'],
'Edad': [23, None, 34, 25, None, 45, 29, None, 22, 30],
'Ciudad': ['Madrid', 'Barcelona', None, 'Sevilla', 'Valencia', 'Bilbao', None, 'Madrid', 'Sevilla', 'Bilbao'],
'Ingreso': [30000, 50000, None, 45000, None, 52000, 48000, None, 35000, 49000],
'Estado_Civil': [None, 'Soltero', 'Casado', None, 'Casado', 'Soltero', None, 'Casado', 'Soltero', 'Casado']
}
Tareas:
1.- Importa las bibliotecas necesarias.
2.- Crea un DataFrame con los datos anteriores.
3.- Identificación de valores faltantes:
- Identifica los valores faltantes.
- Cuenta la cantidad de valores faltantes por columna.
4.- Análisis de la distribución de valores faltantes:
- Calcula el porcentaje de valores faltantes en relación con el total de datos en cada columna.
- Imprime el porcentaje de valores faltantes por columna.
5.- Visualización de valores faltantes:
- Crea un mapa de calor (heatmap) que muestre visualmente los valores faltantes en el DataFrame.
6.- Interpretación de la cantidad de valores faltantes:
- Identifica y cuenta la cantidad de filas que contienen valores faltantes en una o más columnas.
- Imprime el número total de filas con valores faltantes.
7.- Análisis de valores faltantes por grupo:
- Agrupa los datos por la columna
'Ciudad'
y calcula el número de valores faltantes en cada grupo. - Imprime el resultado para cada grupo.
Todos los ejercicios de programación de Pandas
Evalúa tus conocimientos con ejercicios de programación en Pandas de tipo Test, Puzzle, Código y Proyecto con VSCode.
Evaluación código Conocimiento general de Pandas
Introducción e instalación de pandas
Operaciones de filtrado, búsqueda y ordenación
Operaciones de cadena de texto y categóricas
Tratamiento de valores faltantes
Manipulación de DataFrames
Codificación de variables categóricas a numéricas
Tipos de datos en DataFrames
Identificar y corregir errores y duplicados
Operaciones matemáticas y estadísticas
Evaluación multirespuesta Conocimiento general de Pandas
Integración de Pandas con Matplotlib
Operaciones con fechas
Entrada de datos externos y salida de datos con Pandas
Identificar y corregir outliers
Series
Integración de Pandas con Seaborn
Operaciones de conjuntos
DataFrames
Certificados de superación de Pandas
Supera todos los retos de Pandas y obtén estos certificados de superación para mejorar tu currículum y tu empleabilidad.
Tutorial para resolver este ejercicio de programación
Pandas
Identificación de valores faltantes
Limpieza y preparación de datos