Ejercicio de programación con Pandas: Identificación de valores faltantes
Código
0h 20m
Aprende a identificar y contar valores faltantes en un DataFrame de Pandas de Python con este ejercicio de programación. Evalúa tus habilidades en limpieza y preparación de datos.
Dado el siguiente conjunto de datos, escribe un script en Python que no solo identifique los valores faltantes (NaN
o None
) en un DataFrame, sino que también realice un análisis más profundo de la distribución y el impacto de estos valores faltantes.
Datos:
data = {
'Nombre': ['Ana', 'Luis', 'Carlos', None, 'Marta', 'Elena', None, 'Jorge', 'Sonia', 'Pablo'],
'Edad': [23, None, 34, 25, None, 45, 29, None, 22, 30],
'Ciudad': ['Madrid', 'Barcelona', None, 'Sevilla', 'Valencia', 'Bilbao', None, 'Madrid', 'Sevilla', 'Bilbao'],
'Ingreso': [30000, 50000, None, 45000, None, 52000, 48000, None, 35000, 49000],
'Estado_Civil': [None, 'Soltero', 'Casado', None, 'Casado', 'Soltero', None, 'Casado', 'Soltero', 'Casado']
}
Tareas:
1.- Importa las bibliotecas necesarias.
2.- Crea un DataFrame con los datos anteriores.
3.- Identificación de valores faltantes:
- Identifica los valores faltantes.
- Cuenta la cantidad de valores faltantes por columna.
4.- Análisis de la distribución de valores faltantes:
- Calcula el porcentaje de valores faltantes en relación con el total de datos en cada columna.
- Imprime el porcentaje de valores faltantes por columna.
5.- Visualización de valores faltantes:
- Crea un mapa de calor (heatmap) que muestre visualmente los valores faltantes en el DataFrame.
6.- Interpretación de la cantidad de valores faltantes:
- Identifica y cuenta la cantidad de filas que contienen valores faltantes en una o más columnas.
- Imprime el número total de filas con valores faltantes.
7.- Análisis de valores faltantes por grupo:
- Agrupa los datos por la columna
'Ciudad'
y calcula el número de valores faltantes en cada grupo. - Imprime el resultado para cada grupo.
Todos los ejercicios de programación de Pandas
Evalúa tus conocimientos con ejercicios de programación en Pandas de tipo Test, Puzzle, Código y Proyecto con VSCode.
Introducción e instalación de pandas
Test
Operaciones de filtrado, búsqueda y ordenación
Código
Operaciones de cadena de texto y categóricas
Puzzle
Tratamiento de valores faltantes
Código
Manipulación de DataFrames
Test
Codificación de variables categóricas a numéricas
Código
Tipos de datos en DataFrames
Test
Identificar y corregir errores y duplicados
Código
Operaciones matemáticas y estadísticas
Código
Evaluación código conocimiento general de Pandas
Código
Evaluación multirespuesta Conocimiento general de Pandas
Test
Integración de Pandas con Matplotlib
Código
Operaciones con fechas
Test
Entrada de datos externos y salida de datos con Pandas
Puzzle
Análisis de datos de eventos deportivos con Pandas en Python
Proyecto
Identificar y corregir outliers
Código
Series
Puzzle
Integración de Pandas con Seaborn
Código
Operaciones de conjuntos
Puzzle
DataFrames
Código
Análisis de datos de ventas con Numpy y Pandas
Proyecto
Tutorial para resolver este ejercicio de programación
Pandas
Identificación de valores faltantes
Limpieza y preparación de datos