Ejercicio de programación con Pandas: Identificar y corregir errores y duplicados
Código
0h 15m
Aprende a identificar y corregir valores erróneos en un DataFrame de Pandas con Python, incluyendo valores NaN, fuera de rango y con formato incorrecto. Mejora la calidad de tus datos con este ejercicio.
Dado un DataFrame de Pandas con las siguientes columnas:
Altura
: debe contener solo valores positivos y menores de 300.Peso
: debe contener únicamente valores numéricos.Ingreso
: debe contener valores numéricos, representando ingresos en una moneda específica.Fecha_Compra
: debe estar en un formato de fecha válido (YYYY-MM-DD).Producto
: no debe tener valores duplicados.
Realiza las siguientes tareas:
- Corrige los valores fuera de rango en la columna
Altura
(valores negativos y mayores a 300). - Convierte la columna
Peso
a tipo numérico, reemplazando los valores no numéricos con NaN. - Convierte la columna
Ingreso
a tipo numérico, asegurándote de que los valores estén en formato numérico, reemplazando cualquier error con NaN. - Convierte la columna
Fecha_Compra
a tipo datetime, reemplazando los valores que no se puedan convertir con NaT (Not a Time). - Identifica y elimina las filas que contengan valores NaN en cualquiera de las columnas.
- Elimina cualquier fila duplicada basada en la columna
Producto
. - Imprime el DataFrame limpio.
Todos los ejercicios de programación de Pandas
Evalúa tus conocimientos con ejercicios de programación en Pandas de tipo Test, Puzzle, Código y Proyecto con VSCode.
Introducción e instalación de pandas
Test
Operaciones de filtrado, búsqueda y ordenación
Código
Operaciones de cadena de texto y categóricas
Puzzle
Tratamiento de valores faltantes
Código
Manipulación de DataFrames
Test
Codificación de variables categóricas a numéricas
Código
Tipos de datos en DataFrames
Test
Operaciones matemáticas y estadísticas
Código
Evaluación código conocimiento general de Pandas
Código
Evaluación multirespuesta Conocimiento general de Pandas
Test
Integración de Pandas con Matplotlib
Código
Operaciones con fechas
Test
Entrada de datos externos y salida de datos con Pandas
Puzzle
Análisis de datos de eventos deportivos con Pandas en Python
Proyecto
Identificar y corregir outliers
Código
Series
Puzzle
Integración de Pandas con Seaborn
Código
Operaciones de conjuntos
Puzzle
Identificación de valores faltantes
Código
DataFrames
Código
Análisis de datos de ventas con Numpy y Pandas
Proyecto
Certificados de superación de Pandas
Supera todos los retos de Pandas y obtén estos certificados de superación para mejorar tu currículum y tu empleabilidad.
Tutorial para resolver este ejercicio de programación
Pandas
Identificar y corregir errores y duplicados
Limpieza y preparación de datos