Ejercicio de programación con Pandas: Identificar y corregir errores y duplicados
Código
0h 15m
Aprende a identificar y corregir valores erróneos en un DataFrame de Pandas con Python, incluyendo valores NaN, fuera de rango y con formato incorrecto. Mejora la calidad de tus datos con este ejercicio.
Dado un DataFrame de Pandas con las siguientes columnas:
Altura
: debe contener solo valores positivos y menores de 300.Peso
: debe contener únicamente valores numéricos.Ingreso
: debe contener valores numéricos, representando ingresos en una moneda específica.Fecha_Compra
: debe estar en un formato de fecha válido (YYYY-MM-DD).Producto
: no debe tener valores duplicados.
Realiza las siguientes tareas:
- Corrige los valores fuera de rango en la columna
Altura
(valores negativos y mayores a 300). - Convierte la columna
Peso
a tipo numérico, reemplazando los valores no numéricos con NaN. - Convierte la columna
Ingreso
a tipo numérico, asegurándote de que los valores estén en formato numérico, reemplazando cualquier error con NaN. - Convierte la columna
Fecha_Compra
a tipo datetime, reemplazando los valores que no se puedan convertir con NaT (Not a Time). - Identifica y elimina las filas que contengan valores NaN en cualquiera de las columnas.
- Elimina cualquier fila duplicada basada en la columna
Producto
. - Imprime el DataFrame limpio.
Todos los ejercicios de programación de Pandas
Evalúa tus conocimientos con ejercicios de programación en Pandas de tipo Test, Puzzle, Código y Proyecto con VSCode.
Introducción e instalación de pandas
Test
Operaciones de filtrado, búsqueda y ordenación
Código
Operaciones de cadena de texto y categóricas
Puzzle
Tratamiento de valores faltantes
Código
Manipulación de DataFrames
Test
Codificación de variables categóricas a numéricas
Código
Tipos de datos en DataFrames
Test
Operaciones matemáticas y estadísticas
Código
Evaluación código conocimiento general de Pandas
Código
Evaluación multirespuesta Conocimiento general de Pandas
Test
Integración de Pandas con Matplotlib
Código
Operaciones con fechas
Test
Entrada de datos externos y salida de datos con Pandas
Puzzle
Análisis de datos de eventos deportivos con Pandas en Python
Proyecto
Identificar y corregir outliers
Código
Series
Puzzle
Integración de Pandas con Seaborn
Código
Operaciones de conjuntos
Puzzle
Identificación de valores faltantes
Código
Certificados de superación de Pandas
Supera todos los retos de Pandas y obtén estos certificados de superación para mejorar tu currículum y tu empleabilidad.
Tutorial para resolver este ejercicio de programación
Pandas
Identificar y corregir errores y duplicados
Limpieza y preparación de datos