Ejercicio de programación con Pandas: Identificar y corregir outliers
0h 20m
Aprende a identificar y corregir outliers en un DataFrame de Pandas con Python utilizando la técnica del rango intercuartílico (IQR) para mejorar la calidad de tus datos.
1.- Crea un DataFrame en Pandas con los siguientes datos:
data = {
'Producto': ['Laptop', 'Teléfono', 'Tablet', 'Monitor', 'Impresora', 'Cámara', 'Router', 'Teclado', 'Mouse', 'Parlante'],
'Cantidad': [50, 60, 3000, 70, 80, 55, 58, 4000, 65, 60],
'Precio': [1000, 800, 1500, 200, 3000, 700, 90, 400, 150, 120],
'Peso': [2, 0.5, 1.2, 6, 0.3, 0.7, 0.4, 0.6, 1.1, 50]
}
2.- Calcula el primer cuartil (Q1) y el tercer cuartil (Q3) para las columnas Cantidad
, Precio
y Peso
.
3.- Calcula el rango intercuartílico (IQR) para cada una de estas columnas.
4.- Define los límites inferior y superior para identificar los outliers en cada una de las columnas:
- Límite inferior: Q1 - 1.5 * IQR
- Límite superior: Q3 + 1.5 * IQR
5.- Identifica los outliers en cada una de las columnas Cantidad
, Precio
, y Peso
. Crea tres nuevas columnas (Es_Outlier_Cantidad
, Es_Outlier_Precio
, Es_Outlier_Peso
) que indiquen si un valor es un outlier (True
) o no (False
).
6.- Corrige los outliers en cada una de las columnas, reemplazándolos por la mediana de la respectiva columna.
7.- Imprime el DataFrame resultante con las correcciones aplicadas.
Todos los ejercicios de programación de Pandas
Evalúa tus conocimientos con ejercicios de programación en Pandas de tipo Test, Puzzle, Código y Proyecto con VSCode.
Evaluación código Conocimiento general de Pandas
Introducción e instalación de pandas
Operaciones de filtrado, búsqueda y ordenación
Operaciones de cadena de texto y categóricas
Tratamiento de valores faltantes
Manipulación de DataFrames
Codificación de variables categóricas a numéricas
Tipos de datos en DataFrames
Identificar y corregir errores y duplicados
Operaciones matemáticas y estadísticas
Evaluación multirespuesta Conocimiento general de Pandas
Integración de Pandas con Matplotlib
Operaciones con fechas
Entrada de datos externos y salida de datos con Pandas
Series
Integración de Pandas con Seaborn
Operaciones de conjuntos
Identificación de valores faltantes
DataFrames
Certificados de superación de Pandas
Supera todos los retos de Pandas y obtén estos certificados de superación para mejorar tu currículum y tu empleabilidad.
Tutorial para resolver este ejercicio de programación
Pandas
Identificar y corregir outliers
Limpieza y preparación de datos