Ejercicio de programación con Pandas: Identificar y corregir outliers

Código
Práctica
0h 20m

Aprende a identificar y corregir outliers en un DataFrame de Pandas con Python utilizando la técnica del rango intercuartílico (IQR) para mejorar la calidad de tus datos.

1.- Crea un DataFrame en Pandas con los siguientes datos:

data = {
    'Producto': ['Laptop', 'Teléfono', 'Tablet', 'Monitor', 'Impresora', 'Cámara', 'Router', 'Teclado', 'Mouse', 'Parlante'],
    'Cantidad': [50, 60, 3000, 70, 80, 55, 58, 4000, 65, 60],
    'Precio': [1000, 800, 1500, 200, 3000, 700, 90, 400, 150, 120],
    'Peso': [2, 0.5, 1.2, 6, 0.3, 0.7, 0.4, 0.6, 1.1, 50]
}

2.- Calcula el primer cuartil (Q1) y el tercer cuartil (Q3) para las columnas Cantidad, Precio y Peso.

3.- Calcula el rango intercuartílico (IQR) para cada una de estas columnas.

4.- Define los límites inferior y superior para identificar los outliers en cada una de las columnas:

  • Límite inferior: Q1 - 1.5 * IQR
  • Límite superior: Q3 + 1.5 * IQR

5.- Identifica los outliers en cada una de las columnas Cantidad, Precio, y Peso. Crea tres nuevas columnas (Es_Outlier_Cantidad, Es_Outlier_Precio, Es_Outlier_Peso) que indiquen si un valor es un outlier (True) o no (False).

6.- Corrige los outliers en cada una de las columnas, reemplazándolos por la mediana de la respectiva columna.

7.- Imprime el DataFrame resultante con las correcciones aplicadas.

Empezar ejercicio de programación

Todos los ejercicios de programación de Pandas

Evalúa tus conocimientos con ejercicios de programación en Pandas de tipo Test, Puzzle, Código y Proyecto con VSCode.

Certificados de superación de Pandas

Supera todos los retos de Pandas y obtén estos certificados de superación para mejorar tu currículum y tu empleabilidad.

Tutorial para resolver este ejercicio de programación

pandas

Pandas

Identificar y corregir outliers

Limpieza y preparación de datos

Otros tutoriales de programación con Pandas