Ejercicio de programación con Pandas: Identificar y corregir outliers
0h 20m
Aprende a identificar y corregir outliers en un DataFrame de Pandas con Python utilizando la técnica del rango intercuartílico (IQR) para mejorar la calidad de tus datos.
1.- Crea un DataFrame en Pandas con los siguientes datos:
data = {
'Producto': ['Laptop', 'Teléfono', 'Tablet', 'Monitor', 'Impresora', 'Cámara', 'Router', 'Teclado', 'Mouse', 'Parlante'],
'Cantidad': [50, 60, 3000, 70, 80, 55, 58, 4000, 65, 60],
'Precio': [1000, 800, 1500, 200, 3000, 700, 90, 400, 150, 120],
'Peso': [2, 0.5, 1.2, 6, 0.3, 0.7, 0.4, 0.6, 1.1, 50]
}
2.- Calcula el primer cuartil (Q1) y el tercer cuartil (Q3) para las columnas Cantidad
, Precio
y Peso
.
3.- Calcula el rango intercuartílico (IQR) para cada una de estas columnas.
4.- Define los límites inferior y superior para identificar los outliers en cada una de las columnas:
- Límite inferior: Q1 - 1.5 * IQR
- Límite superior: Q3 + 1.5 * IQR
5.- Identifica los outliers en cada una de las columnas Cantidad
, Precio
, y Peso
. Crea tres nuevas columnas (Es_Outlier_Cantidad
, Es_Outlier_Precio
, Es_Outlier_Peso
) que indiquen si un valor es un outlier (True
) o no (False
).
6.- Corrige los outliers en cada una de las columnas, reemplazándolos por la mediana de la respectiva columna.
7.- Imprime el DataFrame resultante con las correcciones aplicadas.
Todos los ejercicios de programación de Pandas
Evalúa tus conocimientos con ejercicios de programación en Pandas de tipo Test, Puzzle, Código y Proyecto con VSCode.
Introducción e instalación de pandas
Operaciones de filtrado, búsqueda y ordenación
Operaciones de cadena de texto y categóricas
Tratamiento de valores faltantes
Manipulación de DataFrames
Codificación de variables categóricas a numéricas
Tipos de datos en DataFrames
Identificar y corregir errores y duplicados
Operaciones matemáticas y estadísticas
Evaluación código conocimiento general de Pandas
Evaluación multirespuesta Conocimiento general de Pandas
Integración de Pandas con Matplotlib
Operaciones con fechas
Entrada de datos externos y salida de datos con Pandas
Análisis de datos de eventos deportivos con Pandas en Python
Series
Integración de Pandas con Seaborn
Operaciones de conjuntos
Identificación de valores faltantes
Certificados de superación de Pandas
Supera todos los retos de Pandas y obtén estos certificados de superación para mejorar tu currículum y tu empleabilidad.
Tutorial para resolver este ejercicio de programación
Pandas
Identificar y corregir outliers
Limpieza y preparación de datos