Identificar y corregir outliers

Código
Avanzado
Pandas
Curso de Pandas
20 min
300 XP
Actualizado: 04/09/2024

¡Programa y certifícate!

Asistente de IA
Solución de código
Certificado
Empezar ejercicio

Descripción

En este ejercicio, deberás identificar y corregir los outliers en un DataFrame de Pandas utilizando la técnica del rango intercuartílico (IQR). Los outliers, o valores atípicos, son observaciones que se desvían significativamente del resto de los datos y pueden distorsionar el análisis y los modelos predictivos.

1.- Crea un DataFrame en Pandas con los siguientes datos:

Guarda tu progreso

Inicia sesión para no perder tu progreso y accede a miles de tutoriales, ejercicios prácticos y nuestro asistente de IA.

Progreso guardado
Asistente IA
Ejercicios
Iniciar sesión gratis

Más de 25.000 desarrolladores ya confían en CertiDevs

data = {
    'Producto': ['Laptop', 'Teléfono', 'Tablet', 'Monitor', 'Impresora', 'Cámara', 'Router', 'Teclado', 'Mouse', 'Parlante'],
    'Cantidad': [50, 60, 3000, 70, 80, 55, 58, 4000, 65, 60],
    'Precio': [1000, 800, 1500, 200, 3000, 700, 90, 400, 150, 120],
    'Peso': [2, 0.5, 1.2, 6, 0.3, 0.7, 0.4, 0.6, 1.1, 50]
}

2.- Calcula el primer cuartil (Q1) y el tercer cuartil (Q3) para las columnas Cantidad, Precio y Peso.

3.- Calcula el rango intercuartílico (IQR) para cada una de estas columnas.

4.- Define los límites inferior y superior para identificar los outliers en cada una de las columnas:

  • Límite inferior: Q1 - 1.5 * IQR
  • Límite superior: Q3 + 1.5 * IQR

5.- Identifica los outliers en cada una de las columnas Cantidad, Precio, y Peso. Crea tres nuevas columnas (Es_Outlier_Cantidad, Es_Outlier_Precio, Es_Outlier_Peso) que indiquen si un valor es un outlier (True) o no (False).

6.- Corrige los outliers en cada una de las columnas, reemplazándolos por la mediana de la respectiva columna.

7.- Imprime el DataFrame resultante con las correcciones aplicadas.

Solución al ejercicio de programación en Pandas

Contenido bloqueado

¡Desbloquea la solución completa!

Completa el ejercicio de programación en Pandas para acceder a la solución paso a paso, explicaciones detalladas y mejores prácticas.

solution.js
JavaScript
1 function solveChallenge ( input ) {
2 // Algoritmo optimizado O(n log n)
3 const data = parseInput ( input );
4 const sorted = data . sort (( a , b ) => a - b );
5
6 // Aplicar técnica de dos punteros
7 let left = 0 , right = sorted . length - 1 ;
8 const result = [];
9
10 while ( left < right ) {
11 const sum = sorted [ left ] + sorted [ right ];
12 if ( sum === target ) {
13 result . push ([ sorted [ left ], sorted [ right ]]);
14 left ++; right --;
15 } else if ( sum < target ) {
16 left ++;
17 } else {
18 right --;
19 }
20 }
21
22 return result ;
23 }
Código completo
Explicaciones
Mejores prácticas
+1.200 developers han resuelto este ejercicio de programación

Practica con ejercicios de programación en Pandas

Mejora tus habilidades con cientos de ejercicios de práctica, recibe retroalimentación instantánea y obtén tu certificación cuando estés listo.

Asistente de IA

Aprende de tus errores

Progreso

Mide tu avance

Certificación

Valida tus habilidades

Únete a miles de desarrolladores mejorando sus habilidades en Pandas

⭐⭐⭐⭐⭐
4.9/5 valoración