Identificar y corregir errores y duplicados

Código
Avanzado
Pandas
Curso de Pandas
15 min
300 XP
Actualizado: 04/09/2024

¡Programa y certifícate!

Asistente de IA
Solución de código
Certificado
Empezar ejercicio

Descripción

En este reto, deberás identificar y corregir diversos tipos de valores erróneos en un DataFrame de Pandas. Los valores erróneos pueden incluir valores NaN, valores fuera de rango, valores duplicados o valores con formato incorrecto. El objetivo es limpiar los datos para asegurar su integridad y calidad antes de cualquier análisis posterior.

Dado un DataFrame de Pandas con las siguientes columnas:

Guarda tu progreso

Inicia sesión para no perder tu progreso y accede a miles de tutoriales, ejercicios prácticos y nuestro asistente de IA.

Progreso guardado
Asistente IA
Ejercicios
Iniciar sesión gratis

Más de 25.000 desarrolladores ya confían en CertiDevs

  • Altura: debe contener solo valores positivos y menores de 300.
  • Peso: debe contener únicamente valores numéricos.
  • Ingreso: debe contener valores numéricos, representando ingresos en una moneda específica.
  • Fecha_Compra: debe estar en un formato de fecha válido (YYYY-MM-DD).
  • Producto: no debe tener valores duplicados.

Realiza las siguientes tareas:

  1. Corrige los valores fuera de rango en la columna Altura (valores negativos y mayores a 300).
  2. Convierte la columna Peso a tipo numérico, reemplazando los valores no numéricos con NaN.
  3. Convierte la columna Ingreso a tipo numérico, asegurándote de que los valores estén en formato numérico, reemplazando cualquier error con NaN.
  4. Convierte la columna Fecha_Compra a tipo datetime, reemplazando los valores que no se puedan convertir con NaT (Not a Time).
  5. Identifica y elimina las filas que contengan valores NaN en cualquiera de las columnas.
  6. Elimina cualquier fila duplicada basada en la columna Producto.
  7. Imprime el DataFrame limpio.

Solución al ejercicio de programación en Pandas

Contenido bloqueado

¡Desbloquea la solución completa!

Completa el ejercicio de programación en Pandas para acceder a la solución paso a paso, explicaciones detalladas y mejores prácticas.

solution.js
JavaScript
1 function solveChallenge ( input ) {
2 // Algoritmo optimizado O(n log n)
3 const data = parseInput ( input );
4 const sorted = data . sort (( a , b ) => a - b );
5
6 // Aplicar técnica de dos punteros
7 let left = 0 , right = sorted . length - 1 ;
8 const result = [];
9
10 while ( left < right ) {
11 const sum = sorted [ left ] + sorted [ right ];
12 if ( sum === target ) {
13 result . push ([ sorted [ left ], sorted [ right ]]);
14 left ++; right --;
15 } else if ( sum < target ) {
16 left ++;
17 } else {
18 right --;
19 }
20 }
21
22 return result ;
23 }
Código completo
Explicaciones
Mejores prácticas
+1.200 developers han resuelto este ejercicio de programación

Practica con ejercicios de programación en Pandas

Mejora tus habilidades con cientos de ejercicios de práctica, recibe retroalimentación instantánea y obtén tu certificación cuando estés listo.

Asistente de IA

Aprende de tus errores

Progreso

Mide tu avance

Certificación

Valida tus habilidades

Únete a miles de desarrolladores mejorando sus habilidades en Pandas

⭐⭐⭐⭐⭐
4.9/5 valoración