Ingeniería de características para series temporales

Código
Avanzado
ScikitLearn
ScikitLearn
18 min
200 XP
Actualizado: 28/02/2025

¡Practica y certifícate!

Retroalimentación
Soluciones
Certificado
Comenzar

Descripción

Construir características basadas en lags usando Python y pandas.

En este reto, usarás Scikit-Learn y pandas para crear características basadas en la variable de retraso, comúnmente conocidas como lags. El objetivo es que practiques la creación de estas variables, que son fundamentales para capturar la dependencia temporal en series de datos. Trabajaremos con un dataset de series temporales proporcionado por la librería Seaborn.

Guarda tu progreso

Inicia sesión para no perder tu progreso y accede a miles de tutoriales, ejercicios prácticos y nuestro asistente de IA.

Progreso guardado
Asistente IA
Ejercicios
Iniciar sesión gratis

Más de 25.000 desarrolladores ya confían en CertiDevs

El dataset a utilizar es el conjunto de datos flights de Seaborn, el cual contiene registros mensuales del número de pasajeros de vuelos comerciales internacionales en el año 1949 hasta 1960.

  1. Importa los módulos necesarios: pandas, seaborn, numpy y train_test_split de sklearn.model_selection.
  2. Carga el dataset flights usando la función seaborn.load_dataset().
  3. Asegúrate de que la columna month está en el formato de fecha adecuado para el análisis temporal.
  4. Usa pandas para crear nuevas columnas en el DataFrame: passengers_lag1 y passengers_lag2, que representen los valores retrasados 1 y 2 meses, respectivamente, utiliza la función shift de pandas.
  5. Maneja los valores faltantes que resulten de la creación de lags.
  6. Define las variables independientes (X) y el objetivo (y), donde X incluirá passengers_lag1 y passengers_lag2. La variable objetivo será el número real de pasajeros.
  7. Divide los datos en conjuntos de entrenamiento y prueba, respetando el orden cronológico, para entrenar un modelo de regresión.
  8. Utiliza RandomForestRegressor de Scikit-Learn para entrenar el modelo. Haz predicciones sobre el conjunto de prueba.
  9. Evalúa el rendimiento del modelo calculando el Error Medio Absoluto (MAE) y la Raíz del Error Cuadrático Medio (RMSE) de las predicciones.

Solución al ejercicio

Contenido bloqueado

¡Desbloquea la solución completa!

Completa el examen para acceder a la solución paso a paso, explicaciones detalladas y mejores prácticas.

solution.js
JavaScript
1 function solveChallenge ( input ) {
2 // Algoritmo optimizado O(n log n)
3 const data = parseInput ( input );
4 const sorted = data . sort (( a , b ) => a - b );
5
6 // Aplicar técnica de dos punteros
7 let left = 0 , right = sorted . length - 1 ;
8 const result = [];
9
10 while ( left < right ) {
11 const sum = sorted [ left ] + sorted [ right ];
12 if ( sum === target ) {
13 result . push ([ sorted [ left ], sorted [ right ]]);
14 left ++; right --;
15 } else if ( sum < target ) {
16 left ++;
17 } else {
18 right --;
19 }
20 }
21
22 return result ;
23 }
Código completo
Explicaciones
Mejores prácticas
+1.200 developers han resuelto este ejercicio de programación

Practica con exámenes de ScikitLearn

Mejora tus habilidades con cientos de exámenes de práctica, recibe retroalimentación instantánea y obtén tu certificación cuando estés listo.

Retroalimentación

Aprende de tus errores

Progreso

Mide tu avance

Certificación

Valida tus habilidades

Únete a miles de desarrolladores mejorando sus habilidades

⭐⭐⭐⭐⭐
4.9/5 valoración