Ejercicio de programación con ScikitLearn: Preprocesamiento de datos de series temporales
0h 40m
En este ejercicio aprenderás a manejar y preprocesar datos de series temporales utilizando pandas y funciones resample, to_datetime, ffill, centrado en operaciones con fechas.
En este reto, trabajaremos con un conjunto de datos temporales para poner en práctica nuestras habilidades en el preprocesamiento de series temporales utilizando pandas. Usarás funciones como pd.to_datetime()
, resample()
, y técnicas para manejar fechas, para transformar y resumir adecuadamente los datos temporales.
Cargar el dataset: Cargar el conjunto de datos flights
disponible en Seaborn usando la función sns.load_dataset('flights')
.
Convertir las columnas de fecha: La información de fechas está separada en las columnas 'year' y 'month'. Combina ambas en una nueva columna de tipo datetime llamada 'date'. Necesitarás usar to_datetime de Pandas.
Crear un DataFrame con la fecha como índice: Usa la columna 'date' como el índice del DataFrame.
Resampling mensual a trimestral: Realiza un resampling desde mensual a trimestral, calculando la suma de pasajeros en cada trimestre. Almacena el resultado en una nueva variable llamada trimestral_passengers
.
Imputar valores faltantes: Si se generan valores NaN durante el resampleo, asegúrate de rellenarlos usando el método ffill()
.
Visualizar el resultado: Grafica los datos originales y los resultados del resampling para visualizar los efectos del preprocesamiento.
Implementa cada paso siguiendo las instrucciones aquí proporcionadas.
Todos los ejercicios de programación de ScikitLearn
Evalúa tus conocimientos con ejercicios de programación en ScikitLearn de tipo Test, Puzzle, Código y Proyecto con VSCode.
Regresión SVM con SVR
Ajuste de hiperparámetros
Pipelines y Validación Cruzada
Preprocesamiento de datos desbalanceados
Pipelines con ColumnTransformer
Validación y evaluación de modelos
Identificación y tratamiento de valores faltantes
Ingeniería de características para series temporales
Introducción a la clasificación
Transformación y escalado de series temporales
Extracción de características
Clasificación KNN KNeighborsClassifier
Regresión con algoritmos de conjunto
Regresión lineal
Reducción de la dimensionalidad con PCA
Clasificación con algoritmos de conjunto
Clasificación SVM con SVC
Escalado de datos
Clustering jerárquico
Análisis de sentimiento
Validación y evaluación de modelos en series temporales
Regresión KNN KNeighborsRegressor
Técnicas de validación cruzada
Introducción al preprocesamiento de datos
Exportar e importar Pipelines
Preprocesamiento de textos para NLP
Clasificación con árboles DecisionTreeClassifier
Selección de Características
Introducción a la regresión
Clasificación con regresión logística en Scikit Learn
Ingeniería de Características
Clustering con KMeans
Introducción al análisis de series temporales
Codificación de variables categóricas
Clasificación de Texto con Scikit Learn
Métricas de Regresión
Aprendizaje automático
Clustering de densidad con DBSCAN
Métricas de clasificación
Técnicas avanzadas de extracción de características
Creación de pipelines básicos
Particionamiento de datos
Normalización de datos
Regresión con árboles DecisionTreeRegressor
Introducción e instalación de Scikit Learn
Preprocesamiento de datos con pipelines
Representación de texto y extracción de características
Introducción a pipelines
Tutorial para resolver este ejercicio de programación
ScikitLearn
Preprocesamiento de datos de series temporales
Series temporales