Ejercicio de programación con ScikitLearn: Introducción al preprocesamiento de datos
Código
0h 15m
Resuelve el reto en Python que preprocesa un dataset: imputación de valores faltantes con SimpleImputer y escalado con StandardScaler usando Scikit-Learn.
Crea un archivo .ipynb
que realice lo siguiente desde cero:
- Crea o simula un pequeño dataset (por ejemplo, mediante listas o arrays) que contenga al menos una columna numérica con valores faltantes y otra sin preprocesar.
- Utiliza
SimpleImputer
del módulosklearn.impute
para completar los valores faltantes en la columna numérica, aplicando la estrategia de la media. - Aplica
StandardScaler
del módulosklearn.preprocessing
para escalar las características del dataset. - Muestra en pantalla el dataset original y el dataset preprocesado, destacando las transformaciones aplicadas.
Todos los ejercicios de programación de ScikitLearn
Evalúa tus conocimientos con ejercicios de programación en ScikitLearn de tipo Test, Puzzle, Código y Proyecto con VSCode.
Tutorial para resolver este ejercicio de programación
ScikitLearn
Introducción al preprocesamiento de datos
Preprocesamiento de datos