Ejercicio de programación con ScikitLearn: Introducción al preprocesamiento de datos

Código
Práctica
0h 15m

Resuelve el reto en Python que preprocesa un dataset: imputación de valores faltantes con SimpleImputer y escalado con StandardScaler usando Scikit-Learn.

Crea un archivo .ipynb que realice lo siguiente desde cero:

  1. Crea o simula un pequeño dataset (por ejemplo, mediante listas o arrays) que contenga al menos una columna numérica con valores faltantes y otra sin preprocesar.
  2. Utiliza SimpleImputer del módulo sklearn.impute para completar los valores faltantes en la columna numérica, aplicando la estrategia de la media.
  3. Aplica StandardScaler del módulo sklearn.preprocessing para escalar las características del dataset.
  4. Muestra en pantalla el dataset original y el dataset preprocesado, destacando las transformaciones aplicadas.
Empezar ejercicio de programación

Todos los ejercicios de programación de ScikitLearn

Evalúa tus conocimientos con ejercicios de programación en ScikitLearn de tipo Test, Puzzle, Código y Proyecto con VSCode.

Tutorial para resolver este ejercicio de programación

scikit-learn

ScikitLearn

Introducción al preprocesamiento de datos

Preprocesamiento de datos

Otros tutoriales de programación con ScikitLearn