Descripción
Desarrolla un notebook en Python que aplique preprocesamiento a un conjunto de datos simple, utilizando técnicas de imputación de valores faltantes y escalado, demostrando la importancia de preparar los datos antes del modelado.
Crea un archivo .ipynb
que realice lo siguiente desde cero:
Guarda tu progreso
Inicia sesión para no perder tu progreso y accede a miles de tutoriales, ejercicios prácticos y nuestro asistente de IA.
Más de 25.000 desarrolladores ya confían en CertiDevs
- Crea o simula un pequeño dataset (por ejemplo, mediante listas o arrays) que contenga al menos una columna numérica con valores faltantes y otra sin preprocesar. Ejemplo:
data = {
'feature_num': [10, 15, np.nan, 20, 25, np.nan, 30],
'feature_constante': [1, 1, 1, 1, 1, 1, 1]
}
df_original = pd.DataFrame(data)
- Utiliza
SimpleImputer
del módulosklearn.impute
para completar los valores faltantes en la columna numérica, aplicando la estrategia de la media. - Aplica
StandardScaler
del módulosklearn.preprocessing
para escalar las características del dataset. - Muestra en pantalla el dataset original y el dataset preprocesado, destacando las transformaciones aplicadas.
Solución al ejercicio
¡Desbloquea la solución completa!
Completa el examen para acceder a la solución paso a paso, explicaciones detalladas y mejores prácticas.
Practica con exámenes de ScikitLearn
Mejora tus habilidades con cientos de exámenes de práctica, recibe retroalimentación instantánea y obtén tu certificación cuando estés listo.
Retroalimentación
Aprende de tus errores
Progreso
Mide tu avance
Certificación
Valida tus habilidades
Únete a miles de desarrolladores mejorando sus habilidades