Descripción
Reto de creación de un pipeline básico en Python usando ScikitLearn.
En este reto, crearás un pipeline básico usando ScikitLearn que realice una serie de transformaciones y finalmente entrene un modelo de clasificación sobre el conjunto de datos 'load_breast_cancer' proporcionado por ScikitLearn. El objetivo es evaluar tus habilidades en la construcción y el manejo de pipelines utilizando herramientas modernas de desarrollo de aprendizaje automático.
Guarda tu progreso
Inicia sesión para no perder tu progreso y accede a miles de tutoriales, ejercicios prácticos y nuestro asistente de IA.
Más de 25.000 desarrolladores ya confían en CertiDevs
- Carga de datos: Importe los datos usando load_breast_cancer() de sklearn.datasets.
- División de datos: Divida los datos en conjuntos de entrenamiento y prueba.
- Creación del Pipeline: Siéntete libre de importar cualquier transformación adicional que consideres necesaria.
- Incluye las siguientes etapas: imputación de valores faltantes con SimpleImputer usando la mediana, estandarización con StandardScaler, un PCA de 3 componentes y un modelo de clasificación como LogisticRegression).
- Entrenamiento: Ajusta el Pipeline utilizando el conjunto de entrenamiento.
- Evaluación: Realiza predicciones sobre el conjunto de prueba y evalúa el modelo usando la métrica accuracy.
- Resultado: Imprime la precisión del modelo.
El Pipeline debe estar construido de forma que los preprocesamientos se ejecuten en el orden correcto, preservando la integridad de los datos.
Solución al ejercicio
¡Desbloquea la solución completa!
Completa el examen para acceder a la solución paso a paso, explicaciones detalladas y mejores prácticas.
Practica con exámenes de ScikitLearn
Mejora tus habilidades con cientos de exámenes de práctica, recibe retroalimentación instantánea y obtén tu certificación cuando estés listo.
Retroalimentación
Aprende de tus errores
Progreso
Mide tu avance
Certificación
Valida tus habilidades
Únete a miles de desarrolladores mejorando sus habilidades