Descripción
Desarrolla un notebook en Python que utilice la función train_test_split de Scikit-Learn para particionar un dataset simulado en conjuntos de entrenamiento y prueba, garantizando la reproducción de resultados y manteniendo la proporción de clases (estratificación).
Crea un archivo .ipynb
desde cero que realice lo siguiente:
Guarda tu progreso
Inicia sesión para no perder tu progreso y accede a miles de tutoriales, ejercicios prácticos y nuestro asistente de IA.
Más de 25.000 desarrolladores ya confían en CertiDevs
- Genera un dataset simulado utilizando pandas, que contenga al menos dos columnas de características (por ejemplo, "feature_1" y "feature_2") y una columna de etiquetas denominada "Clase" con valores binarios (0 y 1), asegurándote de que ambas clases estén representadas de forma razonable.
- Utiliza la función
train_test_split
de Scikit-Learn para dividir el dataset en un conjunto de entrenamiento (70 % de los datos) y un conjunto de prueba (30 % de los datos). Asegúrate de:- Fijar la semilla con el parámetro
random_state
(por ejemplo, 42) para lograr reproducibilidad. - Barajar los datos antes de la partición.
- Aplicar la estratificación con el parámetro
stratify
para mantener la proporción de clases en ambos conjuntos.
- Fijar la semilla con el parámetro
- Muestra en pantalla:
- Las dimensiones (número de muestras) de los conjuntos de entrenamiento y prueba.
- La distribución de las clases en cada conjunto (por ejemplo, utilizando
value_counts(normalize=True)
).
Solución al ejercicio de programación en ScikitLearn
¡Desbloquea la solución completa!
Completa el ejercicio de programación en ScikitLearn para acceder a la solución paso a paso, explicaciones detalladas y mejores prácticas.
Practica con ejercicios de programación en ScikitLearn
Mejora tus habilidades con cientos de ejercicios de práctica, recibe retroalimentación instantánea y obtén tu certificación cuando estés listo.
Asistente de IA
Aprende de tus errores
Progreso
Mide tu avance
Certificación
Valida tus habilidades
Únete a miles de desarrolladores mejorando sus habilidades en ScikitLearn