Descripción
Crea un modelo de clustering con Scikit-Learn.
Tu tarea es aplicar el algoritmo KMeans para agrupar un conjunto de datos de vinos con diferentes características. El objetivo es identificar clústeres naturales en el conjunto de datos y analizar la separación entre estos grupos.
Guarda tu progreso
Inicia sesión para no perder tu progreso y accede a miles de tutoriales, ejercicios prácticos y nuestro asistente de IA.
Más de 25.000 desarrolladores ya confían en CertiDevs
Carga del conjunto de datos: Usa el conjunto de datos 'wine'
disponible en Scikit Learn. Este conjunto contiene tres tipos de vinos con sus respectivas características químicas.
Preprocesamiento: Escala las características del conjunto de datos para asegurar que todas contribuyan de manera uniforme al clustering.
Implementación de KMeans:
- Utiliza KMeans para agrupar los datos en tres clústeres.
- Asegúrate de establecer la semilla de aleatoriedad en 42 para reproducibilidad.
Evaluación:
- Calcula e imprime la inercia del modelo.
- Calcula y muestra el coeficiente de silueta promedio para evaluar la calidad del clustering.
Visualización:
- Reduce las dimensionalidad de los datos a dos dimensiones usando PCA para facilitar la visualización.
- Muestra un gráfico de dispersión de los dos componentes principales coloreado por clúster.
Comparación:
- Imprime cuántos vinos pertenecen a cada clúster.
Solución al ejercicio
¡Desbloquea la solución completa!
Completa el examen para acceder a la solución paso a paso, explicaciones detalladas y mejores prácticas.
Practica con exámenes de ScikitLearn
Mejora tus habilidades con cientos de exámenes de práctica, recibe retroalimentación instantánea y obtén tu certificación cuando estés listo.
Retroalimentación
Aprende de tus errores
Progreso
Mide tu avance
Certificación
Valida tus habilidades
Únete a miles de desarrolladores mejorando sus habilidades