Ejercicio de programación con ScikitLearn: Métricas de clasificación
0h 30m
Aprende a implementar métricas de clasificación usando Scikit-Learn, enfocándote en matriz de confusión, precisión, recall y F1-score.
En este reto, debes implementar un modelo de clasificación utilizando Scikit-Learn y evaluar su rendimiento utilizando métricas específicas para analizar su capacidad predictiva. Te enfocarás en la creación de una matriz de confusión y el cálculo de precisión, recall y F1-score para verificar la calidad del modelo.
Carga de Datos: Utiliza el conjunto de datos iris
proporcionado por Scikit-Learn. Accede a él con la función load_iris
que proporciona el dataset ya particionado en datos y etiquetas.
División del conjunto de fatos: Separa los datos en conjuntos de entrenamiento y prueba utilizando train_test_split
. Utiliza un tamaño del 30% para el conjunto de prueba y asegúrate de reproducir los resultados con un random_state
de 42.
Modelo de clasificación: Crea y entrena un modelo de clasificación utilizando RandomForestClassifier
del módulo ensemble
de Scikit-Learn. No realices modificaciones en el hiperparámetro estándar.
Predicciones: Usa el modelo entrenado para realizar predicciones en el conjunto de prueba.
Evaluación del modelo:
- Calcula la matriz de confusión para las etiquetas de prueba utilizando
confusion_matrix
. - Evalúa las métricas de accuracy, precisión, recall y F1-Score para cada clase utilizando
classification_report
. Asegúrate de imprimir este reporte para una visualización clara.
Visualización: Realiza una visualización gráfica de la matriz de confusión utilizando ConfusionMatrixDisplay
y matplotlib
. Ajusta la visualización para que sea clara y legible, usando la colormap Blues
o viridis.
Todos los ejercicios de programación de ScikitLearn
Evalúa tus conocimientos con ejercicios de programación en ScikitLearn de tipo Test, Puzzle, Código y Proyecto con VSCode.
Regresión SVM con SVR
Ajuste de hiperparámetros
Pipelines y Validación Cruzada
Preprocesamiento de datos desbalanceados
Pipelines con ColumnTransformer
Validación y evaluación de modelos
Preprocesamiento de datos de series temporales
Identificación y tratamiento de valores faltantes
Ingeniería de características para series temporales
Introducción a la clasificación
Transformación y escalado de series temporales
Extracción de características
Clasificación KNN KNeighborsClassifier
Regresión con algoritmos de conjunto
Regresión lineal
Reducción de la dimensionalidad con PCA
Clasificación con algoritmos de conjunto
Clasificación SVM con SVC
Escalado de datos
Clustering jerárquico
Análisis de sentimiento
Validación y evaluación de modelos en series temporales
Regresión KNN KNeighborsRegressor
Técnicas de validación cruzada
Introducción al preprocesamiento de datos
Exportar e importar Pipelines
Preprocesamiento de textos para NLP
Clasificación con árboles DecisionTreeClassifier
Selección de Características
Introducción a la regresión
Clasificación con regresión logística en Scikit Learn
Ingeniería de Características
Clustering con KMeans
Introducción al análisis de series temporales
Codificación de variables categóricas
Clasificación de Texto con Scikit Learn
Métricas de Regresión
Aprendizaje automático
Clustering de densidad con DBSCAN
Técnicas avanzadas de extracción de características
Creación de pipelines básicos
Particionamiento de datos
Normalización de datos
Regresión con árboles DecisionTreeRegressor
Introducción e instalación de Scikit Learn
Preprocesamiento de datos con pipelines
Representación de texto y extracción de características
Introducción a pipelines
Tutorial para resolver este ejercicio de programación
ScikitLearn
Métricas de clasificación
Validación de modelos