Descripción
Reto de extracción de características usando word embeddings y pipelines en Scikit Learn.
En este reto, aplicarás tus conocimientos sobre palabra embeddings y pipelines para integrarlos dentro de Scikit Learn. Vamos a utilizar los embeddings de GloVe para representar un conjunto de datos textuales, que luego se utilizarán para entrenar un modelo de clasificación binaria. Trabajarás con el conjunto de datos fetch_20newsgroups
proporcionado por Scikit Learn, que contiene una colección de noticias agrupadas en 20 categorías diferentes.
Carga del dataset: Utiliza fetch_20newsgroups
para cargar el conjunto de datos. Escoge las categorías comp.sys.mac.hardware
y rec.motorcycles
para ser tus etiquetas.
Carga de embeddings preentrenados: Descarga y carga los embeddings de GloVe preentrenados disponibles online en Kaggle (e.g., glove.6B.50d.txt) en un diccionario para su fácil manejo.
Creación de un transformador de embeddings: Implementa un transformador personalizado que convierta el texto del conjunto de datos en representaciones vectoriales usando los embeddings de GloVe cargados.
Guarda tu progreso
Inicia sesión para no perder tu progreso y accede a miles de tutoriales, ejercicios prácticos y nuestro asistente de IA.
Más de 25.000 desarrolladores ya confían en CertiDevs
Definición del pipeline de Scikit Learn: Diseña un pipeline que incluya el transformador de embeddings y un clasificador como LogisticRegression
.
Entrenamiento y evaluación del modelo: Entrena tu modelo con el conjunto de entrenamiento y evalúa su rendimiento en el conjunto de prueba mostrando la precisión del modelo.
Solución al ejercicio
¡Desbloquea la solución completa!
Completa el examen para acceder a la solución paso a paso, explicaciones detalladas y mejores prácticas.
Practica con exámenes de ScikitLearn
Mejora tus habilidades con cientos de exámenes de práctica, recibe retroalimentación instantánea y obtén tu certificación cuando estés listo.
Retroalimentación
Aprende de tus errores
Progreso
Mide tu avance
Certificación
Valida tus habilidades
Únete a miles de desarrolladores mejorando sus habilidades