Scikit-learn
Scikit Learn ·Ciencia de Datos
Curso completo de machine learning clásico con Scikit-learn en Python para construir modelos predictivos en proyectos empresariales. Cubre preprocesado de datos, regresión, clasificación, clustering, reducción de dimensionalidad, NLP, series temporales, validación de modelos, pipelines y despliegue con MLOps. Al terminar entregas modelos productivos con rigor metodológico y te incorporas a equipos de datos con autonomía.
¿Prefieres verlo en directo? Agenda una demo sin compromiso.
Formación corporativa: este curso se activa bajo pedido para tu organización. Adaptamos temario, calendario y modalidad (teleformación, aula virtual o mixto).
Contenido del curso
Machine learning clásico en Python: clasificación, regresión y pipelines.
-
Aprendizaje automático Lección
-
Introducción e instalación Lección
-
Introducción e instalación de Scikit Learn Ejercicio
Detalles del curso
Público objetivo
- Científicos de datos y analistas que quieren dominar Scikit-learn como herramienta principal de machine learning.
- Desarrolladores Python que necesitan incorporar modelos predictivos en sus aplicaciones.
- Perfiles que ya completaron la introducción y necesitan el curso completo de Scikit-learn.
Contenido del certificado
Módulo 1: Introducción al aprendizaje automático Conceptos fundamentales de machine learning Instalación de Scikit learn y exploración de datasets Módulo 2: Primer modelo supervisado Explorar un dataset con pandas y separar X e y Entrenar un primer clasificador y evaluar con accuracy Entrenar una primera regresión y medir el error Módulo 3: Preprocesado de datos Valores faltantes e imputación Escalado y normalización Codificación de variables categóricas Ingeniería y selección de características Extracción de características Particionamiento y datos desbalanceados Módulo 4: Regresión Regresión lineal y polinomial Regularización Ridge y Lasso KNN, SVM y árboles de decisión para regresión Ensembles y Random Forest para regresión Módulo 5: Clasificación Regresión logística KNN, SVM y árboles de decisión para clasificación Ensembles, Random Forest y Gradient Boosting Módulo 6: Aprendizaje no supervisado Reducción de dimensionalidad con PCA y t SNE Clustering con K Means, jerárquico y DBSCAN Módulo 7: NLP y procesamiento de textos Representación de texto con TF IDF y CountVectorizer Clasificación de textos y análisis de sentimiento Técnicas avanzadas de extracción de características Módulo 8: Series temporales Análisis y procesamiento de fechas Ingeniería de características temporales Normalización y validación cruzada temporal Módulo 9: Validación y optimización de modelos Métricas de regresión y clasificación Validación cruzada GridSearchCV y RandomizedSearchCV Módulo 10: Pipelines y despliegue Creación e implementación de pipelines Preprocesados y ColumnTransformer Validación cruzada con pipelines Exportación e importación con joblib Módulo 11: Boosting moderno, explicabilidad y MLOps XGBoost, LightGBM y CatBoost integrados con Scikit learn Explicabilidad de modelos con SHAP Codificación de categóricas con TargetEncoder y calibración de probabilidades Exportación a ONNX y registro de modelos con MLflow Proyectos integradores Proyecto de regresión con dataset Tips Proyecto de regresión con dataset Pokémon Proyecto de clasificación con dataset Diamonds
Objetivos de aprendizaje
- Aplicar el flujo completo de preprocesado de datos para preparar datasets para modelado.
- Entrenar y evaluar modelos de regresión y clasificación con múltiples algoritmos.
- Implementar técnicas de aprendizaje no supervisado para reducción de dimensionalidad y clustering.
- Procesar texto con técnicas de NLP y aplicar modelos de clasificación y análisis de sentimiento.
- Construir pipelines reproducibles y exportar modelos para su despliegue en producción.
- Validar modelos con métricas adecuadas, validación cruzada y optimización de hiperparámetros.
Otros cursos de Scikit Learn
Scikit Learn - Aprendizaje no supervisado
Curso de aprendizaje no supervisado con Scikit-learn para descubrir patrones y estructuras en datos sin etiquetar. Cubre clustering con K-Means, jerárquico y DBSCAN, reducción de dimensionalidad con PCA y t-SNE, métodos de densidad y selección del número óptimo de grupos. Al terminar segmentas clientes, detectas anomalías y comprimes datasets de alta dimensión con criterio metodológico.
Scikit Learn - Boosting moderno, explicabilidad y MLOps
Curso avanzado de machine learning con Scikit-learn y su ecosistema para cerrar el ciclo de vida completo de un modelo en producción. Cubre boosting moderno con librerías de gradiente como XGBoost, LightGBM y CatBoost, explicabilidad de modelos con SHAP, trazabilidad de experimentos con MLflow y prácticas de MLOps integradas. Al terminar despliegas modelos auditables, justificas sus predicciones y mantienes un registro reproducible del entrenamiento.
Scikit Learn - Clasificación
Curso de clasificación supervisada con Scikit-learn para predecir etiquetas discretas en problemas reales como detección de fraude, diagnóstico médico o segmentación de clientes. Cubre regresión logística, k-vecinos, máquinas de soporte vectorial, árboles de decisión y ensembles como Random Forest y Gradient Boosting, con métricas adecuadas para datos desbalanceados. Al terminar entregas clasificadores robustos y evalúas su rendimiento con criterio profesional.
Scikit Learn - NLP
Curso de procesamiento de lenguaje natural con Scikit-learn para clasificar documentos y extraer información de texto en proyectos empresariales. Cubre vectorización con CountVectorizer y TF-IDF, preprocesado lingüístico, clasificación de textos, análisis de sentimiento y técnicas avanzadas de extracción de características antes de saltar a transformers. Al terminar entregas modelos NLP sólidos para casos de uso como moderación, atención al cliente o categorización documental.
Forma equipos completos con un itinerario
Este curso aparece dentro de las siguientes carreras corporativas.
¿Formación para tu equipo en esta tecnología?
Tú nos dices a quién formar y nosotros configuramos la plataforma con tu marca, damos de alta a tu gente, evaluamos las entregas con IA y te entregamos los certificados y los informes técnicos para tu gestor FUNDAE. Catálogo amplio con teleformación, aula virtual o mixto. Sin permanencia, sin coste de setup.
¿Prefieres verlo en directo? Agenda una demo.
Preguntas frecuentes
- ¿Scikit-learn es bonificable por FUNDAE para mi empresa?
- Puede ser bonificable cuando la acción cumple los requisitos aplicables. La plataforma aporta evidencias técnicas: seguimiento de tiempos, registro de conexiones, foros, encuestas y certificados para que tu entidad organizadora o gestoría revise la documentación.
- ¿En qué modalidades se imparte Scikit-learn?
- En tres modalidades: teleformación (online asíncrona), aula virtual privada en directo y mixta. Adaptamos temario, calendario y modalidad al equipo.
- ¿Se adapta Scikit-learn al nivel de mi equipo?
- Sí. Adaptamos temario, calendario y modalidad al nivel y al stack del equipo, con ejercicios evaluados por IA y certificado verificable.
- ¿Cuánto tarda en activarse para mi empresa?
- La activación corporativa estándar es rápida, sin coste de setup ni permanencia.