Databricks
Databricks ·Big Data·Ciencia de Datos
Curso completo de Databricks para perfiles técnicos que construyen y operan plataformas lakehouse multi-cloud, integrando ingesta, transformación, machine learning y analítica gobernada. Cubres Spark SQL y DataFrames, Delta Lake, pipelines ETL con arquitectura medallion, gobierno con Unity Catalog, ciclo de vida de modelos con MLflow y aplicaciones GenAI con vector search. Al terminar entregas un proyecto integrador end-to-end con datos gobernados y serving en producción.
¿Prefieres verlo en directo? Agenda una demo sin compromiso.
Formación corporativa: este curso se activa bajo pedido para tu organización. Adaptamos temario, calendario y modalidad (teleformación, aula virtual o mixto).
Contenido del curso
Plataforma lakehouse para data engineering, analytics, ML y GenAI.
-
Introducción a Databricks Lección
-
Lakehouse architecture Lección
-
Workspace de Databricks Lección
-
Clusters en Databricks Lección
-
Notebooks en Databricks Lección
-
Test de fundamentos de Databricks Test
Detalles del curso
Público objetivo
- Data engineers que necesitan construir y orquestar pipelines de datos escalables con Spark, Delta Lake y DLT.
- Data analysts que quieren aprovechar Spark SQL, DBSQL Serverless, dashboards y AI/BI Genie.
- Data scientists e ingenieros de ML que buscan gestionar el ciclo de vida completo de modelos con MLflow y Model Serving.
- Arquitectos de datos que diseñan plataformas lakehouse con gobernanza, linaje, Delta Sharing y cumplimiento normativo.
- Equipos de plataforma que administran entornos Databricks y optimizan costes, serverless y CI/CD con Asset Bundles.
Contenido del roadmap
Fundamentos, instalación y Spark
Lakehouse architecture, workspace, clusters, notebooks, Community Edition, Spark SQL, DataFrames y lectura/escritura de datos.
Delta Lake 3+ y ETL
Transacciones ACID, time travel, schema evolution, MERGE/UPDATE/DELETE, OPTIMIZE y Z-ORDER, Delta UniForm, medallion architecture, Auto Loader con volumes y Delta Live Tables serverless con expectations.
Gobernanza y Machine Learning
Unity Catalog GA con linaje automático y volumes, Lakehouse Federation, Delta Sharing, MLflow 2+, experiment tracking, Model Registry en UC con aliases champion y challenger, Feature Store y AutoML.
GenAI, AI/BI y producción
Mosaic AI Model Serving con scale-to-zero, Foundation Model APIs (DBRX, Llama, Mixtral), Vector Search gestionado, RAG, AI Playground, Databricks Assistant, Databricks AI/BI Genie, Workflows serverless, scheduling, observabilidad, costes y Databricks Asset Bundles.
Proyecto integrador
Pipeline end-to-end sobre Databricks con Unity Catalog, Auto Loader, Delta Live Tables, MLflow con registro en UC, Mosaic AI Model Serving y AI/BI Genie, orquestado con Databricks Workflows serverless y empaquetado como Databricks Asset Bundle.
Objetivos de aprendizaje
- Procesar datos a escala con Spark SQL y DataFrames en notebooks multi-lenguaje de Databricks.
- Diseñar pipelines ETL con Delta Lake, medallion architecture y Delta Live Tables serverless con validación de calidad.
- Gobernar datos con Unity Catalog GA: catálogos, esquemas, tablas, volumes, permisos, linaje y Delta Sharing.
- Gestionar el ciclo de vida de modelos de ML con MLflow 2+ y Model Registry en UC con aliases champion y challenger.
- Construir aplicaciones de IA generativa con Mosaic AI Model Serving, Foundation Model APIs, Vector Search y RAG.
- Explotar Databricks AI/BI Genie para analítica conversacional sobre tablas gobernadas.
- Desplegar, observar y optimizar costes de cargas en producción con Workflows serverless y Databricks Asset Bundles.
Otros cursos de Databricks
Databricks - Fundamentos
Curso de fundamentos de Databricks para profesionales de datos que se inician en la plataforma lakehouse. Cubres la arquitectura del workspace y los clusters, el procesamiento a escala con Spark SQL y DataFrames en PySpark, y Delta Lake como formato de tabla abierto con transacciones ACID, time travel y evolución de esquema. Al terminar trabajas con notebooks, ejecutas pipelines básicos y aplicas Delta Lake con criterio sobre tus datos.
Databricks - GenAI en Databricks y Producción
Curso de Databricks centrado en construir aplicaciones de IA generativa empresariales y llevarlas a producción sobre la plataforma. Cubres model serving con escalado automático, búsqueda vectorial, patrones RAG sobre datos gobernados, analítica conversacional y empaquetado de proyectos para CI/CD. Al terminar entregas casos de uso GenAI integrados con el lakehouse y desplegados con criterio operativo.
Databricks - Módulos avanzados
Curso avanzado de Databricks para equipos técnicos que ya dominan los fundamentos y necesitan profundizar en los bloques que sostienen una plataforma lakehouse en producción. Cubres pipelines ETL serverless con arquitectura medallion, gobierno corporativo de datos con Unity Catalog y el ciclo de vida completo de modelos de machine learning. Al terminar diseñas y operas la capa analítica y de ML de una organización con criterio profesional.
Forma equipos completos con un itinerario
Este curso aparece dentro de las siguientes carreras corporativas.
Data Analytics
Carrera profesional de Data Analytics para analistas de negocio, BI y consultoría: dominio de SQL para exploración y modelado, Python con pandas y NumPy para análisis, visualización avanzada con Power BI, Plotly, Matplotlib y Seaborn, transformación con dbt, procesamiento en Databricks y Streamlit para aplicaciones analíticas orientadas a la toma de decisiones en banca, seguros, retail, energía y consultoras.
Data Engineering
Carrera profesional de Data Engineering para equipos que construyen plataformas de datos corporativas: Python, SQL, pandas, streaming con Kafka, orquestación con Airflow, transformación con dbt, procesamiento distribuido con PySpark y Databricks para implantar data lakehouses y pipelines ETL/ELT robustos.
¿Formación para tu equipo en esta tecnología?
Tú nos dices a quién formar y nosotros configuramos la plataforma con tu marca, damos de alta a tu gente, evaluamos las entregas con IA y te entregamos los certificados y los informes técnicos para tu gestor FUNDAE. Catálogo amplio con teleformación, aula virtual o mixto. Sin permanencia, sin coste de setup.
¿Prefieres verlo en directo? Agenda una demo.
Preguntas frecuentes
- ¿Databricks es bonificable por FUNDAE para mi empresa?
- Puede ser bonificable cuando la acción cumple los requisitos aplicables. La plataforma aporta evidencias técnicas: seguimiento de tiempos, registro de conexiones, foros, encuestas y certificados para que tu entidad organizadora o gestoría revise la documentación.
- ¿En qué modalidades se imparte Databricks?
- En tres modalidades: teleformación (online asíncrona), aula virtual privada en directo y mixta. Adaptamos temario, calendario y modalidad al equipo.
- ¿Se adapta Databricks al nivel de mi equipo?
- Sí. Adaptamos temario, calendario y modalidad al nivel y al stack del equipo, con ejercicios evaluados por IA y certificado verificable.
- ¿Cuánto tarda en activarse para mi empresa?
- La activación corporativa estándar es rápida, sin coste de setup ni permanencia.