Saltar al contenido principal
Databricks
Plataforma Big Data Ciencia de Datos

Formación corporativa en Databricks

Plataforma lakehouse para data engineering, analytics, ML y GenAI.

Evidencias FUNDAE Activación guiada Evaluación con IA Itinerario a medida

¿Prefieres verlo en directo? Agenda una demo sin compromiso.

Resumen del itinerario en Databricks

Para qué equipos

Equipos técnicos que incorporan Databricks a su stack productivo o consolidan competencias antes de un proyecto crítico. Adaptamos el temario al nivel de partida y al stack acompañante.

Qué se trabaja

Lecciones aplicadas y ejercicios prácticos en Databricks resueltos en el IDE del navegador, con corrección automática por IA y proyectos integradores revisados con rúbrica explícita.

Cómo se contrata

Propuesta concreta sobre teleformación, aula virtual o plan mixto. Sin coste de setup, sin permanencia, con evidencias FUNDAE exportables para la entidad organizadora.

Activación en 3 pasos

Diseñamos el itinerario, el alcance y el calendario según el nivel y el stack de tu equipo. Evidencias FUNDAE exportables, sin permanencia ni coste de setup.

  1. 1 Demo o llamada
    30 min con el fundador. Cuéntanos el stack, el nivel y el calendario.
  2. 2 Propuesta
    Itinerario y modalidad (teleformación, aula virtual o mixto) con evidencias FUNDAE exportables.
  3. 3 Tenant activo
    Tu equipo entra con SSO, asignaciones automáticas y panel admin completo.

¿Prefieres verlo en directo? Agenda una demo sin compromiso.

Qué incluye la formación

Toda la plataforma CertiDevs disponible para tu equipo durante el itinerario. Sin costes ocultos ni módulos premium.

Entornos de programación online, sin instalar nada en el equipo del alumno.
Evaluación con IA de cada ejercicio de código, proyecto y ensayo, con feedback y nota.
Certificado verificable con NIF del alumno y firma digital de CertiDevs.
Panel admin de empresa: alta masiva CSV, asignaciones, foros y encuestas.
Rol inspector FUNDAE con acceso de solo lectura a actividad y resultados.
Reportes exportables en Excel: accesos, progreso, completion y satisfacción.
Integración con tu LMS: LTI 1.1 + 1.3 Deep Linking y exportación SCORM 1.2.
SSO con tu Active Directory (OIDC, Microsoft Entra, Google Workspace).
White-label opcional: subdominio propio, logo y tema de tu marca.
Pruebas técnicas: mismos exámenes para evaluar candidatos en selección.
Foros y mensajería tutorial integrados, requisito FUNDAE cubierto de serie.
Soporte directo de nuestro equipo durante toda la formación.

Cursos disponibles en Databricks

Cada curso se puede asignar de forma independiente o combinar en un plan formativo.

Curso completo Databricks

Curso completo de Databricks para perfiles técnicos que construyen y operan plataformas lakehouse multi-cloud, integrando ingesta, transformación, machine learning y analítica gobernada. Cubres Spark SQL y DataFrames, Delta Lake, pipelines ETL con arquitectura medallion, gobierno con Unity Catalog, ciclo de vida de modelos con MLflow y aplicaciones GenAI con vector search. Al terminar entregas un proyecto integrador end-to-end con datos gobernados y serving en producción.

Ver curso
Especialización Databricks - Fundamentos

Curso de fundamentos de Databricks para profesionales de datos que se inician en la plataforma lakehouse. Cubres la arquitectura del workspace y los clusters, el procesamiento a escala con Spark SQL y DataFrames en PySpark, y Delta Lake como formato de tabla abierto con transacciones ACID, time travel y evolución de esquema. Al terminar trabajas con notebooks, ejecutas pipelines básicos y aplicas Delta Lake con criterio sobre tus datos.

Ver curso
Especialización Databricks - GenAI en Databricks y Producción

Curso de Databricks centrado en construir aplicaciones de IA generativa empresariales y llevarlas a producción sobre la plataforma. Cubres model serving con escalado automático, búsqueda vectorial, patrones RAG sobre datos gobernados, analítica conversacional y empaquetado de proyectos para CI/CD. Al terminar entregas casos de uso GenAI integrados con el lakehouse y desplegados con criterio operativo.

Ver curso
Especialización Databricks - Módulos avanzados

Curso avanzado de Databricks para equipos técnicos que ya dominan los fundamentos y necesitan profundizar en los bloques que sostienen una plataforma lakehouse en producción. Cubres pipelines ETL serverless con arquitectura medallion, gobierno corporativo de datos con Unity Catalog y el ciclo de vida completo de modelos de machine learning. Al terminar diseñas y operas la capa analítica y de ML de una organización con criterio profesional.

Ver curso

Ver todos los cursos del catálogo

Stacks habituales que las empresas combinan en sus planes formativos junto a Databricks.

Estructura del itinerario

Módulos, lecciones y ejercicios del itinerario

En este módulo se presentan los conceptos esenciales de Databricks: que es la plataforma, su origen como proyecto de los creadores de Apache Spark y la filosofía lakehouse que unifica data lake y data warehouse. Se exploran los componentes principales del workspace, los tipos de clusters (all-purpose y job), el autoscaling y los notebooks multi-lenguaje con soporte para Python, SQL, Scala y R.

  • Introducción a Databricks Lección
  • Lakehouse architecture Lección
  • Workspace de Databricks Lección
  • Clusters en Databricks Lección
  • Notebooks en Databricks Lección
  • Test de fundamentos de Databricks Test

Modalidades de contratación

Elige la modalidad que mejor se adapte a tu organización. Sin permanencia ni coste de setup.

Teleformación

Acceso autónomo al itinerario en la plataforma: lecciones, vídeos, ejercicios evaluados por IA y proyecto integrador. Con tutorización y foro técnico.

Solicitar propuesta

Aula virtual privada

Sesiones en directo sobre cohorte cerrada del cliente. Práctica guiada, resolución de dudas, evaluación al cierre y evidencias exportables.

Solicitar propuesta

Plan mixto

Teleformación con sesiones en directo intercaladas. Equilibra autonomía del alumno con hitos guiados, revisión de proyectos y feedback síncrono.

Solicitar propuesta

Sobre Databricks

Databricks Desde 2013 Documentación oficial

Databricks es la plataforma lakehouse unificada de datos e inteligencia artificial, basada en Apache Spark y fundada por sus creadores. Ofrece un entorno colaborativo multi-lenguaje (Python, SQL, Scala y R) sobre notebooks, con compute clásico y serverless, para consolidar data engineering, analítica, machine learning e IA generativa sobre una única plataforma gobernada.

La plataforma se apoya en varios pilares. Unity Catalog en disponibilidad general centraliza la gobernanza sobre un único metastore por región con jerarquía de catálogos, esquemas, tablas, volumes y modelos, linaje automático de columnas, Lakehouse Federation hacia fuentes externas y Delta Sharing para compartir datos entre organizaciones. Delta Lake 3+ aporta transacciones ACID, time travel, schema evolution y Delta UniForm para interoperar con Apache Iceberg sin duplicar datos. Delta Live Tables define pipelines declarativos con expectations de calidad, streaming y despliegue serverless, y se apoya en Auto Loader con cloudFiles para ingesta incremental sobre volumes gestionados.

El stack de analítica e IA incluye DBSQL Serverless y dashboards, Databricks AI/BI con Genie rooms para analítica conversacional sobre tablas gobernadas, Databricks Assistant como copiloto integrado en notebooks, MLflow 2+ con Model Registry en Unity Catalog (aliases champion/challenger y linaje), Feature Store con online tables, Mosaic AI Model Serving con endpoints serverless y scale-to-zero para modelos propios, Foundation Model APIs (DBRX, Llama, Mixtral) y modelos externos, y Vector Search con índices gestionados sobre Delta y sincronización automática.

Este curso te guía desde los fundamentos de la arquitectura lakehouse hasta el despliegue de pipelines de datos e IA en producción con Databricks Workflows serverless y Databricks Asset Bundles. Aprenderás a procesar datos con Spark SQL y DataFrames, diseñar pipelines ETL con la medallion architecture, gobernar datos con Unity Catalog, entrenar y desplegar modelos con MLflow, construir aplicaciones de IA generativa con RAG, y entregar un proyecto integrador completo.

Qué incluye este itinerario

  • Fundamentos: qué es Databricks, lakehouse architecture, workspace, clusters y notebooks multi-lenguaje.
  • Instalación y entorno: Community Edition, configuración del workspace, notebooks y DBFS heredado frente a volumes.
  • Spark SQL y DataFrames: consultas SQL, DataFrames con PySpark, transformaciones, acciones y lectura/escritura de datos.
  • Delta Lake 3+: transacciones ACID, time travel, schema evolution, MERGE/UPDATE/DELETE, OPTIMIZE, Z-ORDER y Delta UniForm.
  • ETL pipelines: medallion architecture (bronze/silver/gold), Auto Loader y Delta Live Tables serverless con data quality.
  • Unity Catalog GA: metastore, catálogos, esquemas, tablas, volumes, gobernanza, linaje y Delta Sharing.
  • Machine Learning: MLflow 2+, experiment tracking, Model Registry en UC, Feature Store y AutoML.
  • GenAI: Mosaic AI Model Serving, Foundation Model APIs, Vector Search, RAG, AI Playground y Databricks Assistant.
  • Producción: Workflows serverless, scheduling, observabilidad, gestión de costes y Databricks Asset Bundles.
  • Proyecto integrador: pipeline end-to-end con Unity Catalog, Auto Loader, DLT, MLflow y AI/BI Genie orquestado con Workflows serverless.

Público objetivo

  • Data engineers que necesitan construir y orquestar pipelines de datos escalables con Spark y Delta Lake.
  • Data analysts que quieren aprovechar Spark SQL, notebooks y dashboards en una plataforma unificada.
  • Data scientists e ingenieros de ML que buscan gestionar el ciclo de vida completo de modelos con MLflow y Feature Store.
  • Arquitectos de datos que diseñan plataformas lakehouse con gobernanza, linaje y cumplimiento normativo.
  • Equipos de plataforma que administran entornos Databricks y optimizan costes e infraestructura.

Prerrequisitos: conocimientos básicos de SQL y Python, familiaridad con conceptos de datos (tablas, transformaciones, ETL) y nociones de cloud computing.

¿Necesitas un itinerario completo?

Este curso puede formar parte de una carrera profesional que combine varias tecnologías. Explora nuestros itinerarios o te diseñamos uno a medida para tu equipo.

Plan formativo de Databricks para tu equipo

Recibe una propuesta concreta: modalidad, alcance, calendario y evidencias FUNDAE exportables. Damos de alta a tu equipo, configuramos la plataforma con tus dominios y entregamos certificados verificables e informes para tu entidad organizadora. Sin coste de setup, sin permanencia.

¿Prefieres verlo en directo? Agenda una demo sin compromiso.

Formación en Databricks: preguntas frecuentes

¿La formación en Databricks para empresas es bonificable por FUNDAE?
Puede ser bonificable cuando la acción cumple los requisitos aplicables. La plataforma aporta evidencias técnicas: seguimiento de tiempos, registro de conexiones, foros, encuestas y certificados para que tu entidad organizadora o gestoría revise la documentación.
¿En qué modalidades se imparte la formación en Databricks?
En tres modalidades: teleformación (online asíncrona), aula virtual privada en directo y mixta. Adaptamos temario, calendario y modalidad al equipo.
¿Se adapta el temario de Databricks al nivel de mi equipo?
Sí. Ajustamos el itinerario de Databricks al nivel y al stack de tu equipo, con ejercicios evaluados por IA y certificado verificable. La activación corporativa se acuerda durante la fase de propuesta.
¿Cómo se evalúa a los alumnos?
Con ejercicios corregidos automáticamente por IA (test, puzle, código, proyecto y ensayo), detección de entregas generadas con IA y certificados verificables por URL.