Saltar al contenido principal
Apache Airflow
Plataforma Big Data DevOps

Formación corporativa en Apache Airflow

Orquesta pipelines de datos y workflows empresariales.

Evidencias FUNDAE Activación guiada Evaluación con IA Itinerario a medida

¿Prefieres verlo en directo? Agenda una demo sin compromiso.

Resumen del itinerario en Apache Airflow

Para qué equipos

Equipos técnicos que incorporan Apache Airflow a su stack productivo o consolidan competencias antes de un proyecto crítico. Adaptamos el temario al nivel de partida y al stack acompañante.

Qué se trabaja

Lecciones aplicadas y ejercicios prácticos en Apache Airflow resueltos en el IDE del navegador, con corrección automática por IA y proyectos integradores revisados con rúbrica explícita.

Cómo se contrata

Propuesta concreta sobre teleformación, aula virtual o plan mixto. Sin coste de setup, sin permanencia, con evidencias FUNDAE exportables para la entidad organizadora.

Activación en 3 pasos

Diseñamos el itinerario, el alcance y el calendario según el nivel y el stack de tu equipo. Evidencias FUNDAE exportables, sin permanencia ni coste de setup.

  1. 1 Demo o llamada
    30 min con el fundador. Cuéntanos el stack, el nivel y el calendario.
  2. 2 Propuesta
    Itinerario y modalidad (teleformación, aula virtual o mixto) con evidencias FUNDAE exportables.
  3. 3 Tenant activo
    Tu equipo entra con SSO, asignaciones automáticas y panel admin completo.

¿Prefieres verlo en directo? Agenda una demo sin compromiso.

Qué incluye la formación

Toda la plataforma CertiDevs disponible para tu equipo durante el itinerario. Sin costes ocultos ni módulos premium.

Entornos de programación online, sin instalar nada en el equipo del alumno.
Evaluación con IA de cada ejercicio de código, proyecto y ensayo, con feedback y nota.
Certificado verificable con NIF del alumno y firma digital de CertiDevs.
Panel admin de empresa: alta masiva CSV, asignaciones, foros y encuestas.
Rol inspector FUNDAE con acceso de solo lectura a actividad y resultados.
Reportes exportables en Excel: accesos, progreso, completion y satisfacción.
Integración con tu LMS: LTI 1.1 + 1.3 Deep Linking y exportación SCORM 1.2.
SSO con tu Active Directory (OIDC, Microsoft Entra, Google Workspace).
White-label opcional: subdominio propio, logo y tema de tu marca.
Pruebas técnicas: mismos exámenes para evaluar candidatos en selección.
Foros y mensajería tutorial integrados, requisito FUNDAE cubierto de serie.
Soporte directo de nuestro equipo durante toda la formación.

Cursos disponibles en Apache Airflow

Cada curso se puede asignar de forma independiente o combinar en un plan formativo.

Curso completo Apache Airflow

Curso completo de Apache Airflow para profesionales de datos que quieren dominar la orquestación de pipelines de extremo a extremo. Diseñas DAGs y operadores, paso de información entre tareas, integraciones con Spark y dbt, seguridad, monitorización, testing y despliegue en CI/CD. Al terminar entregas plataformas de orquestación versionadas y auditables, y te incorporas con autonomía a equipos de datos en proyectos empresariales o consultoras.

Ver curso
Especialización Apache Airflow - Fundamentos

Curso de fundamentos de Apache Airflow para profesionales de datos que dan sus primeros pasos en orquestación de pipelines. Comprendes la arquitectura, escribes DAGs idempotentes con dependencias y planificación claras, y usas los operadores principales para integrar Python, bases de datos y servicios externos. Al terminar construyes y mantienes flujos ETL/ELT versionados, y te incorporas con autonomía a equipos analíticos de proyectos empresariales.

Ver curso
Especialización Apache Airflow - Módulos avanzados

Curso avanzado de Apache Airflow para profesionales de datos que ya dominan los fundamentos. Trabajas con sensores y hooks para esperar eventos externos, paso de información entre tareas con XCom y TaskFlow API, e integraciones con el resto del ecosistema analítico. Al terminar construyes pipelines más expresivos y desacoplados, y te incorporas con autonomía a equipos que orquestan plataformas de datos en proyectos empresariales.

Ver curso
Especialización Apache Airflow - Seguridad, producción, CI/CD y testing

Curso de Apache Airflow centrado en llevar pipelines a producción con garantías. Trabajas con control de acceso, gestión de secretos, logging remoto, monitorización y alertas de SLA, y completas el ciclo con testing de DAGs y CI/CD. Al terminar entregas plataformas de orquestación auditables y desplegables de forma repetible, listas para equipos enterprise donde la fiabilidad del scheduler es crítica para el negocio.

Ver curso

Ver todos los cursos del catálogo

Stacks habituales que las empresas combinan en sus planes formativos junto a Apache Airflow.

Estructura del itinerario

Módulos, lecciones y ejercicios del itinerario

En este módulo se presentan los conceptos esenciales de Apache Airflow como plataforma de orquestación de flujos de trabajo. Se explora que es Airflow y como se diferencia de otras herramientas de automatización, el modelo basado en DAGs (Directed Acyclic Graphs) para definir pipelines como código Python, la arquitectura del sistema con sus componentes principales (Scheduler, Webserver, Executor, Metadata DB) y los distintos tipos de executors disponibles para adaptar la ejecución a diferentes entornos y escalas de trabajo.

  • Introducción a Apache Airflow Lección
  • Concepto de DAG en Airflow Lección
  • Arquitectura de Apache Airflow Lección
  • Tipos de Executor en Airflow Lección
  • Test de fundamentos de Apache Airflow Test

Modalidades de contratación

Elige la modalidad que mejor se adapte a tu organización. Sin permanencia ni coste de setup.

Teleformación

Acceso autónomo al itinerario en la plataforma: lecciones, vídeos, ejercicios evaluados por IA y proyecto integrador. Con tutorización y foro técnico.

Solicitar propuesta

Aula virtual privada

Sesiones en directo sobre cohorte cerrada del cliente. Práctica guiada, resolución de dudas, evaluación al cierre y evidencias exportables.

Solicitar propuesta

Plan mixto

Teleformación con sesiones en directo intercaladas. Equilibra autonomía del alumno con hitos guiados, revisión de proyectos y feedback síncrono.

Solicitar propuesta

Sobre Apache Airflow

Apache Software Foundation Desde 2014 Documentación oficial

Apache Airflow es una plataforma de orquestación de flujos de trabajo de código abierto que permite programar, planificar y monitorizar pipelines de datos complejos. Creado originalmente en Airbnb en 2014 y donado a la Apache Software Foundation, Airflow se ha convertido en el estándar de facto para la orquestación de pipelines ETL/ELT y la automatización de procesos en el ecosistema de data engineering. Su modelo basado en DAGs (Directed Acyclic Graphs) definidos como código Python ofrece flexibilidad total para diseñar flujos de trabajo con dependencias, reintentos, scheduling y monitorización, siendo utilizado por empresas como Airbnb, Spotify, Twitter, Adobe y Lyft.

La rama Airflow 3 introduce cambios estructurales importantes frente a la serie 2: el DAG Processor se ejecuta como servicio independiente y aísla el parseo de la lógica del Scheduler, el Task SDK (paquete airflow.sdk) separa el contrato de autoría de DAGs del runtime del motor y la ejecución de tareas gana aislamiento gracias a AIP-72, que limita la comunicación tarea-orquestador a una API estable y evita el acceso directo a la base de metadatos. Los Deferrable Operators y el Triggerer pasan a ser la forma recomendada de esperar a eventos externos sin bloquear workers, y los Assets (antes Datasets) habilitan data-aware scheduling mediante AssetEvent y disparo automático de DAGs dependientes cuando se pública nueva información. La API pública se ha modernizado con Pydantic y la interfaz gráfica se ha rediseñado con React, incorporando vistas de linaje de assets, ejecución manual parametrizada y mejor observabilidad. La plataforma está alineada con Python 3.12+ y se distribuye como wheels firmadas que facilitan despliegues reproducibles.

La arquitectura de Airflow se compone del Scheduler que planifica instancias de tarea, el DAG Processor que parsea ficheros Python de forma aislada, el Triggerer que gestiona esperas asíncronas de los operadores diferibles, una Metadata Database que almacena estado de DAG Runs y Task Instances, la API Server que expone la API pública y los Executors que deciden dónde corren las tareas (local, Celery, Kubernetes, edge). Su ecosistema de providers ofrece cientos de operadores y hooks preconstruidos para conectar con bases de datos, servicios cloud (AWS, GCP, Azure), herramientas de procesamiento (Spark, dbt) y APIs externas, permitiendo orquestar cualquier infraestructura de datos desde un único punto de control.

Este itinerario recorre Apache Airflow de principio a fin: desde los conceptos fundamentales de orquestación y la instalación del entorno hasta el CI/CD y los servicios gestionados en la nube, pasando por la definición de DAGs con TaskFlow API, operadores, sensores, Deferrable Operators, assets y data-aware scheduling, integraciones con el ecosistema de datos y la operación segura en producción.

Qué incluye este itinerario

  • Fundamentos y arquitectura: qué es Airflow, concepto de DAG, arquitectura con Scheduler, DAG Processor, Triggerer, API Server, Metadata DB y Workers y tipos de executors.
  • Instalación y entorno: setup con pip, Docker Compose, Helm en Kubernetes, configuración y primer DAG con Task SDK.
  • DAGs en profundidad: definición, dependencias, scheduling con cron, timetables, Assets y data-aware scheduling, catchup/backfill y DAGs dinámicos.
  • Operadores: BashOperator, PythonOperator, providers cloud (AWS, GCP, Azure), operadores SQL y custom operators.
  • Sensores y hooks: sensores (File, HTTP, SQL, ExternalTask), hooks, Deferrable Operators y Triggerer asíncrono.
  • XCom y TaskFlow API: paso de datos con XCom, decorador @task, TaskGroups y Dynamic Task Mapping.
  • Integraciones: bases de datos, almacenamiento cloud, Spark, dbt, APIs REST y KubernetesPodOperator.
  • Seguridad y producción: AIP-72 (aislamiento de tareas), RBAC, secrets backends, logging, monitorización con Prometheus y Grafana, SLAs y alertas.
  • CI/CD y testing: tests de DAGs con pytest, pipelines CI/CD, Astro CLI y servicios gestionados (MWAA, Cloud Composer).

Público objetivo

  • Data Engineers que necesitan orquestar pipelines ETL/ELT en infraestructuras de datos modernas.
  • Ingenieros de software que automatizan procesos y flujos de trabajo dependientes entre sí.
  • Analistas de datos y analytics engineers que quieren programar y monitorizar sus transformaciones de datos.
  • DevOps Engineers que operan plataformas de datos y necesitan dominar la orquestación con Airflow.
  • Arquitectos de datos que diseñan plataformas de datos empresariales con scheduling y monitorización.
  • Profesionales IT en transición hacia roles de data engineering que buscan formación en orquestación.

Prerrequisitos

Conocimientos de Python a nivel intermedio (funciones, clases, decoradores, manejo de excepciones). Es recomendable tener familiaridad básica con la terminal o línea de comandos, conceptos de bases de datos SQL y comprensión general de procesos ETL. Para módulos avanzados, se valorarán conocimientos de Docker y conceptos básicos de servicios cloud.

¿Necesitas un itinerario completo?

Este curso puede formar parte de una carrera profesional que combine varias tecnologías. Explora nuestros itinerarios o te diseñamos uno a medida para tu equipo.

Plan formativo de Apache Airflow para tu equipo

Recibe una propuesta concreta: modalidad, alcance, calendario y evidencias FUNDAE exportables. Damos de alta a tu equipo, configuramos la plataforma con tus dominios y entregamos certificados verificables e informes para tu entidad organizadora. Sin coste de setup, sin permanencia.

¿Prefieres verlo en directo? Agenda una demo sin compromiso.

Formación en Apache Airflow: preguntas frecuentes

¿La formación en Apache Airflow para empresas es bonificable por FUNDAE?
Puede ser bonificable cuando la acción cumple los requisitos aplicables. La plataforma aporta evidencias técnicas: seguimiento de tiempos, registro de conexiones, foros, encuestas y certificados para que tu entidad organizadora o gestoría revise la documentación.
¿En qué modalidades se imparte la formación en Apache Airflow?
En tres modalidades: teleformación (online asíncrona), aula virtual privada en directo y mixta. Adaptamos temario, calendario y modalidad al equipo.
¿Se adapta el temario de Apache Airflow al nivel de mi equipo?
Sí. Ajustamos el itinerario de Apache Airflow al nivel y al stack de tu equipo, con ejercicios evaluados por IA y certificado verificable. La activación corporativa se acuerda durante la fase de propuesta.
¿Cómo se evalúa a los alumnos?
Con ejercicios corregidos automáticamente por IA (test, puzle, código, proyecto y ensayo), detección de entregas generadas con IA y certificados verificables por URL.