Grafana es la plataforma de observabilidad y visualización de datos más utilizada en la industria para monitorizar infraestructura, aplicaciones y procesos de negocio. Creada por Grafana Labs, permite construir dashboards interactivos que unifican métricas, logs, trazas distribuidas, profiling y telemetría de usuario real desde múltiples orígenes de datos como Prometheus, Mimir, Loki, Tempo, Pyroscope, Faro, Elasticsearch, PostgreSQL y CloudWatch, entre muchos otros.
En su versión 11 y superiores, Grafana ha modernizado profundamente la experiencia: Scenes es el nuevo framework interno que potencia dashboards dinámicos y aplicaciones internas con estado reactivo, la UI de Grafana Alerting se ha rediseñado para simplificar la creación de reglas, notification policies y silences, y las vistas Explore Logs, Explore Metrics y Explore Traces ofrecen una exploración sin escribir consultas, con análisis automático de patrones y dimensiones. Las Drilldown apps amplían esta exploración con flujos verticales específicos para infraestructura, Kubernetes y aplicaciones.
La plataforma integra también Grafana Incident y Grafana OnCall para la gestión completa del ciclo de vida de incidentes con rotaciones, escalaciones y postmortems, Public dashboards para compartir métricas y estados con audiencias externas sin necesidad de cuenta, Pyroscope para continuous profiling de CPU y memoria, Faro para Real User Monitoring en frontend y k6 para load testing integrado con los dashboards de observabilidad. Todo ello disponible en tres modelos de consumo: open source (AGPL), Grafana Enterprise con RBAC avanzado, reporting y soporte, y Grafana Cloud, el SaaS gestionado del stack LGTM completo.
Este itinerario te guía desde la instalación y configuración inicial hasta el despliegue en producción con alta disponibilidad. Aprenderás a conectar data sources, construir dashboards profesionales con paneles de series temporales, gauges, tablas, heatmaps y logs, dominar los lenguajes de consulta PromQL, LogQL y TraceQL, configurar un sistema completo de alertas con SLO/SLI y enrutamiento hacia OnCall, y cerrar el curso con un proyecto integrador donde despliegas una plataforma de observabilidad LGTM completa gestionada íntegramente como código.
Qué incluye este itinerario
- Fundamentos: qué es Grafana, stack LGTM, comparativa con alternativas, interfaz de usuario y concepto de data sources.
- Instalación y entorno: setup con Docker, Linux, Grafana Cloud, primer login, organizaciones, usuarios y roles.
- Data sources: configuración de Prometheus, PostgreSQL, MySQL, Elasticsearch, Loki, Tempo, CloudWatch e InfluxDB.
- Dashboards y paneles: creación de dashboards con el framework Scenes, paneles time series, stat, gauge, table, heatmap, logs, variables, templates y anotaciones.
- Prometheus: fundamentos de PromQL, tipos de métricas, consultas avanzadas, recording rules y dashboards de infraestructura.
- Loki y logs: arquitectura de Loki, LogQL, paneles de logs, campos derivados y correlación log-to-trace con Tempo.
- Alertas: nueva UI de Grafana Alerting, reglas con SLO/SLI, contact points hacia OnCall, notification policies, silences, mute timings y alert groups.
- Producción: buenas prácticas, provisioning y dashboards as code, API de Grafana, autenticación LDAP, OAuth y SAML, alta disponibilidad y proyecto integrador con LGTM stack completo.
Ecosistema extendido de Grafana
- Drilldown apps: Explore Logs, Explore Metrics, Explore Traces y apps específicas como Kubernetes para exploración guiada sin escribir consultas.
- Grafana Incident y OnCall: rotaciones de guardia, escalación, respuesta y postmortems integrados con Alerting.
- Pyroscope: continuous profiling de CPU, heap, goroutines y más, con flamegraphs interactivos en Grafana.
- Faro: Real User Monitoring (RUM) que captura errores, métricas Web Vitals y sesiones de frontend.
- k6: herramienta de load testing que pública los resultados en Grafana Cloud k6 para correlacionarlos con métricas y trazas.
- Grafana Alloy: agente unificado (OpenTelemetry Collector distribution) que sustituye a Promtail y Grafana Agent como recolector de métricas, logs y trazas.
- Scenes: framework reactivo para construir dashboards y apps internas con estado compartido y navegación avanzada.
- Public dashboards: compartir dashboards con audiencias externas (status pages, clientes) sin necesidad de cuenta Grafana.
Público objetivo
- Ingenieros DevOps y SRE que necesitan monitorizar infraestructura y aplicaciones con dashboards, SLO/SLI y alertas profesionales.
- Administradores de sistemas que buscan una plataforma centralizada de observabilidad para entornos on-premise, cloud y edge.
- Desarrolladores backend que quieren instrumentar sus aplicaciones con métricas, logs, trazas y profiling correlacionados.
- Equipos de operaciones que requieren un sistema completo de alertas, gestión de incidentes y de guardias en producción.
Prerrequisitos: conocimientos básicos de línea de comandos Linux, familiaridad con Docker y conceptos elementales de redes y protocolos HTTP. Es recomendable tener nociones de métricas y monitorización, aunque no es obligatorio.