Dagster (OSS) / Dagster+ (Dagster Cloud)

Dagster (OSS) / Dagster+ (Dagster Cloud)

Dagster (OSS) / Dagster+ (Dagster Cloud)

Orquestador de pipelines y data assets para ingeniería de datos, basado en un modelo declarativo en Python, con interfaz web para operación y observabilidad, capacidades de linaje y metadata integradas, y soporte para desarrollar, desplegar y operar cargas de datos de forma consistente a lo largo de entornos (local, test, staging y producción), tanto en modalidad open source (Apache 2.0) como en oferta gestionada (Dagster+ / Dagster Cloud).

descripcion

Dagster es un orquestador de pipelines y “data assets” orientado a ingeniería de datos, con modelo declarativo en Python, UI web para operación/observabilidad, y capacidades integradas de linaje y observabilidad para desarrollar, desplegar y operar cargas de datos a lo largo de todo el ciclo de vida (local, test, staging y producción).

aplicacion profesional

Sirve para definir y ejecutar workflows/pipelines de datos (ETL/ELT), modelar y materializar “assets” de datos con dependencias explícitas, programar ejecuciones, instrumentar y observar ejecuciones (logs/metadata), y operar de forma repetible en distintos entornos. Es habitual en plataformas de datos modernas para coordinar tareas entre herramientas (p. ej., transformaciones, ingestas, validaciones, cargas a DWH/lakehouse) con gobierno operativo basado en linaje y catálogo/metadata.

precio

Dagster (open source) está licenciado bajo Apache 2.0 (sin coste de licencia). Dagster+ (gestionado) ofrece trial gratuito de 30 días. En su página de precios aparecen ejemplos/planes: “Starter” con precio listado de 1200 USD/mes y “Enterprise” bajo contacto con ventas; además se muestra una estimación “Solo Plan” de 10 USD/mes (calculadora) y cómputo serverless a 0.005 USD/minuto (facturado adicionalmente). Los importes pueden variar según uso (créditos) y configuración.

puntos a favor

  • Modelo “asset-based”/declarativo en Python con enfoque en testabilidad y ciclo de vida completo (dev→prod).
  • Linaje y observabilidad integrados (operación y diagnóstico desde UI).
  • Proyecto open source con licencia Apache 2.0 (reduce lock-in de licencia y facilita evaluación/pilotos).

puntos en contra

  • Requiere stack Python y un aprendizaje específico del modelo de Dagster (conceptos como assets/ops/jobs y patrones de proyecto); el coste de adopción depende de la madurez del equipo (no cuantificado en documentación pública).
  • En Dagster+ el coste depende de consumo (“credits” por materializaciones de assets y ejecución de ops) y puede introducir variabilidad de gasto; además el cómputo serverless se factura aparte según la página de precios.