Dagster (OSS) y Dagster Cloud
Dagster (OSS) y Dagster Cloud icon

Dagster (OSS) y Dagster Cloud

Dagster (OSS) y Dagster Cloud

Plataforma de orquestación de pipelines y "data assets" definida en Python para desarrollar, ejecutar en producción y observar flujos de datos/ML/analítica, con modelo de programación basado en assets/ops/jobs, interfaz web (Dagit) y capacidades operativas como scheduling, sensores (triggers), linaje y metadatos; disponible como proyecto open source y como servicio gestionado (Cloud) con modelo de consumo por créditos.

descripcion

Dagster es una plataforma de orquestación para el desarrollo, ejecución en producción y observabilidad de "data assets" (p. ej., tablas, modelos, ficheros, métricas) definida en Python. Proporciona un modelo de programación (assets/ops/jobs), un servicio para alojar la interfaz web (Dagit vía dagster-webserver) y capacidades de operación como scheduling, sensores (triggers), linaje y metadatos asociados a los activos. Existe como proyecto open source y como oferta gestionada/comercial (Dagster Cloud). ([github.com](https://github.com/dagster-io/dagster

aplicacion profesional

Sirve para construir y operar pipelines de datos (ETL/ELT), productos de datos y flujos de ML/analítica con un enfoque centrado en activos (asset-based orchestration). Casos típicos: (1) orquestar transformaciones y dependencias con trazabilidad (lineage) entre activos; (2) automatizar ejecuciones por calendario (schedules) y por eventos/estado externo (sensors), incluyendo garantías de idempotencia mediante run_key/cursors; (3) estandarizar operación en equipos (definiciones versionadas como código, reutilización de componentes, observabilidad de ejecuciones y metadatos); (4) integrarse con herramientas del stack moderno mediante librerías oficiales (por ejemplo, recursos/integraciones instalables por pip como dagster-github) y representar artefactos de otras herramientas (p. ej., modelos dbt) como assets dentro del catálogo/linaje. ([legacy-versioned-docs.dagster.dagster-docs.io](https://legacy-versioned-docs.dagster.dagster-docs.io/concepts/partitions-schedules-sensors/schedules

precio

Open source: disponible sin coste de licencia bajo Apache-2.0 (según repositorio público). Dagster Cloud (Dagster+): ofrece prueba gratuita de 30 días y planes de pago; la página pública de pricing indica Starter desde 1200 USD/mes (con créditos incluidos), Enterprise bajo contacto comercial, y un modelo de uso por "créditos" (1 crédito por materialización de asset y 1 crédito por ejecución de op) con sobrecoste por exceso (p. ej., 0.03 USD/crédito según FAQ pública). También se publica precio de compute serverless como 0.005 USD/minuto en planes Solo/Starter. ([github.com](https://github.com/dagster-io

puntos a favor

puntos en contra

  • Parte de la documentación accesible públicamente aparece en URLs de "legacy-versioned-docs" indicando versiones antiguas; en evaluaciones técnicas conviene validar en la documentación de la última release para evitar decisiones basadas en comportamiento obsoleto (p. ej., páginas marcadas como outdated). ([legacy-versioned-docs.dagster.dagster-docs.io](https://legacy-versioned-docs.dagster.dagster-docs.io/concepts/partitions-schedules-sensors/sensors
  • Algunas capacidades pueden estar marcadas como experimentales (por ejemplo, auto-materializing assets en documentación versionada), lo que puede implicar cambios de API/semántica o requisitos operativos adicionales; requiere validación antes de estandarizar. ([legacy-versioned-docs.dagster.dagster-docs.io](https://legacy-versioned-docs.dagster.dagster-docs.io/concepts/assets/asset-auto-execution
  • En Dagster Cloud el coste puede depender de métricas de uso (créditos: materializaciones de assets y ejecuciones de ops) además del coste de compute serverless, por lo que es necesario modelar el consumo esperado para estimar TCO. ([dagster.io](https://dagster.io/pricing