
Dagster (OSS) y Dagster Cloud

Plataforma de orquestación de pipelines y "data assets" definida en Python para desarrollar, ejecutar en producción y observar flujos de datos/ML/analítica, con modelo de programación basado en assets/ops/jobs, interfaz web (Dagit) y capacidades operativas como scheduling, sensores (triggers), linaje y metadatos; disponible como proyecto open source y como servicio gestionado (Cloud) con modelo de consumo por créditos.
descripcion
Dagster es una plataforma de orquestación para el desarrollo, ejecución en producción y observabilidad de "data assets" (p. ej., tablas, modelos, ficheros, métricas) definida en Python. Proporciona un modelo de programación (assets/ops/jobs), un servicio para alojar la interfaz web (Dagit vía dagster-webserver) y capacidades de operación como scheduling, sensores (triggers), linaje y metadatos asociados a los activos. Existe como proyecto open source y como oferta gestionada/comercial (Dagster Cloud). ([github.com](https://github.com/dagster-io/dagster
aplicacion profesional
Sirve para construir y operar pipelines de datos (ETL/ELT), productos de datos y flujos de ML/analítica con un enfoque centrado en activos (asset-based orchestration). Casos típicos: (1) orquestar transformaciones y dependencias con trazabilidad (lineage) entre activos; (2) automatizar ejecuciones por calendario (schedules) y por eventos/estado externo (sensors), incluyendo garantías de idempotencia mediante run_key/cursors; (3) estandarizar operación en equipos (definiciones versionadas como código, reutilización de componentes, observabilidad de ejecuciones y metadatos); (4) integrarse con herramientas del stack moderno mediante librerías oficiales (por ejemplo, recursos/integraciones instalables por pip como dagster-github) y representar artefactos de otras herramientas (p. ej., modelos dbt) como assets dentro del catálogo/linaje. ([legacy-versioned-docs.dagster.dagster-docs.io](https://legacy-versioned-docs.dagster.dagster-docs.io/concepts/partitions-schedules-sensors/schedules
precio
Open source: disponible sin coste de licencia bajo Apache-2.0 (según repositorio público). Dagster Cloud (Dagster+): ofrece prueba gratuita de 30 días y planes de pago; la página pública de pricing indica Starter desde 1200 USD/mes (con créditos incluidos), Enterprise bajo contacto comercial, y un modelo de uso por "créditos" (1 crédito por materialización de asset y 1 crédito por ejecución de op) con sobrecoste por exceso (p. ej., 0.03 USD/crédito según FAQ pública). También se publica precio de compute serverless como 0.005 USD/minuto en planes Solo/Starter. ([github.com](https://github.com/dagster-io
puntos a favor
- Proyecto open source con licencia Apache-2.0 y ecosistema público en GitHub, lo que facilita auditoría técnica y adopción incremental. ([github.com](https://github.com/dagster-io
- Modelo asset-based (software-defined assets) que permite mapear entidades reales del stack (tablas, modelos, dashboards) y adjuntar metadatos/particionado; útil para gobernanza ligera y trazabilidad. ([dagster.io](https://dagster.io/blog/software-defined-assets
- Capacidades de automatización: schedules para ejecuciones periódicas y sensors para disparadores por eventos/estado externo, gestionados por dagster-daemon, con mecanismos para evitar duplicados (run_key/cursors). ([legacy-versioned-docs.dagster.dagster-docs.io](https://legacy-versioned-docs.dagster.dagster-docs.io/concepts/partitions-schedules-sensors/schedules
- Integraciones instalables vía pip (ejemplo: dagster-github) y patrón de "resources" para encapsular acceso a sistemas externos. ([dagster.io](https://dagster.io/integrations/dagster-github
- Oferta gestionada (Dagster Cloud) con modelo de precios documentado públicamente (créditos, trial) y opciones de planes/SLAs en niveles superiores según página de pricing. ([dagster.io](https://dagster.io/pricing
puntos en contra
- Parte de la documentación accesible públicamente aparece en URLs de "legacy-versioned-docs" indicando versiones antiguas; en evaluaciones técnicas conviene validar en la documentación de la última release para evitar decisiones basadas en comportamiento obsoleto (p. ej., páginas marcadas como outdated). ([legacy-versioned-docs.dagster.dagster-docs.io](https://legacy-versioned-docs.dagster.dagster-docs.io/concepts/partitions-schedules-sensors/sensors
- Algunas capacidades pueden estar marcadas como experimentales (por ejemplo, auto-materializing assets en documentación versionada), lo que puede implicar cambios de API/semántica o requisitos operativos adicionales; requiere validación antes de estandarizar. ([legacy-versioned-docs.dagster.dagster-docs.io](https://legacy-versioned-docs.dagster.dagster-docs.io/concepts/assets/asset-auto-execution
- En Dagster Cloud el coste puede depender de métricas de uso (créditos: materializaciones de assets y ejecuciones de ops) además del coste de compute serverless, por lo que es necesario modelar el consumo esperado para estimar TCO. ([dagster.io](https://dagster.io/pricing
enlaces oficiales
otros enlaces interes
- https://pypi.org/project/dagster-github/
- https://legacy-versioned-docs.dagster.dagster-docs.io/concepts/partitions-schedules-sensors/schedules
- https://legacy-versioned-docs.dagster.dagster-docs.io/concepts/partitions-schedules-sensors/sensors
- https://legacy-versioned-docs.dagster.dagster-docs.io/concepts/assets/asset-auto-execution