
AiiDA

Framework open-source en Python para orquestar y automatizar workflows de computación científica (especialmente en entornos HPC), integrando ejecución local y remota con trazabilidad completa (provenance) mediante un grafo dirigido de datos y procesos para reproducibilidad, auditoría técnica y reutilización de resultados.
descripcion
AiiDA es un framework open-source en Python para orquestar y automatizar workflows de computación científica (especialmente en entornos HPC), integrando la ejecución de cálculos locales y remotos con trazabilidad completa (provenance) mediante un grafo dirigido de datos y procesos, orientado a reproducibilidad, auditoría técnica y reutilización de resultados.
aplicacion profesional
Sirve para definir, ejecutar y mantener pipelines de simulación y análisis (p. ej., DFT y otros códigos de materiales) de forma robusta y repetible; gestionar colas/schedulers (p. ej., SLURM/PBS/SGE/LSF) y entornos remotos; estandarizar entradas/salidas mediante plugins; y archivar/compartir subconjuntos del grafo de proveniencia (export/import) para revisión, colaboración o publicación de resultados.
precio
No se publican planes de pago en la web/documentación oficial revisada; AiiDA se distribuye como software open-source bajo licencia MIT (sin coste de licencia). Costes posibles: infraestructura (HPC/VMs), operación (PostgreSQL/RabbitMQ opcionales según despliegue) y soporte interno/externo.
puntos a favor
- Provenance automático (grafo) para reproducibilidad y auditoría técnica de cálculos y workflows.
- Motor de workflows en Python con checkpointing y escalado a alto throughput (orientado a miles/tens of thousands de procesos).
- Integración HPC y portabilidad entre recursos (cambio de “computer” con mínima modificación) y compatibilidad con schedulers comunes.
- Ecosistema extensible por plugins (códigos de simulación, parsers, tipos de datos, transports, schedulers).
- Opciones de instalación: modo “quick” (SQLite) para empezar y modo “production” con servicios para más prestaciones/rendimiento.
puntos en contra
- Complejidad operativa en despliegues productivos (típicamente requiere PostgreSQL y, según configuración/versión, broker como RabbitMQ o alternativas), lo que introduce carga DevOps.
- Curva de aprendizaje: conceptos (grafo de proveniencia, perfiles, plugins, modelos de datos/procesos) y desarrollo de WorkChains/CalcJobs.
- Dependencia funcional del ecosistema de plugins para cubrir códigos específicos; la cobertura y madurez varía por plugin (según repositorios/documentación pública).