Hermes Agent

Agente de IA autónomo de código abierto diseñado para la persistencia y el crecimiento operativo. Permite a ingenieros de MLOps, desarrolladores y departamentos de IT automatizar flujos de trabajo complejos mediante un sistema de aprendizaje continuo que genera habilidades propias (skills), gestiona tareas desatendidas vía cron y mantiene una memoria evolutiva en servidores locales o nubes privadas sin depender de ecosistemas cerrados.
Qué y para quién es
Hermes Agent es un agente de IA autónomo de código abierto orientado a la persistencia y al crecimiento operativo. A diferencia de los chatbots convencionales o copilotos de IDE, es una entidad que reside en un servidor o máquina local, capaz de aprender de las interacciones, crear sus propias habilidades (skills) y gestionar tareas de forma desatendida. Está diseñado para profesionales técnicos, ingenieros de MLOps, desarrolladores y departamentos de IT que buscan automatizar flujos de trabajo complejos sin depender de ecosistemas cerrados, manteniendo el control total sobre los datos y la lógica de ejecución.
Principal ventaja profesional
Desde mi perspectiva técnica, la ventaja competitiva de Hermes es su bucle de aprendizaje cerrado. No solo ejecuta tareas; al resolver un problema complejo, el agente redacta automáticamente un documento de habilidad (SKILL.md) que le permite replicar ese conocimiento en el futuro. Esto, sumado a su memoria persistente que no se resetea entre sesiones, lo convierte en un "activo digital" que aumenta su valor y eficiencia cuanto más tiempo permanece integrado en la infraestructura de la empresa.
Para quién no es
No es una herramienta para usuarios finales que buscan una interfaz visual simplificada o una solución "llave en mano" sin configuración técnica. Aquellos profesionales o departamentos que no se sientan cómodos con la línea de comandos (CLI), la gestión de entornos Docker o la configuración de archivos YAML encontrarán una barrera de entrada alta. No es apto para entornos donde se prohíba estrictamente la ejecución de código dinámico o el acceso a terminales por parte de procesos automatizados.
funcionalidades clave
- Memoria Persistente y Evolutiva: Almacena preferencias y contextos de proyectos en archivos locales (
MEMORY.md,USER.md), eliminando la necesidad de re-explicar el contexto en cada sesión. - Sistema de Habilidades (Skills): Capacidad de cargar y crear documentos de conocimiento bajo demanda, compatibles con el estándar abierto
agentskills.io. - Delegación a Subagentes: Puede spawnear agentes secundarios para trabajar en paralelo, cada uno con su propio contexto y terminal aislada.
- Automatización mediante Cron: Programación de tareas (informes diarios, auditorías, backups) ejecutadas de forma autónoma.
- Control de Navegador y Visión: Automatización completa de navegación web y análisis de imágenes mediante modelos multimodales.
- Entornos de Ejecución Flexibles: Capacidad de ejecutar comandos en local, contenedores Docker, servidores remotos vía SSH o sandboxes en la nube (Modal, Daytona).
Precios
Hermes Agent es una herramienta Open Source bajo licencia MIT, por lo que el software en sí no tiene coste.
- Versión gratuita: Completa y sin limitaciones de funcionalidades. El usuario solo asume el coste de los tokens de las LLM que decida conectar (OpenRouter, OpenAI, Anthropic, o modelos locales vía vLLM).
- Coste de infraestructura: Puede ejecutarse en un VPS de 5€ o en clusters de GPU, dependiendo de la carga de trabajo requerida.
Perfil del usuario
- Departamentos de IT y DevOps: Para automatización de scripts, mantenimiento de servidores y auditorías de seguridad.
- Ingenieros de IA/ML: Para generación de datos de entrenamiento (trajectories) y experimentos de aprendizaje por refuerzo (RL).
- Desarrolladores de Software: Para gestión de repositorios, creación de PRs y refactorización asistida con contexto real del proyecto.
- Consultores Tecnológicos: Que necesiten una herramienta privada que aprenda las Particularidades de cada cliente.
Nivel técnico requerido
- Uso: Medio. Requiere familiaridad con la terminal y comandos tipo slash (
/model,/skills). - Instalación/Configuración: Alto. Es necesario conocer la gestión de entornos Python, manejo de APIs, configuración de servicios
systemdy opcionalmente Docker o SSH. - Conocimientos necesarios: Manejo de CLI (Linux/macOS/WSL2), edición de archivos de configuración YAML y gestión de tokens/claves API.
Ejemplos de uso profesional
- Auditoría Nocturna: El agente se activa vía cron a las 2:00 AM, revisa los logs de errores del servidor, busca soluciones en la documentación y deja un informe detallado en Slack/Telegram para el equipo por la mañana.
- Onboarding de Proyectos: Al apuntar a Hermes a un nuevo repositorio, este lee el código, identifica patrones y crea "skills" específicas para que cualquier desarrollador pueda consultarle sobre la arquitectura del sistema.
- Gestión de Incidencias: Integrado con el gateway de mensajería, un técnico puede pedirle vía WhatsApp que reinicie un servicio en un servidor remoto o que realice un despliegue rápido, todo bajo un entorno securizado.
Uso y distribución
- Versión web: Dispone de un dashboard basado en navegador para chat y visibilización de procesos.
- Versión escritorio: Principalmente CLI (Terminal UI) en Linux, macOS y WSL2 (Windows).
- Versión móvil: Acceso a través de integraciones con plataformas de mensajería (Telegram, WhatsApp, Signal).
- CLI: Es su interfaz nativa y más potente, con autocompletado y gestión de sesiones.
Open source
Licencia MIT. El código es totalmente auditable y permite el auto-alojamiento (self-hosting) completo.
Integraciones
- Facilidad de integración: Alta para perfiles técnicos (Full Code).
- API propia: Puede exponerse como un endpoint compatible con la API de OpenAI para conectar con otros frontends (LobeChat, Open WebUI).
- Soporte MCP (Model Context Protocol): Permite conectar cualquier servidor MCP (GitHub, bases de datos) para ampliar sus herramientas sin programar código adicional.
- Gateways nativos: Integración con Telegram, Discord, Slack, WhatsApp, Signal, Home Assistant y Email.
Notas finales
Veredicto técnico
Tras analizar su arquitectura, considero que Hermes Agent es una herramienta de gran utilidad y alta sofisticación para profesionales que ya han superado la fase de "chatbots" y buscan autonomía real. Lo que más valoro es su soberanía de datos; toda la memoria reside en la máquina del usuario. Es una opción excelente para empresas que manejan información sensible y no quieren alimentar nubes de terceros con sus procesos internos. No es un juguete; es un motor de ejecución profesional.
información legal, licencias , contratos
- Licencia: MIT (Permite uso comercial, modificación y distribución sin restricciones, siempre que se incluya el aviso de copyright).
- Privacidad: Zero telemetry. No hay recolección de datos por parte de los creadores (Nous Research). La responsabilidad de la privacidad recae en la elección del proveedor de LLM (ej. usar modelos locales para privacidad 100%).
Otros
Es importante destacar el soporte para RL (Reinforcement Learning). Permite exportar trayectorias de conversación en formato ShareGPT, lo cual es oro puro para empresas que quieran entrenar sus propios modelos de lenguaje basándose en el comportamiento del agente.
Fuentes consultadas:
Aplicación profesional
Según mi experiencia, Hermes Agent no es simplemente otro asistente de IA, es un activo operativo de largo plazo. Es ideal para empresas tecnológicas, consultoras IT y departamentos DevOps que manejan infraestructuras críticas o flujos de trabajo repetitivos en entornos protegidos. Lo que más me gusta es que permite salir del modelo de "pago por asiento" de herramientas como GitHub Copilot, permitiendo a la organización poseer su propio "empleado digital" que no olvida procesos. El presupuesto necesario es variable: el software es gratuito, pero el coste real reside en el tiempo del ingeniero para la configuración inicial y el consumo de tokens de alta gama (como Claude 3.5 Sonnet o GPT-4o) para que el razonamiento autónomo sea realmente efectivo.
Madurez digital requerida
- Usuarios y equipo: Nivel técnico alto. El equipo debe estar familiarizado con Git, entornos virtuales de Python (miniconda/uv), gestión de APIs y, preferiblemente, arquitectura de contenedores. No es apto para perfiles de gestión sin soporte técnico directo.
- Empresa y departamentos: Alta madurez en procesos. Al ser un agente de "bucle cerrado" con capacidad de ejecución de código, la empresa debe tener protocolos de seguridad claros sobre qué terminales y datos puede tocar un proceso automatizado.
Plan orientativo de implantación
Pasos necesarios y estimaciones
- Evaluación y entorno (1 semana): Definición de la infraestructura de alojamiento (local vs VPS/Cloud) y selección del orquestador de modelos (OpenRouter o vLLM local).
- Prueba de concepto - PoC (2 semanas): Configuración en un entorno sandbox (aislado) para validar la creación de
SKILL.mden tareas específicas de la empresa, como el análisis de logs o la generación de informes técnicos. - Implantación y securización (2 semanas): Despliegue mediante
systemdpara persistencia, integración con canales de mensajería (Slack/Telegram) y configuración de backups de la memoria (MEMORY.md). - Escalado (Continuo): Refinamiento de la base de conocimientos y delegación de tareas mediante subagentes para procesos paralelos.
Necesidades de formación del equipo
Es imprescindible formar al equipo en el uso de prompts operativos y en la lectura de los logs del agente. El personal debe aprender a auditar las habilidades (skills) que el agente genera por sí mismo para evitar alucinaciones en los procedimientos operativos estándar.
Perfiles necesarios
- Ingeniero DevOps: Para la instalación, mantenimiento del entorno Docker/SSH y configuración de tareas Cron.
- Arquitecto de IA / MLOps: Para supervisar la calidad de las trayectorias de aprendizaje y la integración de servidores MCP.
- Personal externo: Consultores expertos en IA agentica para el diseño inicial de los flujos de trabajo autónomos.
Retorno de la inversión (ROI)
- Tiempos: El ROI se empieza a percibir entre el mes 3 y 6, una vez que el agente ha acumulado suficiente historial de "skills" específicas del negocio.
- KPIs: Reducción de horas hombre en tareas de mantenimiento nocturno, tiempo medio de resolución de incidencias (MTTR) y volumen de documentación técnica generada automáticamente.
Otros
En mi opinión profesional, el soporte para el Model Context Protocol (MCP) es el factor diferencial que garantiza que Hermes Agent no quede obsoleto. Esto le permite conectarse a bases de datos SQL, Google Drive o repositorios de GitHub de forma nativa. Al usarlo, te das cuenta de que su verdadera potencia no está en el chat, sino en su capacidad de "despertar" por la noche, realizar una tarea, aprender de ella y dejar el resultado listo para cuando el equipo humano comience su jornada.
Este tutorial está basado en la documentación oficial de Hermes Agent de Nous Research, una herramienta diseñada para evolucionar y aprender mediante un ciclo de mejora continua ("learning loop").
Instalación (Linux, macOS, WSL2)
La instalación se realiza mediante un script automatizado que configura el entorno, incluyendo dependencias como uv, Python y Node.js.
- Ejecuta el instalador oficial:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash - Reinicia tu terminal:
source ~/.bashrc(osource ~/.zshrc). - Inicia el asistente de configuración:
hermes setup. Este es el paso más crítico; te guiará para configurar el modelo, las herramientas y las plataformas de mensajería. - Chequeo de salud: Tras instalar, ejecuta
hermes doctorpara verificar que todas las dependencias y claves API estén correctamente vinculadas. - Usuarios de Windows: Según mi experiencia, es altamente recomendable usar WSL2 en lugar de la instalación nativa de PowerShell, ya que esta última aún se encuentra en fase beta temprana y presenta limitaciones con el panel de chat del navegador.
Uso en el día a día
- Interfaces: Tienes dos opciones principales.
hermespara la CLI clásica yhermes --tuipara una interfaz terminal moderna con soporte de ratón y selección de texto. Al usarlo te das cuenta de que la TUI es mucho más eficiente para flujos de trabajo largos. - Continuidad: No pierdas el hilo de tus tareas. Usa
hermes --continue(o-c) para retomar la sesión más reciente exactamente donde la dejaste. - Comandos Slash: Durante el chat, usa
/para desplegar el autocompletado. Los indispensables son:/new: Resetea la sesión si el contexto se ha vuelto confuso./model: Cambia de LLM sobre la marcha (útil si necesitas razonamiento complejo de GPT-4o o rapidez de un modelo pequeño)./voice on: Activa el modo de voz si instalaste los extras correspondientes.
Trucos de experto
- Aislamiento con Docker: En mi opinión profesional, si vas a permitir que el agente ejecute comandos en tu terminal, lo ideal es configurar el backend en Docker para evitar cambios accidentales en tu sistema host:
hermes config set terminal.backend docker. - Sistema de Skills: Hermes no solo usa herramientas, las crea. Si el agente resuelve una tarea compleja de +5 pasos, puede generar una "skill" (archivo
.mden~/.hermes/skills/) que podrá reutilizar en el futuro. Puedes buscar skills de la comunidad en agentskills.io e instalarlas conhermes skills install [ID]. - Uso de MCP: Aprovecha el Model Context Protocol. Puedes añadir servidores MCP externos (como el de GitHub o Google Drive) usando
hermes mcp add. Esto expande drásticamente lo que el agente puede "ver" y "hacer". - Multilínea: No te limites a frases cortas. Usa
Alt+EnteroCtrl+Jpara escribir bloques de código o instrucciones detalladas sin enviar el mensaje prematuramente.
Posibles problemas/incidencias
- Contexto insuficiente: Hermes requiere modelos con al menos 64K tokens de contexto. Si usas modelos locales vía Ollama o llama.cpp con valores menores, el agente fallará al intentar gestionar flujos de trabajo de varios pasos.
- Errores de Auth: Si Hermes devuelve respuestas vacías, suele deberse a un error en la clave API o el formato de la URL del proveedor. Ejecuta
hermes modelpara re-autenticar. - Incompatibilidades en Android: Si usas Termux, no intentes instalar la versión completa con voz (
[all]), ya que las dependencias de audio suelen romper la instalación en dispositivos móviles. Usa el instalador base.
Otros
- Gateway de mensajería: Puedes conectar tu agente a Telegram, Discord o Slack mediante
hermes gateway setup. Lo que más me gusta es que puedes empezar una tarea en tu PC y recibir el reporte final en tu móvil vía Telegram una vez que el agente termine de procesar. - Cron: Puedes programar tareas recurrentes en lenguaje natural (ej: "cada lunes a las 9am haz un backup de este repo y envíame el resumen").
Opinión inicial
Tras verificar los contratos y las condiciones técnicas de Hermes Agent, mi opinión profesional es que nos encontramos ante una herramienta de impacto legal moderado-alto para una empresa española. El hecho de ser una tecnología de código abierto (Open Source) bajo licencia MIT ofrece una gran soberanía digital, ya que permite el auto-alojamiento (self-hosting), evitando la transferencia internacional de datos a ciegas. Sin embargo, su capacidad de ejecución autónoma de código y la creación de sus propias habilidades (skills) plantean retos significativos en materia de responsabilidad civil y cumplimiento del AI Act. Según los documentos consultados, la herramienta no incluye telemetría, lo que facilita el cumplimiento del RGPD, pero tras usarlo queda claro que la responsabilidad final recae totalmente en la configuración que realice la empresa, especialmente en la "limpieza" de los modelos de lenguaje (LLM) que se conecten a él.
Principales recomendaciones
- Aislamiento de ejecución: Dado que el agente puede ejecutar comandos en la máquina anfitrión, es imperativo utilizar contenedores Docker o entornos sandbox para limitar el acceso al sistema de archivos real de la empresa.
- Auditoría de modelos: Si se conectan modelos comerciales (OpenAI, Anthropic), se debe firmar un Acuerdo de Encargo de Tratamiento (DPA) con dichos proveedores. Para máxima privacidad, recomiendo el uso de modelos locales (vLLM/Ollama).
- Supervisión humana (Human-in-the-loop): Configurar el sistema para que tareas críticas (borrado de datos, despliegues en producción o acceso a datos sensibles) requieran una confirmación manual por parte de un operador.
- Registro de actividad: Activar y conservar los logs de las "trayectorias" (logs de ejecución) para cumplir con el principio de responsabilidad proactiva del RGPD.
Ley de Inteligencia Artificial (AI Act)
- Clasificación: Por su naturaleza, puede ser considerado un sistema de IA de "propósito general" con capacidades de agente autónomo.
- Transparencia: La empresa debe informar claramente a empleados o clientes si están interactuando con un agente autónomo o si los procesos técnicos han sido generados por la IA.
- Gestión de riesgos: Al permitir la delegación a subagentes, la empresa española debe realizar una evaluación de impacto si el agente toma decisiones que afecten a derechos fundamentales o seguridad de datos personales.
Privacidad y protección de datos
- Responsabilidades: La empresa usuaria actúa como Responsable del Tratamiento. Hermes Agent, al ser software descargable sin servicios de nube gestionados por el fabricante, actúa únicamente como una herramienta técnica.
- Ubicación de los datos: Depende totalmente de la infraestructura de la empresa. Si se aloja en servidores propios en España/UE, el cumplimiento del RGPD es directo.
- Transferencia internacional: No existe transferencia por parte del software per se. Solo ocurriría si se integran APIs de LLM cuyos servidores estén fuera del Espacio Económico Europeo (EE. UU., por ejemplo).
- Derechos ARCO: El sistema almacena memoria en archivos planos (
MEMORY.md,USER.md). Esto facilita enormemente el ejercicio de los derechos de acceso, rectificación y supresión, ya que los datos son fácilmente localizables y eliminables por el administrador del sistema.
Propiedad intelectual
- Propiedad de datos: La empresa mantiene la propiedad absoluta sobre los datos de entrenamiento y contextos introducidos en el agente.
- Propiedad del resultado: Según la legislación española, las obras generadas íntegramente por una IA no gozan de derechos de autor, pero los procesos, scripts y "skills" desarrollados bajo supervisión y parámetros humanos pueden protegerse como secretos industriales o software derivado. La licencia MIT del motor permite que la empresa sea dueña de sus modificaciones y flujos de trabajo específicos.
Usos y prohibiciones
- Usos admitidos: Automatización de operaciones IT, auditoría de códigos, gestión de infraestructura bajo protocolos de seguridad, y generación de datos sintéticos para entrenamiento interno.
- Usos prohibidos: No debe utilizarse para la vigilancia biométrica, "scoring" social de empleados o cualquier actividad que contravenga las prohibiciones expresas del AI Act en la UE. Está desaconsejado su uso para la toma de decisiones legales o financieras automatizadas sin revisión humana.
Seguridad y certificaciones
- Seguridad: El agente permite ejecución vía SSH y Docker, lo cual es positivo para la seguridad perimetral. Sin embargo, carece de certificaciones de seguridad nativas (como SOC2 o ISO 27001) al ser un proyecto de código abierto; la certificación dependerá de la infraestructura donde se despliegue.
- Certificaciones: No se han hallado certificaciones externas. La seguridad se basa en la transparencia del código fuente (auditable por la propia empresa).
Otros
- Persistencia de memoria: La memoria evolutiva es un activo, pero desde el punto de vista legal, debe purgarse periódicamente si contiene datos de carácter personal que ya no son necesarios para la finalidad con la que se recogieron (principio de limitación del plazo de conservación).