Hermes Agent

Name: Hermes Agent
Availability: InStock
Author: Francisco Naranjo

Actualizado el 12/05/2026porFrancisco Naranjo

IA. Agentes Autónomos

Open Source

Conectividad MCP

Gratuitas

Full Code

Aplicaciones de Escritorio

Conectividad API

Programación y sistemas

Agente de IA autónomo de código abierto diseñado para la persistencia y el crecimiento operativo. Permite a ingenieros de MLOps, desarrolladores y departamentos de IT automatizar flujos de trabajo complejos mediante un sistema de aprendizaje continuo que genera habilidades propias (skills), gestiona tareas desatendidas vía cron y mantiene una memoria evolutiva en servidores locales o nubes privadas sin depender de ecosistemas cerrados.

Gratis / Free

Desde 0€/Hasta 0€

web oficial PDF

Qué y para quién es

Hermes Agent es un agente de IA autónomo de código abierto orientado a la persistencia y al crecimiento operativo. A diferencia de los chatbots convencionales o copilotos de IDE, es una entidad que reside en un servidor o máquina local, capaz de aprender de las interacciones, crear sus propias habilidades (skills) y gestionar tareas de forma desatendida. Está diseñado para profesionales técnicos, ingenieros de MLOps, desarrolladores y departamentos de IT que buscan automatizar flujos de trabajo complejos sin depender de ecosistemas cerrados, manteniendo el control total sobre los datos y la lógica de ejecución.

Principal ventaja profesional

Desde mi perspectiva técnica, la ventaja competitiva de Hermes es su bucle de aprendizaje cerrado. No solo ejecuta tareas; al resolver un problema complejo, el agente redacta automáticamente un documento de habilidad (SKILL.md) que le permite replicar ese conocimiento en el futuro. Esto, sumado a su memoria persistente que no se resetea entre sesiones, lo convierte en un "activo digital" que aumenta su valor y eficiencia cuanto más tiempo permanece integrado en la infraestructura de la empresa.

Para quién no es

No es una herramienta para usuarios finales que buscan una interfaz visual simplificada o una solución "llave en mano" sin configuración técnica. Aquellos profesionales o departamentos que no se sientan cómodos con la línea de comandos (CLI), la gestión de entornos Docker o la configuración de archivos YAML encontrarán una barrera de entrada alta. No es apto para entornos donde se prohíba estrictamente la ejecución de código dinámico o el acceso a terminales por parte de procesos automatizados.

funcionalidades clave

Memoria Persistente y Evolutiva: Almacena preferencias y contextos de proyectos en archivos locales (MEMORY.md, USER.md), eliminando la necesidad de re-explicar el contexto en cada sesión.
Sistema de Habilidades (Skills): Capacidad de cargar y crear documentos de conocimiento bajo demanda, compatibles con el estándar abierto agentskills.io.
Delegación a Subagentes: Puede spawnear agentes secundarios para trabajar en paralelo, cada uno con su propio contexto y terminal aislada.
Automatización mediante Cron: Programación de tareas (informes diarios, auditorías, backups) ejecutadas de forma autónoma.
Control de Navegador y Visión: Automatización completa de navegación web y análisis de imágenes mediante modelos multimodales.
Entornos de Ejecución Flexibles: Capacidad de ejecutar comandos en local, contenedores Docker, servidores remotos vía SSH o sandboxes en la nube (Modal, Daytona).

Precios

Hermes Agent es una herramienta Open Source bajo licencia MIT, por lo que el software en sí no tiene coste.

Versión gratuita: Completa y sin limitaciones de funcionalidades. El usuario solo asume el coste de los tokens de las LLM que decida conectar (OpenRouter, OpenAI, Anthropic, o modelos locales vía vLLM).
Coste de infraestructura: Puede ejecutarse en un VPS de 5€ o en clusters de GPU, dependiendo de la carga de trabajo requerida.

Perfil del usuario

Departamentos de IT y DevOps: Para automatización de scripts, mantenimiento de servidores y auditorías de seguridad.
Ingenieros de IA/ML: Para generación de datos de entrenamiento (trajectories) y experimentos de aprendizaje por refuerzo (RL).
Desarrolladores de Software: Para gestión de repositorios, creación de PRs y refactorización asistida con contexto real del proyecto.
Consultores Tecnológicos: Que necesiten una herramienta privada que aprenda las Particularidades de cada cliente.

Nivel técnico requerido

Uso: Medio. Requiere familiaridad con la terminal y comandos tipo slash (/model, /skills).
Instalación/Configuración: Alto. Es necesario conocer la gestión de entornos Python, manejo de APIs, configuración de servicios systemd y opcionalmente Docker o SSH.
Conocimientos necesarios: Manejo de CLI (Linux/macOS/WSL2), edición de archivos de configuración YAML y gestión de tokens/claves API.

Ejemplos de uso profesional

Auditoría Nocturna: El agente se activa vía cron a las 2:00 AM, revisa los logs de errores del servidor, busca soluciones en la documentación y deja un informe detallado en Slack/Telegram para el equipo por la mañana.
Onboarding de Proyectos: Al apuntar a Hermes a un nuevo repositorio, este lee el código, identifica patrones y crea "skills" específicas para que cualquier desarrollador pueda consultarle sobre la arquitectura del sistema.
Gestión de Incidencias: Integrado con el gateway de mensajería, un técnico puede pedirle vía WhatsApp que reinicie un servicio en un servidor remoto o que realice un despliegue rápido, todo bajo un entorno securizado.

Uso y distribución

Versión web: Dispone de un dashboard basado en navegador para chat y visibilización de procesos.
Versión escritorio: Principalmente CLI (Terminal UI) en Linux, macOS y WSL2 (Windows).
Versión móvil: Acceso a través de integraciones con plataformas de mensajería (Telegram, WhatsApp, Signal).
CLI: Es su interfaz nativa y más potente, con autocompletado y gestión de sesiones.

Open source

Licencia MIT. El código es totalmente auditable y permite el auto-alojamiento (self-hosting) completo.

Integraciones

Facilidad de integración: Alta para perfiles técnicos (Full Code).
API propia: Puede exponerse como un endpoint compatible con la API de OpenAI para conectar con otros frontends (LobeChat, Open WebUI).
Soporte MCP (Model Context Protocol): Permite conectar cualquier servidor MCP (GitHub, bases de datos) para ampliar sus herramientas sin programar código adicional.
Gateways nativos: Integración con Telegram, Discord, Slack, WhatsApp, Signal, Home Assistant y Email.

Notas finales

Veredicto técnico

Tras analizar su arquitectura, considero que Hermes Agent es una herramienta de gran utilidad y alta sofisticación para profesionales que ya han superado la fase de "chatbots" y buscan autonomía real. Lo que más valoro es su soberanía de datos; toda la memoria reside en la máquina del usuario. Es una opción excelente para empresas que manejan información sensible y no quieren alimentar nubes de terceros con sus procesos internos. No es un juguete; es un motor de ejecución profesional.

información legal, licencias , contratos

Licencia: MIT (Permite uso comercial, modificación y distribución sin restricciones, siempre que se incluya el aviso de copyright).
Privacidad: Zero telemetry. No hay recolección de datos por parte de los creadores (Nous Research). La responsabilidad de la privacidad recae en la elección del proveedor de LLM (ej. usar modelos locales para privacidad 100%).

Otros

Es importante destacar el soporte para RL (Reinforcement Learning). Permite exportar trayectorias de conversación en formato ShareGPT, lo cual es oro puro para empresas que quieran entrenar sus propios modelos de lenguaje basándose en el comportamiento del agente.

Fuentes consultadas:

Aplicación profesional

Según mi experiencia, Hermes Agent no es simplemente otro asistente de IA, es un activo operativo de largo plazo. Es ideal para empresas tecnológicas, consultoras IT y departamentos DevOps que manejan infraestructuras críticas o flujos de trabajo repetitivos en entornos protegidos. Lo que más me gusta es que permite salir del modelo de "pago por asiento" de herramientas como GitHub Copilot, permitiendo a la organización poseer su propio "empleado digital" que no olvida procesos. El presupuesto necesario es variable: el software es gratuito, pero el coste real reside en el tiempo del ingeniero para la configuración inicial y el consumo de tokens de alta gama (como Claude 3.5 Sonnet o GPT-4o) para que el razonamiento autónomo sea realmente efectivo.

Madurez digital requerida

Usuarios y equipo: Nivel técnico alto. El equipo debe estar familiarizado con Git, entornos virtuales de Python (miniconda/uv), gestión de APIs y, preferiblemente, arquitectura de contenedores. No es apto para perfiles de gestión sin soporte técnico directo.
Empresa y departamentos: Alta madurez en procesos. Al ser un agente de "bucle cerrado" con capacidad de ejecución de código, la empresa debe tener protocolos de seguridad claros sobre qué terminales y datos puede tocar un proceso automatizado.

Plan orientativo de implantación

Pasos necesarios y estimaciones

Evaluación y entorno (1 semana): Definición de la infraestructura de alojamiento (local vs VPS/Cloud) y selección del orquestador de modelos (OpenRouter o vLLM local).
Prueba de concepto - PoC (2 semanas): Configuración en un entorno sandbox (aislado) para validar la creación de SKILL.md en tareas específicas de la empresa, como el análisis de logs o la generación de informes técnicos.
Implantación y securización (2 semanas): Despliegue mediante systemd para persistencia, integración con canales de mensajería (Slack/Telegram) y configuración de backups de la memoria (MEMORY.md).
Escalado (Continuo): Refinamiento de la base de conocimientos y delegación de tareas mediante subagentes para procesos paralelos.

Necesidades de formación del equipo

Es imprescindible formar al equipo en el uso de prompts operativos y en la lectura de los logs del agente. El personal debe aprender a auditar las habilidades (skills) que el agente genera por sí mismo para evitar alucinaciones en los procedimientos operativos estándar.

Perfiles necesarios

Ingeniero DevOps: Para la instalación, mantenimiento del entorno Docker/SSH y configuración de tareas Cron.
Arquitecto de IA / MLOps: Para supervisar la calidad de las trayectorias de aprendizaje y la integración de servidores MCP.
Personal externo: Consultores expertos en IA agentica para el diseño inicial de los flujos de trabajo autónomos.

Retorno de la inversión (ROI)

Tiempos: El ROI se empieza a percibir entre el mes 3 y 6, una vez que el agente ha acumulado suficiente historial de "skills" específicas del negocio.
KPIs: Reducción de horas hombre en tareas de mantenimiento nocturno, tiempo medio de resolución de incidencias (MTTR) y volumen de documentación técnica generada automáticamente.

Otros

En mi opinión profesional, el soporte para el Model Context Protocol (MCP) es el factor diferencial que garantiza que Hermes Agent no quede obsoleto. Esto le permite conectarse a bases de datos SQL, Google Drive o repositorios de GitHub de forma nativa. Al usarlo, te das cuenta de que su verdadera potencia no está en el chat, sino en su capacidad de "despertar" por la noche, realizar una tarea, aprender de ella y dejar el resultado listo para cuando el equipo humano comience su jornada.

Este tutorial está basado en la documentación oficial de Hermes Agent de Nous Research, una herramienta diseñada para evolucionar y aprender mediante un ciclo de mejora continua ("learning loop").

Instalación (Linux, macOS, WSL2)

La instalación se realiza mediante un script automatizado que configura el entorno, incluyendo dependencias como uv, Python y Node.js.

Ejecuta el instalador oficial: curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
Reinicia tu terminal: source ~/.bashrc (o source ~/.zshrc).
Inicia el asistente de configuración: hermes setup. Este es el paso más crítico; te guiará para configurar el modelo, las herramientas y las plataformas de mensajería.
Chequeo de salud: Tras instalar, ejecuta hermes doctor para verificar que todas las dependencias y claves API estén correctamente vinculadas.
Usuarios de Windows: Según mi experiencia, es altamente recomendable usar WSL2 en lugar de la instalación nativa de PowerShell, ya que esta última aún se encuentra en fase beta temprana y presenta limitaciones con el panel de chat del navegador.

Uso en el día a día

Interfaces: Tienes dos opciones principales. hermes para la CLI clásica y hermes --tui para una interfaz terminal moderna con soporte de ratón y selección de texto. Al usarlo te das cuenta de que la TUI es mucho más eficiente para flujos de trabajo largos.
Continuidad: No pierdas el hilo de tus tareas. Usa hermes --continue (o -c) para retomar la sesión más reciente exactamente donde la dejaste.
Comandos Slash: Durante el chat, usa / para desplegar el autocompletado. Los indispensables son:
- /new: Resetea la sesión si el contexto se ha vuelto confuso.
- /model: Cambia de LLM sobre la marcha (útil si necesitas razonamiento complejo de GPT-4o o rapidez de un modelo pequeño).
- /voice on: Activa el modo de voz si instalaste los extras correspondientes.

Trucos de experto

Aislamiento con Docker: En mi opinión profesional, si vas a permitir que el agente ejecute comandos en tu terminal, lo ideal es configurar el backend en Docker para evitar cambios accidentales en tu sistema host: hermes config set terminal.backend docker.
Sistema de Skills: Hermes no solo usa herramientas, las crea. Si el agente resuelve una tarea compleja de +5 pasos, puede generar una "skill" (archivo .md en ~/.hermes/skills/) que podrá reutilizar en el futuro. Puedes buscar skills de la comunidad en agentskills.io e instalarlas con hermes skills install [ID].
Uso de MCP: Aprovecha el Model Context Protocol. Puedes añadir servidores MCP externos (como el de GitHub o Google Drive) usando hermes mcp add. Esto expande drásticamente lo que el agente puede "ver" y "hacer".
Multilínea: No te limites a frases cortas. Usa Alt+Enter o Ctrl+J para escribir bloques de código o instrucciones detalladas sin enviar el mensaje prematuramente.

Posibles problemas/incidencias

Contexto insuficiente: Hermes requiere modelos con al menos 64K tokens de contexto. Si usas modelos locales vía Ollama o llama.cpp con valores menores, el agente fallará al intentar gestionar flujos de trabajo de varios pasos.
Errores de Auth: Si Hermes devuelve respuestas vacías, suele deberse a un error en la clave API o el formato de la URL del proveedor. Ejecuta hermes model para re-autenticar.
Incompatibilidades en Android: Si usas Termux, no intentes instalar la versión completa con voz ([all]), ya que las dependencias de audio suelen romper la instalación en dispositivos móviles. Usa el instalador base.

Otros

Gateway de mensajería: Puedes conectar tu agente a Telegram, Discord o Slack mediante hermes gateway setup. Lo que más me gusta es que puedes empezar una tarea en tu PC y recibir el reporte final en tu móvil vía Telegram una vez que el agente termine de procesar.
Cron: Puedes programar tareas recurrentes en lenguaje natural (ej: "cada lunes a las 9am haz un backup de este repo y envíame el resumen").

Opinión inicial

Tras verificar los contratos y las condiciones técnicas de Hermes Agent, mi opinión profesional es que nos encontramos ante una herramienta de impacto legal moderado-alto para una empresa española. El hecho de ser una tecnología de código abierto (Open Source) bajo licencia MIT ofrece una gran soberanía digital, ya que permite el auto-alojamiento (self-hosting), evitando la transferencia internacional de datos a ciegas. Sin embargo, su capacidad de ejecución autónoma de código y la creación de sus propias habilidades (skills) plantean retos significativos en materia de responsabilidad civil y cumplimiento del AI Act. Según los documentos consultados, la herramienta no incluye telemetría, lo que facilita el cumplimiento del RGPD, pero tras usarlo queda claro que la responsabilidad final recae totalmente en la configuración que realice la empresa, especialmente en la "limpieza" de los modelos de lenguaje (LLM) que se conecten a él.

Principales recomendaciones

Aislamiento de ejecución: Dado que el agente puede ejecutar comandos en la máquina anfitrión, es imperativo utilizar contenedores Docker o entornos sandbox para limitar el acceso al sistema de archivos real de la empresa.
Auditoría de modelos: Si se conectan modelos comerciales (OpenAI, Anthropic), se debe firmar un Acuerdo de Encargo de Tratamiento (DPA) con dichos proveedores. Para máxima privacidad, recomiendo el uso de modelos locales (vLLM/Ollama).
Supervisión humana (Human-in-the-loop): Configurar el sistema para que tareas críticas (borrado de datos, despliegues en producción o acceso a datos sensibles) requieran una confirmación manual por parte de un operador.
Registro de actividad: Activar y conservar los logs de las "trayectorias" (logs de ejecución) para cumplir con el principio de responsabilidad proactiva del RGPD.

Ley de Inteligencia Artificial (AI Act)

Clasificación: Por su naturaleza, puede ser considerado un sistema de IA de "propósito general" con capacidades de agente autónomo.
Transparencia: La empresa debe informar claramente a empleados o clientes si están interactuando con un agente autónomo o si los procesos técnicos han sido generados por la IA.
Gestión de riesgos: Al permitir la delegación a subagentes, la empresa española debe realizar una evaluación de impacto si el agente toma decisiones que afecten a derechos fundamentales o seguridad de datos personales.

Privacidad y protección de datos

Responsabilidades: La empresa usuaria actúa como Responsable del Tratamiento. Hermes Agent, al ser software descargable sin servicios de nube gestionados por el fabricante, actúa únicamente como una herramienta técnica.
Ubicación de los datos: Depende totalmente de la infraestructura de la empresa. Si se aloja en servidores propios en España/UE, el cumplimiento del RGPD es directo.
Transferencia internacional: No existe transferencia por parte del software per se. Solo ocurriría si se integran APIs de LLM cuyos servidores estén fuera del Espacio Económico Europeo (EE. UU., por ejemplo).
Derechos ARCO: El sistema almacena memoria en archivos planos (MEMORY.md, USER.md). Esto facilita enormemente el ejercicio de los derechos de acceso, rectificación y supresión, ya que los datos son fácilmente localizables y eliminables por el administrador del sistema.

Propiedad intelectual

Propiedad de datos: La empresa mantiene la propiedad absoluta sobre los datos de entrenamiento y contextos introducidos en el agente.
Propiedad del resultado: Según la legislación española, las obras generadas íntegramente por una IA no gozan de derechos de autor, pero los procesos, scripts y "skills" desarrollados bajo supervisión y parámetros humanos pueden protegerse como secretos industriales o software derivado. La licencia MIT del motor permite que la empresa sea dueña de sus modificaciones y flujos de trabajo específicos.

Usos y prohibiciones

Usos admitidos: Automatización de operaciones IT, auditoría de códigos, gestión de infraestructura bajo protocolos de seguridad, y generación de datos sintéticos para entrenamiento interno.
Usos prohibidos: No debe utilizarse para la vigilancia biométrica, "scoring" social de empleados o cualquier actividad que contravenga las prohibiciones expresas del AI Act en la UE. Está desaconsejado su uso para la toma de decisiones legales o financieras automatizadas sin revisión humana.

Seguridad y certificaciones

Seguridad: El agente permite ejecución vía SSH y Docker, lo cual es positivo para la seguridad perimetral. Sin embargo, carece de certificaciones de seguridad nativas (como SOC2 o ISO 27001) al ser un proyecto de código abierto; la certificación dependerá de la infraestructura donde se despliegue.
Certificaciones: No se han hallado certificaciones externas. La seguridad se basa en la transparencia del código fuente (auditable por la propia empresa).

Otros

Persistencia de memoria: La memoria evolutiva es un activo, pero desde el punto de vista legal, debe purgarse periódicamente si contiene datos de carácter personal que ya no son necesarios para la finalidad con la que se recogieron (principio de limitación del plazo de conservación).

Fuentes consultadas:

Preguntas frecuentes sobre Hermes Agent

Q.¿Qué diferencia a Hermes Agent de otros asistentes como ChatGPT o GitHub Copilot?

A diferencia de los chatbots convencionales, Hermes Agent es un agente autónomo que reside en infraestructura propia (servidor o local). Su principal distinción radica en la persistencia y la capacidad de aprendizaje evolutivo: no solo asiste en tareas, sino que genera sus propias habilidades mediante el estándar 'agentskills.io' y mantiene una memoria a largo plazo que no se resetea entre sesiones.

Q.¿Cuál es el modelo de licenciamiento de la herramienta?

Hermes Agent se distribuye bajo la licencia MIT. Esto significa que es software de código abierto (open source) que permite su uso comercial, modificación y distribución gratuita, siempre que se mantenga el aviso de copyright original.

Q.¿Es posible ejecutarlo de forma totalmente privada sin enviar datos a la nube?

Sí. Al ser una solución que permite el auto-alojamiento (self-hosting), el usuario tiene control total sobre los datos. Para garantizar una privacidad del 100%, se puede integrar con modelos de lenguaje locales (vLLM) en lugar de APIs comerciales, eliminando cualquier flujo de información hacia servidores externos.

Q.¿Qué requisitos técnicos y conocimientos se necesitan para su implementación?

El nivel técnico requerido es medio-alto. Es imprescindible tener experiencia en el manejo de interfaces de línea de comandos (CLI), gestión de entornos Python, configuración de archivos YAML y, preferiblemente, conocimientos en Docker y administración de servidores Linux para su despliegue persistente.

Q.¿Cómo funciona el sistema de creación de habilidades (skills)?

Cuando el agente resuelve un problema complejo, redacta automáticamente un documento técnico denominado 'SKILL.md'. Este archivo funciona como un módulo de conocimiento que el agente consulta en el futuro para replicar la solución, permitiendo que su eficiencia operativa crezca de forma orgánica con el uso.

Q.¿Qué costes asociados tiene el uso de Hermes Agent?

El software es gratuito. Sin embargo, el usuario debe cubrir los costes operativos derivados de: 1) el consumo de tokens de los modelos de lenguaje (LLMs) elegidos (como OpenAI, Anthropic o proveedores vía OpenRouter) y 2) el mantenimiento de la infraestructura de servidor o VPS donde se aloje el agente.

Q.¿Es compatible con la normativa de protección de datos como el RGPD?

Dada su naturaleza 'zero telemetry', el software no recolecta ni envía datos a los desarrolladores (Nous Research). El cumplimiento normativo depende exclusivamente de la configuración del usuario y del proveedor de LLM seleccionado, facilitando el cumplimiento del RGPD al permitir el procesamiento de datos en entornos locales controlados.

Q.¿Puede integrarse con otras herramientas empresariales mediante API?

Sí, Hermes Agent puede exponerse como un endpoint compatible con la API de OpenAI, lo que facilita su integración con interfaces de terceros. Además, soporta el protocolo MCP (Model Context Protocol) para conectar con bases de datos y repositorios de GitHub, y ofrece gateways nativos para Slack, Microsoft Teams y Telegram.

Q.¿Puede realizar tareas de forma autónoma sin supervisión humana?

Sí, incluye una funcionalidad de automatización mediante Cron. Esto permite programar tareas recurrentes, como auditorías de seguridad nocturnas o generación de informes periódicos, que el agente ejecuta de forma desatendida en los entornos configurados.

Q.¿Dónde se puede obtener el código fuente para auditarlo?

El código fuente es público y está disponible en el repositorio oficial de GitHub de Nous Research. Esto permite a los departamentos de IT realizar auditorías de seguridad completas antes de su despliegue en entornos de producción.