Feynman AI
Feynman es un sistema multi-agente de código abierto diseñado para investigadores, académicos e ingenieros de I+D que automatiza flujos de trabajo científicos complejos. Permite realizar búsquedas profundas en literatura técnica, auditar la consistencia entre artículos académicos y repositorios de código, y replicar experimentos en infraestructura GPU. Es la herramienta ideal para profesionales que necesitan procesar grandes volúmenes de datos de arXiv y validar resultados técnicos con rigor científico.
Análisis de Tendencia
Evolución del interés y popularidad en el mercado.
Qué y para quién es
Feynman es un agente de investigación de código abierto basado en IA, diseñado específicamente para automatizar flujos de trabajo científicos y técnicos complejos. A diferencia de un chat convencional, actúa como un sistema de múltiples agentes que busca artículos académicos, analiza repositorios de código, verifica citas y genera borradores técnicos de alta fidelidad. Está dirigido a investigadores, académicos, ingenieros de datos y profesionales de I+D que necesitan procesar grandes volúmenes de literatura científica (vía arXiv/alphaXiv) y validar experimentos técnicos de forma rigurosa.
Principal ventaja profesional
La capacidad de "auditar" la consistencia entre un artículo académico y su base de código real, junto con la automatización de réplicas de experimentos en infraestructura cloud (GPU), lo que reduce semanas de revisión manual a horas de trabajo supervisado.
Para quién no es
No es una herramienta para usuarios domésticos que buscan un asistente de tareas generales. Profesionales de marketing, gestión comercial o perfiles no técnicos que no estén familiarizados con interfaces de línea de comandos (CLI) o que no trabajen con literatura científica encontrarán la herramienta excesivamente compleja y fuera de su ámbito de utilidad.
funcionalidades clave
- Deep Research: Investigación multi-agente en paralelo con síntesis y verificación de fuentes.
- Audit: Comparación automática entre las afirmaciones de un paper y su repositorio de código en GitHub.
- Replicate: Ejecución y replicación de experimentos técnicos en GPUs locales o en la nube (RunPod/Modal).
- Literature Review: Generación de revisiones bibliográficas identificando consensos, desacuerdos y preguntas abiertas.
- Simulated Peer Review: Revisión por pares simulada que genera un plan de revisión y detecta debilidades en borradores.
- Source-Grounded: Todas las afirmaciones incluyen enlaces directos a papers, documentación o código fuente.
Precios
La herramienta es Open Source (licencia MIT), lo que significa que el software en sí es gratuito y modificable.
- Versión gratuita: Completa y funcional descargando el repositorio o mediante el instalador CLI.
- Costes asociados: El usuario debe sufragar los costes de las API de los modelos de lenguaje (LLM) utilizados (Anthropic, OpenAI, etc.) y de la computación en la nube si se utiliza para réplicas (RunPod, Modal).
Perfil del usuario
- Sectores: Biotecnología, Inteligencia Artificial, Farmacéutico, Académico/Universitario, Ingeniería Aeroespacial.
- Departamentos: I+D+i, Ciencia de Datos, Desarrollo de Producto, Laboratorios de investigación.
- Perfiles: Investigadores principales, Ingenieros de ML (Machine Learning), Analistas técnicos, Doctores y Postdoctorandos.
Nivel técnico requerido
- Uso: Medio. Requiere soltura en el manejo de terminales (CLI) y comprensión de conceptos de investigación científica.
- Instalación/Configuración: Alto. Requiere gestión de entornos Node.js, configuración de variables de entorno (.env) y gestión de API Keys de múltiples proveedores.
- Necesidades de soporte: Departamentos de IT para la gestión de permisos de seguridad y acceso a recursos GPU.
- Competencias necesarias: Conocimiento de Bash/PowerShell, nociones de Docker para ejecución aislada y familiaridad con repositorios Git.
Ejemplos de uso profesional
- Validación de tecnología: Auditar si una nueva librería de IA cumple con las métricas de rendimiento prometidas en su publicación oficial.
- Estado del arte: Generar un informe técnico sobre los últimos avances en algoritmos de optimización para logística antes de iniciar un proyecto.
- Transferencia tecnológica: Adaptar experimentos de laboratorio académico a entornos de producción corporativos mediante copiado y réplica de código.
Uso y distribución
- Versión web: No disponible como aplicación autónoma, aunque genera artefactos visualizables en navegador.
- Versión escritorio: Se ejecuta localmente en PC, Mac y Linux.
- CLI: Es la forma principal de interacción mediante el comando
feynman.
Open source
Distribuido bajo licencia MIT en GitHub, lo que permite su uso comercial, modificación y distribución privada.
Integraciones
- Facilidad de integración: El nivel es de Full Code a través de su arquitectura de "Pi skills".
- API propia: Utiliza el runtime de agentes Pi para extender funcionalidades.
- Herramientas conectadas: alphaXiv (búsqueda de papers), Docker (aislamiento de procesos), Tavily/Perplexity (búsqueda web), Modal/RunPod (computación GPU).
- Modelos soportados: Conexión nativa con Anthropic (Claude), OpenAI (GPT), Google (Gemini), OpenRouter, Groq, Mistral y Azure OpenAI.
Notas finales
información legal, licencias , contratos
- El software se entrega "tal cual" bajo licencia MIT. La propiedad intelectual de los informes generados pertenece al usuario, pero es responsabilidad del mismo verificar las licencias de los papers y repositorios que Feynman consulta durante su investigación.
Otros
- La herramienta utiliza un sistema de "Thinking Levels" (de off a xhigh) que permite ajustar profundamente el presupuesto de razonamiento y el gasto de tokens según la complejidad de la tarea de investigación.
Para más información:
- Sitio web oficial: https://feynman.is
- GitHub: https://github.com/getcompanion-ai/feynman
- Documentación técnica: https://feynman.is/docs
- Licencia: https://github.com/getcompanion-ai/feynman/blob/main/LICENSE
Aplicación profesional
- Sectores: Inteligencia Artificial, Biotecnología, Farmacéutico, Aeroespacial y Departamentos de I+D+i corporativos.
- Presupuesto: El software es Open Source (gratuito), pero requiere una inversión operativa en consumo de API (tokens de LLM) y recursos de computación (GPU en la nube como RunPod o Modal). El coste por investigación profunda puede oscilar entre 2$ y 15$ dependiendo del nivel de razonamiento configurado.
- Puntos clave: Automatización de la revisión por pares, auditoría técnica de código frente a publicaciones científicas y replicación de experimentos científicos en entornos aislados.
Madurez digital requerida
- Usuarios: Perfiles técnicos (Ingenieros de ML, Doctores, Investigadores) con dominio de interfaces de línea de comandos (CLI), gestión de variables de entorno y comprensión de flujos de trabajo de Git.
- Empresa: Organizaciones que ya disponen de una infraestructura de gestión de APIs de IA y políticas de cumplimiento para el procesamiento de datos científicos. Requiere una cultura de trabajo basada en código y documentación técnica.
Plan orientativo de implantación
Pasos necesarios y estimaciones
- Fase 1: Evaluación e Infraestructura (1 semana): Definición de proveedores de LLM (Anthropic, OpenAI, etc.) y alta en servicios de computación distribuida (Modal/RunPod). Revisión de políticas de seguridad para el acceso a repositorios internos.
- Fase 2: Configuración Técnica (2-3 días): Instalación de Node.js, configuración del entorno local/servidor y despliegue del CLI
feynman. Configuración de las API Keys y los motores de búsqueda técnica (Tavily/Perplexity). - Fase 3: Prueba de Concepto (1-2 semanas): Ejecución de un "Audit" sobre un proyecto interno o un paper de referencia para validar la precisión de la síntesis y la veracidad de las citas generadas por los agentes.
- Fase 4: Despliegue y Workflow (Continuo): Integración de Feynman en el flujo de vigilancia tecnológica o en el proceso de documentación técnica de la empresa.
Necesidades de formación del equipo
- Capacitación en el uso de "Thinking Levels" para optimizar el gasto de tokens.
- Formación en la interpretación de los esquemas de razonamiento del sistema multi-agente.
- Instrucción sobre el uso de Docker para garantizar que la replicación de experimentos no comprometa la seguridad del sistema local.
Perfiles necesarios
- Perfiles técnicos internos: Ingenieros de Software o Data Scientists para la instalación y mantenimiento del entorno.
- Personal externo recomendado: No suele ser necesario si el equipo de I+D tiene competencias en desarrollo, aunque se puede requerir consultoría en optimización de costes de APIs de modelos de lenguaje.
Retorno de la inversión (ROI)
- Tiempos: Reducción del tiempo de "Literature Review" de una media de 40 horas manuales a 2-4 horas de supervisión técnica.
- Cómo medirlo: Comparativa de horas hombre dedicadas a la revisión bibliográfica pre y post implantación; tasa de detección de errores en código técnico antes de pasar a producción (vía función de Audit).
Otros
- Escalabilidad: Al utilizar el runtime de agentes Pi, la herramienta permite añadir capacidades personalizadas (skills) para conectar con bases de datos propietarias de la empresa.
- Seguridad: Al ser código abierto ejecutado localmente, los datos de investigación no permanecen en servidores de terceros (excepto los fragmentos enviados a las APIs de los LLM contratados).
Princiaples recomendaciones
- Realizar una Evaluación de Impacto en la Protección de Datos (EIPD) antes de introducir datos de carácter personal o proyectos de I+D confidenciales, dada la naturaleza de procesamiento multi-agente.
- Configurar el uso de modelos de lenguaje (LLMs) mediante proveedores que garanticen versiones "Enterprise" o bajo arquitectura Azure OpenAI/AWS para evitar que la información introducida sea utilizada para el entrenamiento de modelos de terceros.
- Supervisar humanamente los resultados (Human-in-the-loop) para mitigar riesgos de alucinaciones en artículos científicos y asegurar que la replicación de código en entornos Docker/Nube no comprometa la seguridad de la infraestructura corporativa.
- Verificar las licencias de las fuentes consultadas (papers y repositorios de terceros) para asegurar que el uso derivado de esos contenidos cumple con los derechos de autor originales.
Ley de Inteligencia Artificial (AI Act)
- Clasificación de riesgo: Generalmente bajo para tareas de investigación técnica, pero puede elevarse si se utiliza para procesos de toma de decisiones en sectores críticos (como salud o infraestructuras).
- Transparencia: Al ser un sistema de "Deep Research", la herramienta cumple preliminarmente con la obligación de identificar el contenido generado por IA y permite la trazabilidad de fuentes.
- Responsabilidad: Al ser software de código abierto (MIT), la responsabilidad del cumplimiento normativo recae sobre la empresa española que lo implementa y personaliza, no sobre los desarrolladores originales.
Privacidad y protección de datos
- Responsabilidades: La empresa española actúa como Responsable del Tratamiento al gestionar sus propias API Keys y flujos de datos.
- Ubicación de los datos: El procesamiento principal es local o en la nube elegida por el usuario (Modal/RunPod). Es crítico seleccionar regiones dentro del Espacio Económico Europeo (EEE) para cumplir con el RGPD.
- Transferencia internacional: Existe riesgo de transferencia internacional de datos hacia EE.UU. si se utilizan proveedores de LLM (OpenAI, Anthropic) o infraestructura (RunPod) sin los marcos de privacidad adecuados o Cláusulas Contractuales Tipo.
- Derechos ARCO: La empresa debe asegurar que puede localizar y eliminar datos personales integrados en los procesos de investigación si un interesado lo solicita.
Propiedad intelectual
- Propiedad de datos: Al ser una herramienta ejecutada localmente o en infraestructura controlada, la empresa mantiene la soberanía sobre los datos de entrada.
- Propiedad del resultado: Bajo la licencia MIT y la legislación española, el resultado del procesamiento (borradores, informes) pertenece al usuario, siempre que medie una transformación creativa suficiente y no sea una mera copia de fuentes protegidas.
Usos y prohibiciones
- Usos admitidos: Investigación científica, auditoría de código, revisiones bibliográficas y optimización de procesos de I+D.
- Usos prohibidos: No debe utilizarse para eludir medidas tecnológicas de protección de bases de datos científicas de pago ni para generar desinformación técnica o científica.
Seguridad y certificaciones
- Seguridad: Al ejecutarse mediante CLI y Docker, permite el aislamiento de los experimentos, minimizando riesgos de ejecución de código malicioso de terceros.
- Certificaciones: El software no posee certificaciones ISO o SOC2 propias; la empresa debe apoyarse en las certificaciones de los proveedores de infraestructura (Azure, AWS, Google Cloud) donde aloje el sistema.
Otros
- Licencia MIT: Permite uso comercial total y modificación, pero exime a los autores de cualquier garantía o responsabilidad por fallos en el software.
- Costes y Control: Es fundamental implementar límites de gasto (tokens) en las API conectadas para evitar cargos inesperados por procesos de investigación recursivos o "Deep Research" prolongado.
Fuentes consultada:
- Contratos: https://feynman.is
- Licencias: https://github.com/getcompanion-ai/feynman/blob/main/LICENSE
- Condiciones: https://feynman.is/docs
- Repositorio oficial: https://github.com/getcompanion-ai/feynman