Firecrawl

Firecrawl

Firecrawl

API/plataforma para extracción de contenido web orientada a flujos con IA que transforma URLs (páginas o sitios) en formatos utilizables por LLM (p. ej., Markdown limpio) y también permite extracción estructurada; incluye capacidades de scraping, crawling, descubrimiento de URLs, búsqueda sobre contenido extraído, automatización con sesiones de navegador para páginas dinámicas/interactivas, seguimiento de cambios y un servidor MCP para integración con asistentes, IDEs y agentes.

descripcion

Firecrawl es una plataforma/API de extracción de datos web orientada a casos de uso con IA que permite convertir URLs (páginas sueltas o sitios completos) en contenido utilizable por LLM (p. ej., Markdown limpio) y, opcionalmente, en datos estructurados. Ofrece endpoints para scrapeo, crawling, descubrimiento de URLs (map), búsqueda con contenido extraído (search), automatización mediante sesiones de navegador y un servidor MCP para integrar estas capacidades en asistentes/IDE y agentes.

aplicacion profesional

1) Ingesta de conocimiento corporativo desde webs y documentación pública (scrape/crawl a Markdown/HTML/JSON) para RAG, búsqueda interna o asistentes. 2) Investigación y “deep research” automatizada: combinar search + scraping para recuperar contenido completo a partir de consultas y alimentar pipelines analíticos. 3) Descubrimiento y mantenimiento de inventarios de URLs con map/crawl (p. ej., auditoría de contenido, catálogos, portales). 4) Extracción estructurada a escala con prompts/esquemas (extract) y evolución hacia flujos basados en agente (/agent) para recopilación de datasets. 5) Automatización de páginas dinámicas o con interacción (Browser sessions + acciones + capturas) para escenarios que requieren navegación, clicks o autenticación. 6) Monitorización de cambios en páginas (change tracking) para alertas, compliance o seguimiento de precios/condiciones públicas. 7) Integración con herramientas de agentes y entornos de desarrollo vía MCP (Claude Desktop, Cursor, n8n, etc.) para dotar a agentes de “acceso web” controlado.

precio

Modelo por créditos. Incluye plan Free con 500 créditos “one-time” y 2 navegadores concurrentes; planes de suscripción (mensual/anual) con asignación mensual de créditos: Hobby (3.000 créditos, 5 concurrentes), Standard (100.000 créditos, 50 concurrentes), Growth (500.000 créditos, 100 concurrentes). Plan Scale (1.000.000 créditos) indicado a 599 USD/mes con facturación anual; Enterprise con créditos y condiciones personalizadas (SLA, SSO, zero-data retention, etc.). En el FAQ indican que no hay plan pay-per-use (sin suscripción) y que los créditos del plan no “roll over” (salvo excepciones como auto-recharge y algunos planes anuales). Costes de referencia por feature en la tabla pública: Scrape/Crawl/Map 1 crédito por página; Search 2 créditos por 10 resultados; Browser 2 créditos por minuto de navegador; Agent (preview) con “5 daily runs free” y pricing dinámico.

puntos a favor

  • Superficie de API amplia para web data: scrape, crawl, map, search, browser y capacidades de extracción estructurada/agent.
  • Salidas en múltiples formatos (p. ej., markdown/html/rawHtml/links/screenshot/json/changeTracking) y soporte para páginas dinámicas mediante acciones de navegador.
  • Change tracking para detectar cambios entre scrapes (con modos de diff) y aplicable a scrape/crawl/batch.
  • Integración con agentes y herramientas vía MCP (cloud y self-hosted, HTTP streamable) para incorporar scraping en flujos de trabajo de IA.
  • Opciones operativas relacionadas con privacidad/retención (p. ej., flags como storeInCache y disponibilidad de “zero data retention” bajo condiciones/planes).

puntos en contra

  • No dispone de modelo “pay-per-use” sin suscripción según el FAQ (puede limitar pilotos muy puntuales o uso esporádico).
  • Créditos del plan mensual no se acumulan al siguiente periodo (salvo excepciones documentadas), lo que puede generar ineficiencias si el consumo es irregular.
  • Funcionalidades enterprise relevantes (p. ej., zero-data retention) aparecen como condicionadas a habilitación/plan o contacto con soporte/ventas.
  • Costes variables/“dynamic pricing” en el modo Agent (preview) pueden dificultar estimaciones cerradas si se usa intensivamente ese endpoint.

otros enlaces interes