Outils intégrés

Firecrawl

OpenClaw peut utiliser Firecrawl comme extracteur de secours pour web_fetch. C'est un service hébergé d'extraction de contenu qui prend en charge le contournement de bots et la mise en cache, ce qui aide pour les sites riches en JavaScript ou les pages qui bloquent les requêtes HTTP simples.

Obtenir une clé API

Créez un compte Firecrawl et générez une clé API.
Stockez-la dans la configuration ou définissez FIRECRAWL_API_KEY dans l'environnement de la passerelle.

Configurer Firecrawl

{
  tools: {
    web: {
      fetch: {
        firecrawl: {
          apiKey: "FIRECRAWL_API_KEY_HERE",
          baseUrl: "https://api.firecrawl.dev",
          onlyMainContent: true,
          maxAgeMs: 172800000,
          timeoutSeconds: 60,
        },
      },
    },
  },
}

Notes :

firecrawl.enabled est activé par défaut lorsqu'une clé API est présente.
maxAgeMs contrôle l'âge maximum des résultats en cache (ms). La valeur par défaut est de 2 jours.

Furtivité / contournement de bots

Firecrawl expose un paramètre de mode proxy pour le contournement de bots (basic, stealth, ou auto). OpenClaw utilise toujours proxy: "auto" plus storeInCache: true pour les requêtes Firecrawl. Si le proxy est omis, Firecrawl utilise par défaut auto. auto réessaie avec des proxies furtifs si une tentative basique échoue, ce qui peut utiliser plus de crédits qu'un scraping en mode basique uniquement.

Comment web_fetch utilise Firecrawl

Ordre d'extraction de web_fetch :

Readability (local)
Firecrawl (si configuré)
Nettoyage HTML basique (dernier recours)

Voir Outils Web pour la configuration complète des outils web.

Approbations Exec Tâche LLM