Firecrawl
OpenClaw kann Firecrawl als Fallback-Extraktor für web_fetch nutzen. Das ist ein gehosteter Service zur Inhaltsextraktion, der Bot-Umgehung und Caching unterstützt – praktisch für JavaScript-lastige Seiten oder Websites, die normale HTTP-Anfragen blockieren.
API-Key besorgen
- Erstelle einen Firecrawl-Account und generiere einen API-Key.
- Speichere ihn in der Config oder setze
FIRECRAWL_API_KEYin der Gateway-Umgebung.
Firecrawl konfigurieren
{
tools: {
web: {
fetch: {
firecrawl: {
apiKey: "FIRECRAWL_API_KEY_HERE",
baseUrl: "https://api.firecrawl.dev",
onlyMainContent: true,
maxAgeMs: 172800000,
timeoutSeconds: 60,
},
},
},
},
}
Hinweise:
firecrawl.enabledist standardmäßig aktiviert, wenn ein API-Key vorhanden ist.maxAgeMsbestimmt, wie alt gecachte Ergebnisse sein dürfen (in Millisekunden). Standard sind 2 Tage.
Stealth / Bot-Umgehung
Firecrawl bietet einen Proxy-Modus zur Bot-Umgehung (basic, stealth oder auto).
OpenClaw nutzt immer proxy: "auto" plus storeInCache: true für Firecrawl-Anfragen.
Wenn kein Proxy angegeben wird, verwendet Firecrawl standardmäßig auto. Der auto-Modus versucht es bei Fehlschlag mit Stealth-Proxies erneut, was mehr Credits verbrauchen kann als reines Basic-Scraping.
Wie web_fetch Firecrawl nutzt
web_fetch Extraktionsreihenfolge:
- Readability (lokal)
- Firecrawl (falls konfiguriert)
- Einfaches HTML-Cleanup (letzter Fallback)
Siehe Web-Tools für die vollständige Web-Tool-Konfiguration.