أدوات مدمجة
Firecrawl
يمكن لـ OpenClaw استخدام Firecrawl كأداة استخراج احتياطية لـ web_fetch. إنها خدمة مستضافة لاستخراج المحتوى تدعم تجاوز حظر البوتات والتخزين المؤقت، مما يساعد مع المواقع الثقيلة بالجافاسكريبت أو الصفحات التي تمنع طلبات HTTP العادية.
احصل على مفتاح API
- أنشئ حسابًا على Firecrawl وقم بتوليد مفتاح API.
- قم بتخزينه في الإعدادات أو عيّن المتغير البيئي
FIRECRAWL_API_KEYفي بيئة البوابة.
تكوين Firecrawl
{
tools: {
web: {
fetch: {
firecrawl: {
apiKey: "FIRECRAWL_API_KEY_HERE",
baseUrl: "https://api.firecrawl.dev",
onlyMainContent: true,
maxAgeMs: 172800000,
timeoutSeconds: 60,
},
},
},
},
}
ملاحظات:
firecrawl.enabledيكون مفعلاً بشكل افتراضي عند وجود مفتاح API.maxAgeMsيتحكم في عمر النتائج المخزنة مؤقتًا (بالميلي ثانية). القيمة الافتراضية هي يومين.
التخفي / تجاوز حظر البوتات
يعرض Firecrawl معامل وضع الوكيل لتجاوز حظر البوتات (basic، stealth، أو auto). يستخدم OpenClaw دائمًا proxy: "auto" بالإضافة إلى storeInCache: true لطلبات Firecrawl. إذا تم حذف معامل الوكيل، فإن Firecrawl يستخدم auto افتراضيًا. يقوم auto بإعادة المحاولة باستخدام وكلاء متخفين إذا فشلت محاولة أساسية، مما قد يستخدم رصيدًا أكثر من الجلب باستخدام الوضع الأساسي فقط.
كيف يستخدم web_fetch خدمة Firecrawl
ترتيب استخراج web_fetch:
- Readability (محلي)
- Firecrawl (إذا تم تكوينه)
- تنظيف HTML أساسي (الخيار الاحتياطي الأخير)
راجع أدوات الويب للإعداد الكامل لأدوات الويب.