أدوات مدمجة

Firecrawl

يمكن لـ OpenClaw استخدام Firecrawl كأداة استخراج احتياطية لـ web_fetch. إنها خدمة مستضافة لاستخراج المحتوى تدعم تجاوز حظر البوتات والتخزين المؤقت، مما يساعد مع المواقع الثقيلة بالجافاسكريبت أو الصفحات التي تمنع طلبات HTTP العادية.

احصل على مفتاح API

  1. أنشئ حسابًا على Firecrawl وقم بتوليد مفتاح API.
  2. قم بتخزينه في الإعدادات أو عيّن المتغير البيئي FIRECRAWL_API_KEY في بيئة البوابة.

تكوين Firecrawl

{
  tools: {
    web: {
      fetch: {
        firecrawl: {
          apiKey: "FIRECRAWL_API_KEY_HERE",
          baseUrl: "https://api.firecrawl.dev",
          onlyMainContent: true,
          maxAgeMs: 172800000,
          timeoutSeconds: 60,
        },
      },
    },
  },
}

ملاحظات:

  • firecrawl.enabled يكون مفعلاً بشكل افتراضي عند وجود مفتاح API.
  • maxAgeMs يتحكم في عمر النتائج المخزنة مؤقتًا (بالميلي ثانية). القيمة الافتراضية هي يومين.

التخفي / تجاوز حظر البوتات

يعرض Firecrawl معامل وضع الوكيل لتجاوز حظر البوتات (basic، stealth، أو auto). يستخدم OpenClaw دائمًا proxy: "auto" بالإضافة إلى storeInCache: true لطلبات Firecrawl. إذا تم حذف معامل الوكيل، فإن Firecrawl يستخدم auto افتراضيًا. يقوم auto بإعادة المحاولة باستخدام وكلاء متخفين إذا فشلت محاولة أساسية، مما قد يستخدم رصيدًا أكثر من الجلب باستخدام الوضع الأساسي فقط.

كيف يستخدم web_fetch خدمة Firecrawl

ترتيب استخراج web_fetch:

  1. Readability (محلي)
  2. Firecrawl (إذا تم تكوينه)
  3. تنظيف HTML أساسي (الخيار الاحتياطي الأخير)

راجع أدوات الويب للإعداد الكامل لأدوات الويب.

موافقات التنفيذمهمة LLM