أداء مدمجة

أداة PDF

تقوم أداة pdf بتحليل مستند PDF واحد أو أكثر وإرجاع النص. السلوك السريع:

  • وضع المزود الأصلي لمزودي النماذج Anthropic و Google.
  • وضع الاسترجاع الاحتياطي للاستخراج لمزودين آخرين (استخراج النص أولاً، ثم صور الصفحات عند الحاجة).
  • تدعم مدخلًا واحدًا (pdf) أو متعددًا (pdfs)، بحد أقصى 10 ملفات PDF لكل استدعاء.

التوفر

يتم تسجيل الأداة فقط عندما يتمكن OpenClaw من حل تكوين نموذج قادر على معالجة PDF للوكيل:

  1. agents.defaults.pdfModel
  2. التراجع إلى agents.defaults.imageModel
  3. التراجع إلى إعدادات المزود الافتراضية الأفضل بناءً على المصادقة المتاحة

إذا لم يتم حل نموذج قابل للاستخدام، فإن أداة pdf لا تُعرض.

مرجع المدخلات

  • pdf (string): مسار أو عنوان URL لملف PDF واحد
  • pdfs (string[]): مسارات أو عناوين URL متعددة لملفات PDF، حتى 10 إجمالاً
  • prompt (string): مطالبة التحليل، الافتراضي Analyze this PDF document.
  • pages (string): عامل تصفية للصفحات مثل 1-5 أو 1,3,7-9
  • model (string): تجاوز اختياري للنموذج (provider/model)
  • maxBytesMb (number): حد الحجم لكل ملف PDF بالميجابايت

ملاحظات المدخلات:

  • يتم دمج pdf و pdfs وإزالة التكرارات قبل التحميل.
  • إذا لم يتم توفير مدخل PDF، تظهر الأداة خطأ.
  • يتم تحليل pages كأرقام صفحات قائمة على 1، وإزالة التكرارات، وفرزها، وتثبيتها إلى الحد الأقصى للصفحات المُكونة.
  • maxBytesMb الافتراضي هو agents.defaults.pdfMaxBytesMb أو 10.

مراجع PDF المدعومة

  • مسار ملف محلي (بما في ذلك توسيع ~)
  • عنوان URL من نوع file://
  • عنوان URL من نوع http:// و https://

ملاحظات المرجع:

  • يتم رفض مخططات URI الأخرى (على سبيل المثال ftp://) مع unsupported_pdf_reference.
  • في وضع الحماية، يتم رفض عناوين URL البعيدة http(s).
  • عند تمكين سياسة الملفات الخاصة بمساحة العمل فقط، يتم رفض مسارات الملفات المحلية خارج الجذور المسموح بها.

أوضاع التنفيذ

وضع المزود الأصلي

يُستخدم الوضع الأصلي لمزودي anthropic و google. ترسل الأداة بايتات PDF الخام مباشرة إلى واجهات برمجة تطبيقات المزود. حدود الوضع الأصلي:

  • pages غير مدعوم. إذا تم تعيينه، ترجع الأداة خطأ.

وضع الاسترجاع الاحتياطي للاستخراج

يُستخدم وضع الاسترجاع الاحتياطي للمزودين غير الأصليين. التدفق:

  1. استخراج النص من الصفحات المحددة (حتى agents.defaults.pdfMaxPages، الافتراضي 20).
  2. إذا كان طول النص المستخرج أقل من 200 حرف، قم بعرض الصفحات المحددة كصور PNG وإدراجها.
  3. إرسال المحتوى المستخرج بالإضافة إلى المطالبة إلى النموذج المحدد.

تفاصيل الاسترجاع الاحتياطي:

  • يستخدم استخراج صورة الصفحة ميزانية بكسل تبلغ 4,000,000.
  • إذا كان النموذج الهدف لا يدعم إدخال الصورة ولا يوجد نص قابل للاستخراج، تظهر الأداة خطأ.
  • يتطلب الاسترجاع الاحتياطي للاستخراج pdfjs-dist@napi-rs/canvas لعرض الصور).

التكوين

{
  agents: {
    defaults: {
      pdfModel: {
        primary: "anthropic/claude-opus-4-6",
        fallbacks: ["openai/gpt-5-mini"],
      },
      pdfMaxBytesMb: 10,
      pdfMaxPages: 20,
    },
  },
}

راجع مرجع التكوين للحصول على تفاصيل الحقول الكاملة.

تفاصيل المخرجات

ترجع الأداة النص في content[0].text وبيانات وصفية منظمة في details. حقول details الشائعة:

  • model: مرجع النموذج المحلول (provider/model)
  • native: true لوضع المزود الأصلي، false للاسترجاع الاحتياطي
  • attempts: محاولات الاسترجاع الاحتياطي التي فشلت قبل النجاح

حقول المسار:

  • مدخل PDF واحد: details.pdf
  • مدخلات PDF متعددة: details.pdfs[] مع إدخالات pdf
  • بيانات وصفية لإعادة كتابة مسار الحماية (عندما ينطبق): rewrittenFrom

سلوك الخطأ

  • مدخل PDF مفقود: يظهر خطأ pdf required: provide a path or URL to a PDF document
  • عدد كبير جدًا من ملفات PDF: يُرجع خطأ منظمًا في details.error = "too_many_pdfs"
  • مخطط مرجع غير مدعوم: يُرجع details.error = "unsupported_pdf_reference"
  • الوضع الأصلي مع pages: يظهر خطأ واضح pages is not supported with native PDF providers

أمثلة

ملف PDF واحد:

{
  "pdf": "/tmp/report.pdf",
  "prompt": "Summarize this report in 5 bullets"
}

ملفات PDF متعددة:

{
  "pdfs": ["/tmp/q1.pdf", "/tmp/q2.pdf"],
  "prompt": "Compare risks and timeline changes across both documents"
}

نموذج استرجاع احتياطي مع تصفية الصفحات:

{
  "pdf": "https://example.com/report.pdf",
  "pages": "1-3,7",
  "model": "openai/gpt-5-mini",
  "prompt": "Extract only customer-impacting incidents"
}

الاختلافاتالوضع المرفوع