أداء مدمجة
أداة PDF
تقوم أداة pdf بتحليل مستند PDF واحد أو أكثر وإرجاع النص. السلوك السريع:
- وضع المزود الأصلي لمزودي النماذج Anthropic و Google.
- وضع الاسترجاع الاحتياطي للاستخراج لمزودين آخرين (استخراج النص أولاً، ثم صور الصفحات عند الحاجة).
- تدعم مدخلًا واحدًا (
pdf) أو متعددًا (pdfs)، بحد أقصى 10 ملفات PDF لكل استدعاء.
التوفر
يتم تسجيل الأداة فقط عندما يتمكن OpenClaw من حل تكوين نموذج قادر على معالجة PDF للوكيل:
agents.defaults.pdfModel- التراجع إلى
agents.defaults.imageModel - التراجع إلى إعدادات المزود الافتراضية الأفضل بناءً على المصادقة المتاحة
إذا لم يتم حل نموذج قابل للاستخدام، فإن أداة pdf لا تُعرض.
مرجع المدخلات
pdf(string): مسار أو عنوان URL لملف PDF واحدpdfs(string[]): مسارات أو عناوين URL متعددة لملفات PDF، حتى 10 إجمالاًprompt(string): مطالبة التحليل، الافتراضيAnalyze this PDF document.pages(string): عامل تصفية للصفحات مثل1-5أو1,3,7-9model(string): تجاوز اختياري للنموذج (provider/model)maxBytesMb(number): حد الحجم لكل ملف PDF بالميجابايت
ملاحظات المدخلات:
- يتم دمج
pdfوpdfsوإزالة التكرارات قبل التحميل. - إذا لم يتم توفير مدخل PDF، تظهر الأداة خطأ.
- يتم تحليل
pagesكأرقام صفحات قائمة على 1، وإزالة التكرارات، وفرزها، وتثبيتها إلى الحد الأقصى للصفحات المُكونة. maxBytesMbالافتراضي هوagents.defaults.pdfMaxBytesMbأو10.
مراجع PDF المدعومة
- مسار ملف محلي (بما في ذلك توسيع
~) - عنوان URL من نوع
file:// - عنوان URL من نوع
http://وhttps://
ملاحظات المرجع:
- يتم رفض مخططات URI الأخرى (على سبيل المثال
ftp://) معunsupported_pdf_reference. - في وضع الحماية، يتم رفض عناوين URL البعيدة
http(s). - عند تمكين سياسة الملفات الخاصة بمساحة العمل فقط، يتم رفض مسارات الملفات المحلية خارج الجذور المسموح بها.
أوضاع التنفيذ
وضع المزود الأصلي
يُستخدم الوضع الأصلي لمزودي anthropic و google. ترسل الأداة بايتات PDF الخام مباشرة إلى واجهات برمجة تطبيقات المزود. حدود الوضع الأصلي:
pagesغير مدعوم. إذا تم تعيينه، ترجع الأداة خطأ.
وضع الاسترجاع الاحتياطي للاستخراج
يُستخدم وضع الاسترجاع الاحتياطي للمزودين غير الأصليين. التدفق:
- استخراج النص من الصفحات المحددة (حتى
agents.defaults.pdfMaxPages، الافتراضي20). - إذا كان طول النص المستخرج أقل من
200حرف، قم بعرض الصفحات المحددة كصور PNG وإدراجها. - إرسال المحتوى المستخرج بالإضافة إلى المطالبة إلى النموذج المحدد.
تفاصيل الاسترجاع الاحتياطي:
- يستخدم استخراج صورة الصفحة ميزانية بكسل تبلغ
4,000,000. - إذا كان النموذج الهدف لا يدعم إدخال الصورة ولا يوجد نص قابل للاستخراج، تظهر الأداة خطأ.
- يتطلب الاسترجاع الاحتياطي للاستخراج
pdfjs-dist(و@napi-rs/canvasلعرض الصور).
التكوين
{
agents: {
defaults: {
pdfModel: {
primary: "anthropic/claude-opus-4-6",
fallbacks: ["openai/gpt-5-mini"],
},
pdfMaxBytesMb: 10,
pdfMaxPages: 20,
},
},
}
راجع مرجع التكوين للحصول على تفاصيل الحقول الكاملة.
تفاصيل المخرجات
ترجع الأداة النص في content[0].text وبيانات وصفية منظمة في details. حقول details الشائعة:
model: مرجع النموذج المحلول (provider/model)native:trueلوضع المزود الأصلي،falseللاسترجاع الاحتياطيattempts: محاولات الاسترجاع الاحتياطي التي فشلت قبل النجاح
حقول المسار:
- مدخل PDF واحد:
details.pdf - مدخلات PDF متعددة:
details.pdfs[]مع إدخالاتpdf - بيانات وصفية لإعادة كتابة مسار الحماية (عندما ينطبق):
rewrittenFrom
سلوك الخطأ
- مدخل PDF مفقود: يظهر خطأ
pdf required: provide a path or URL to a PDF document - عدد كبير جدًا من ملفات PDF: يُرجع خطأ منظمًا في
details.error = "too_many_pdfs" - مخطط مرجع غير مدعوم: يُرجع
details.error = "unsupported_pdf_reference" - الوضع الأصلي مع
pages: يظهر خطأ واضحpages is not supported with native PDF providers
أمثلة
ملف PDF واحد:
{
"pdf": "/tmp/report.pdf",
"prompt": "Summarize this report in 5 bullets"
}
ملفات PDF متعددة:
{
"pdfs": ["/tmp/q1.pdf", "/tmp/q2.pdf"],
"prompt": "Compare risks and timeline changes across both documents"
}
نموذج استرجاع احتياطي مع تصفية الصفحات:
{
"pdf": "https://example.com/report.pdf",
"pages": "1-3,7",
"model": "openai/gpt-5-mini",
"prompt": "Extract only customer-impacting incidents"
}