المزودون
Deepgram
Deepgram هو واجهة برمجة تطبيقات لتحويل الكلام إلى نص. في OpenClaw، يُستخدم لـ تحويل الصوت الوارد/ملاحظات الصوت إلى نص عبر tools.media.audio. عند التمكين، يقوم OpenClaw بتحميل ملف الصوت إلى Deepgram وحقن النص المُحول في مسار الرد ({{Transcript}} + كتلة [Audio]). هذه العملية ليست بثًا مباشرًا؛ فهي تستخدم نقطة نهاية التحويل المسجل مسبقًا. الموقع: https://deepgram.com
الوثائق: https://developers.deepgram.com
البدء السريع
- عيّن مفتاح API الخاص بك:
DEEPGRAM_API_KEY=dg_...
- فعّل المزود:
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
الخيارات
model: معرف نموذج Deepgram (الافتراضي:nova-3)language: تلميح اللغة (اختياري)tools.media.audio.providerOptions.deepgram.detect_language: تمكين اكتشاف اللغة (اختياري)tools.media.audio.providerOptions.deepgram.punctuate: تمكين علامات الترقيم (اختياري)tools.media.audio.providerOptions.deepgram.smart_format: تمكين التنسيق الذكي (اختياري)
مثال مع لغة:
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
},
},
},
}
مثال مع خيارات Deepgram:
{
tools: {
media: {
audio: {
enabled: true,
providerOptions: {
deepgram: {
detect_language: true,
punctuate: true,
smart_format: true,
},
},
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
ملاحظات
- يتبع المصادقة ترتيب مصادقة المزود القياسي؛
DEEPGRAM_API_KEYهو المسار الأبسط. - يمكن تجاوز نقاط النهاية أو الرؤوس باستخدام
tools.media.audio.baseUrlوtools.media.audio.headersعند استخدام وكيل. - يتبع الناتج نفس قواعد الصوت الخاصة بالمزودين الآخرين (حدود الحجم، المهلات، حقن النص المُحول).