プロバイダー
Deepgram
Deepgramは音声認識APIです。OpenClawでは、tools.media.audioを介したインバウンド音声/ボイスノートの文字起こしに使用されます。有効にすると、OpenClawは音声ファイルをDeepgramにアップロードし、文字起こし結果を返信パイプラインに注入します({{Transcript}} + [Audio]ブロック)。これはストリーミングではありません。事前録音された文字起こしエンドポイントを使用します。ウェブサイト: https://deepgram.com
ドキュメント: https://developers.deepgram.com
クイックスタート
- APIキーを設定します:
DEEPGRAM_API_KEY=dg_...
- プロバイダーを有効にします:
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
オプション
model: DeepgramモデルID(デフォルト:nova-3)language: 言語ヒント(オプション)tools.media.audio.providerOptions.deepgram.detect_language: 言語検出を有効化(オプション)tools.media.audio.providerOptions.deepgram.punctuate: 句読点を有効化(オプション)tools.media.audio.providerOptions.deepgram.smart_format: スマートフォーマットを有効化(オプション)
言語を指定した例:
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
},
},
},
}
Deepgramオプションを指定した例:
{
tools: {
media: {
audio: {
enabled: true,
providerOptions: {
deepgram: {
detect_language: true,
punctuate: true,
smart_format: true,
},
},
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
注意事項
- 認証は標準的なプロバイダー認証順序に従います。
DEEPGRAM_API_KEYが最もシンプルな方法です。 - プロキシを使用する場合は、
tools.media.audio.baseUrlとtools.media.audio.headersでエンドポイントやヘッダーをオーバーライドできます。 - 出力は他のプロバイダーと同じ音声ルールに従います(サイズ制限、タイムアウト、文字起こし結果の注入)。