跳转到内容

Deepgram

Deepgram 是一个语音转文本 API。在 OpenClaw 中,它通过 tools.media.audio 用于 入站音频/语音笔记转录

启用后,OpenClaw 将音频文件上传到 Deepgram,并将转录内容注入回复管道({{Transcript}} + [Audio] 块)。这不是流式传输;它使用预录制的转录端点。

网站: https://deepgram.com 文档: https://developers.deepgram.com

  1. 设置您的 API 密钥:
DEEPGRAM_API_KEY=dg_...
  1. 启用提供商:
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
  • model: Deepgram 模型 ID (默认: nova-3)
  • language: 语言提示 (可选)
  • tools.media.audio.providerOptions.deepgram.detect_language: 启用语言检测 (可选)
  • tools.media.audio.providerOptions.deepgram.punctuate: 启用标点符号 (可选)
  • tools.media.audio.providerOptions.deepgram.smart_format: 启用智能格式化 (可选)

带语言的示例:

{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3", language: "zh" }],
},
},
},
}

带 Deepgram 选项的示例:

{
tools: {
media: {
audio: {
enabled: true,
providerOptions: {
deepgram: {
detect_language: true,
punctuate: true,
smart_format: true,
},
},
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
  • 身份验证遵循标准提供商身份验证顺序;DEEPGRAM_API_KEY 是最简单的路径。
  • 使用代理时,通过 tools.media.audio.baseUrltools.media.audio.headers 覆盖端点或标头。
  • 输出遵循与其他提供商相同的音频规则(大小限制、超时、转录注入)。