Voice Call (Plugin)
Sprachanrufe für OpenClaw über ein Plugin. Unterstützt ausgehende Benachrichtigungen und mehrstufige Gespräche mit Richtlinien für eingehende Anrufe.
Aktuell verfügbare Provider:
twilio(Programmable Voice + Media Streams)telnyx(Call Control v2)plivo(Voice API + XML transfer + GetInput speech)mock(Entwicklung/ohne Netzwerk)
Schneller Überblick:
- Plugin installieren
- Gateway neu starten
- Konfiguration unter
plugins.entries.voice-call.configvornehmen openclaw voicecall ...oder dasvoice_callTool verwenden
Wo läuft es (lokal vs. remote)
Das Voice Call Plugin läuft innerhalb des Gateway-Prozesses.
Wenn du ein Remote-Gateway verwendest, installiere und konfiguriere das Plugin auf der Maschine, auf der das Gateway läuft, und starte dann das Gateway neu, um es zu laden.
Installation
Option A: Installation von npm (empfohlen)
openclaw plugins install @openclaw/voice-call
Starte danach das Gateway neu.
Option B: Installation aus lokalem Ordner (Entwicklung, ohne Kopieren)
openclaw plugins install ./extensions/voice-call
cd ./extensions/voice-call && pnpm install
Starte danach das Gateway neu.
Konfiguration
Setze die Konfiguration unter plugins.entries.voice-call.config:
{
plugins: {
entries: {
"voice-call": {
enabled: true,
config: {
provider: "twilio", // or "telnyx" | "plivo" | "mock"
fromNumber: "+15550001234",
toNumber: "+15550005678",
twilio: {
accountSid: "ACxxxxxxxx",
authToken: "...",
},
plivo: {
authId: "MAxxxxxxxxxxxxxxxxxxxx",
authToken: "...",
},
// Webhook server
serve: {
port: 3334,
path: "/voice/webhook",
},
// Public exposure (pick one)
// publicUrl: "https://example.ngrok.app/voice/webhook",
// tunnel: { provider: "ngrok" },
// tailscale: { mode: "funnel", path: "/voice/webhook" }
outbound: {
defaultMode: "notify", // notify | conversation
},
streaming: {
enabled: true,
streamPath: "/voice/stream",
},
},
},
},
},
}
Hinweise:
- Twilio/Telnyx benötigen eine öffentlich erreichbare Webhook-URL.
- Plivo benötigt eine öffentlich erreichbare Webhook-URL.
mockist ein lokaler Entwicklungs-Provider (keine Netzwerkaufrufe).skipSignatureVerificationist nur für lokale Tests gedacht.- Wenn du ngrok im Free-Tier verwendest, setze
publicUrlauf die exakte ngrok-URL; die Signaturverifizierung ist immer aktiv. tunnel.allowNgrokFreeTierLoopbackBypass: trueerlaubt Twilio-Webhooks mit ungültigen Signaturen nur, wenntunnel.provider="ngrok"undserve.bindauf Loopback steht (ngrok local agent). Nur für lokale Entwicklung verwenden.- Ngrok Free-Tier-URLs können sich ändern oder Zwischenseiten hinzufügen; wenn
publicUrlabweicht, schlagen Twilio-Signaturen fehl. Für Produktion empfehlen wir eine stabile Domain oder Tailscale Funnel.
TTS für Anrufe
Voice Call verwendet die zentrale messages.tts Konfiguration (OpenAI oder ElevenLabs) für Streaming-Sprache bei Anrufen. Du kannst sie in der Plugin-Konfiguration mit der gleichen Struktur überschreiben — sie wird mit messages.tts tief zusammengeführt.
{
tts: {
provider: "elevenlabs",
elevenlabs: {
voiceId: "pMsXgVXv3BLzUgSXRplE",
modelId: "eleven_multilingual_v2",
},
},
}
Hinweise:
- Edge TTS wird für Sprachanrufe ignoriert (Telefonie-Audio benötigt PCM; Edge-Output ist unzuverlässig).
- Die zentrale TTS wird verwendet, wenn Twilio Media Streaming aktiviert ist; andernfalls fallen Anrufe auf die nativen Stimmen des Providers zurück.
Weitere Beispiele
Nur zentrale TTS verwenden (keine Überschreibung):
{
messages: {
tts: {
provider: "openai",
openai: { voice: "alloy" },
},
},
}
Nur für Anrufe auf ElevenLabs überschreiben (zentrale Standardeinstellung bleibt anderswo):
{
plugins: {
entries: {
"voice-call": {
config: {
tts: {
provider: "elevenlabs",
elevenlabs: {
apiKey: "elevenlabs_key",
voiceId: "pMsXgVXv3BLzUgSXRplE",
modelId: "eleven_multilingual_v2",
},
},
},
},
},
},
}
Nur das OpenAI-Modell für Anrufe überschreiben (Deep-Merge-Beispiel):
{
plugins: {
entries: {
"voice-call": {
config: {
tts: {
openai: {
model: "gpt-4o-mini-tts",
voice: "marin",
},
},
},
},
},
},
}
Eingehende Anrufe
Die Richtlinie für eingehende Anrufe ist standardmäßig auf disabled gesetzt. Um eingehende Anrufe zu aktivieren, setze:
{
inboundPolicy: "allowlist",
allowFrom: ["+15550001234"],
inboundGreeting: "Hello! How can I help?",
}
Automatische Antworten verwenden das Agent-System. Anpassbar über:
responseModelresponseSystemPromptresponseTimeoutMs
CLI
openclaw voicecall call --to "+15555550123" --message "Hello from OpenClaw"
openclaw voicecall continue --call-id <id> --message "Any questions?"
openclaw voicecall speak --call-id <id> --message "One moment"
openclaw voicecall end --call-id <id>
openclaw voicecall status --call-id <id>
openclaw voicecall tail
openclaw voicecall expose --mode funnel
Agent Tool
Tool-Name: voice_call
Aktionen:
initiate_call(message, to?, mode?)continue_call(callId, message)speak_to_user(callId, message)end_call(callId)get_status(callId)
Dieses Repo enthält eine passende Skill-Dokumentation unter skills/voice-call/SKILL.md.
Gateway RPC
voicecall.initiate(to?,message,mode?)voicecall.continue(callId,message)voicecall.speak(callId,message)voicecall.end(callId)voicecall.status(callId)