Proveedores

Venice AI

Venice es nuestra configuración destacada para inferencia centrada en la privacidad con acceso opcional anonimizado a modelos propietarios. Venice AI proporciona inferencia de IA centrada en la privacidad con soporte para modelos sin censura y acceso a los principales modelos propietarios a través de su proxy anonimizado. Toda la inferencia es privada por defecto: sin entrenamiento con tus datos, sin registro.

Por qué Venice en OpenClaw

  • Inferencia privada para modelos de código abierto (sin registro).
  • Modelos sin censura cuando los necesitas.
  • Acceso anonimizado a modelos propietarios (Opus/GPT/Gemini) cuando la calidad importa.
  • Endpoints compatibles con OpenAI /v1.

Modos de Privacidad

Venice ofrece dos niveles de privacidad — entender esto es clave para elegir tu modelo:

ModoDescripciónModelos
PrivadoTotalmente privado. Los prompts/respuestas nunca se almacenan ni registran. Efímero.Llama, Qwen, DeepSeek, Kimi, MiniMax, Venice Uncensored, etc.
AnonimizadoProxificado a través de Venice con metadatos eliminados. El proveedor subyacente (OpenAI, Anthropic, Google, xAI) ve solicitudes anonimizadas.Claude, GPT, Gemini, Grok

Características

  • Centrado en la privacidad: Elige entre modos "privado" (totalmente privado) y "anonimizado" (proxificado)
  • Modelos sin censura: Acceso a modelos sin restricciones de contenido
  • Acceso a modelos principales: Usa Claude, GPT, Gemini y Grok a través del proxy anonimizado de Venice
  • API compatible con OpenAI: Endpoints estándar /v1 para una fácil integración
  • Streaming: ✅ Soportado en todos los modelos
  • Llamada a funciones: ✅ Soportado en modelos seleccionados (verifica las capacidades del modelo)
  • Visión: ✅ Soportado en modelos con capacidad de visión
  • Sin límites de tasa estrictos: Puede aplicarse limitación por uso justo para uso extremo

Configuración

1. Obtén la Clave API

  1. Regístrate en venice.ai
  2. Ve a Configuración → Claves API → Crear nueva clave
  3. Copia tu clave API (formato: vapi_xxxxxxxxxxxx)

2. Configura OpenClaw

Opción A: Variable de Entorno

export VENICE_API_KEY="vapi_xxxxxxxxxxxx"

Opción B: Configuración Interactiva (Recomendada)

openclaw onboard --auth-choice venice-api-key

Esto hará:

  1. Solicitará tu clave API (o usará la VENICE_API_KEY existente)
  2. Mostrará todos los modelos Venice disponibles
  3. Te permitirá elegir tu modelo por defecto
  4. Configurará el proveedor automáticamente

Opción C: No Interactiva

openclaw onboard --non-interactive \
  --auth-choice venice-api-key \
  --venice-api-key "vapi_xxxxxxxxxxxx"

3. Verifica la Configuración

openclaw agent --model venice/kimi-k2-5 --message "Hello, are you working?"

Selección de Modelo

Después de la configuración, OpenClaw muestra todos los modelos Venice disponibles. Elige según tus necesidades:

  • Modelo por defecto: venice/kimi-k2-5 para razonamiento privado fuerte más visión.
  • Opción de alta capacidad: venice/claude-opus-4-6 para la ruta Venice anonimizada más potente.
  • Privacidad: Elige modelos "privados" para inferencia totalmente privada.
  • Capacidad: Elige modelos "anonimizados" para acceder a Claude, GPT, Gemini a través del proxy de Venice.

Cambia tu modelo por defecto en cualquier momento:

openclaw models set venice/kimi-k2-5
openclaw models set venice/claude-opus-4-6

Lista todos los modelos disponibles:

openclaw models list | grep venice

Configurar vía openclaw configure

  1. Ejecuta openclaw configure
  2. Selecciona Modelo/autenticación
  3. Elige Venice AI

¿Qué Modelo Debo Usar?

Caso de UsoModelo RecomendadoPor qué
Chat general (por defecto)kimi-k2-5Razonamiento privado fuerte más visión
Mejor calidad generalclaude-opus-4-6Opción Venice anonimizada más potente
Privacidad + programaciónqwen3-coder-480b-a35b-instructModelo de programación privado con contexto grande
Visión privadakimi-k2-5Soporte de visión sin salir del modo privado
Rápido + económicoqwen3-4bModelo de razonamiento ligero
Tareas privadas complejasdeepseek-v3.2Razonamiento fuerte, pero sin soporte de herramientas Venice
Sin censuravenice-uncensoredSin restricciones de contenido

Modelos Disponibles (41 en Total)

Modelos Privados (26) — Totalmente Privados, Sin Registro

ID del ModeloNombreContextoCaracterísticas
kimi-k2-5Kimi K2.5256kPor defecto, razonamiento, visión
kimi-k2-thinkingKimi K2 Thinking256kRazonamiento
llama-3.3-70bLlama 3.3 70B128kGeneral
llama-3.2-3bLlama 3.2 3B128kGeneral
hermes-3-llama-3.1-405bHermes 3 Llama 3.1 405B128kGeneral, herramientas deshabilitadas
qwen3-235b-a22b-thinking-2507Qwen3 235B Thinking128kRazonamiento
qwen3-235b-a22b-instruct-2507Qwen3 235B Instruct128kGeneral
qwen3-coder-480b-a35b-instructQwen3 Coder 480B256kProgramación
qwen3-coder-480b-a35b-instruct-turboQwen3 Coder 480B Turbo256kProgramación
qwen3-5-35b-a3bQwen3.5 35B A3B256kRazonamiento, visión
qwen3-next-80bQwen3 Next 80B256kGeneral
qwen3-vl-235b-a22bQwen3 VL 235B (Visión)256kVisión
qwen3-4bVenice Small (Qwen3 4B)32kRápido, razonamiento
deepseek-v3.2DeepSeek V3.2160kRazonamiento, herramientas deshabilitadas
venice-uncensoredVenice Uncensored (Dolphin-Mistral)32kSin censura, herramientas deshabilitadas
mistral-31-24bVenice Medium (Mistral)128kVisión
google-gemma-3-27b-itGoogle Gemma 3 27B Instruct198kVisión
openai-gpt-oss-120bOpenAI GPT OSS 120B128kGeneral
nvidia-nemotron-3-nano-30b-a3bNVIDIA Nemotron 3 Nano 30B128kGeneral
olafangensan-glm-4.7-flash-hereticGLM 4.7 Flash Heretic128kRazonamiento
zai-org-glm-4.6GLM 4.6198kGeneral
zai-org-glm-4.7GLM 4.7198kRazonamiento
zai-org-glm-4.7-flashGLM 4.7 Flash128kRazonamiento
zai-org-glm-5GLM 5198kRazonamiento
minimax-m21MiniMax M2.1198kRazonamiento
minimax-m25MiniMax M2.5198kRazonamiento

Modelos Anonimizados (15) — A través del Proxy de Venice

ID del ModeloNombreContextoCaracterísticas
claude-opus-4-6Claude Opus 4.6 (vía Venice)1MRazonamiento, visión
claude-opus-4-5Claude Opus 4.5 (vía Venice)198kRazonamiento, visión
claude-sonnet-4-6Claude Sonnet 4.6 (vía Venice)1MRazonamiento, visión
claude-sonnet-4-5Claude Sonnet 4.5 (vía Venice)198kRazonamiento, visión
openai-gpt-54GPT-5.4 (vía Venice)1MRazonamiento, visión
openai-gpt-53-codexGPT-5.3 Codex (vía Venice)400kRazonamiento, visión, programación
openai-gpt-52GPT-5.2 (vía Venice)256kRazonamiento
openai-gpt-52-codexGPT-5.2 Codex (vía Venice)256kRazonamiento, visión, programación
openai-gpt-4o-2024-11-20GPT-4o (vía Venice)128kVisión
openai-gpt-4o-mini-2024-07-18GPT-4o Mini (vía Venice)128kVisión
gemini-3-1-pro-previewGemini 3.1 Pro (vía Venice)1MRazonamiento, visión
gemini-3-pro-previewGemini 3 Pro (vía Venice)198kRazonamiento, visión
gemini-3-flash-previewGemini 3 Flash (vía Venice)256kRazonamiento, visión
grok-41-fastGrok 4.1 Fast (vía Venice)1MRazonamiento, visión
grok-code-fast-1Grok Code Fast 1 (vía Venice)256kRazonamiento, programación

Descubrimiento de Modelos

OpenClaw descubre automáticamente modelos desde la API de Venice cuando VENICE_API_KEY está configurada. Si la API no es accesible, recurre a un catálogo estático. El endpoint /models es público (no se necesita autenticación para listar), pero la inferencia requiere una clave API válida.

Streaming y Soporte de Herramientas

CaracterísticaSoporte
Streaming✅ Todos los modelos
Llamada a funciones✅ La mayoría de modelos (verifica supportsFunctionCalling en la API)
Visión/Imágenes✅ Modelos marcados con la característica "Visión"
Modo JSON✅ Soportado vía response_format

Precios

Venice usa un sistema basado en créditos. Consulta venice.ai/pricing para las tarifas actuales:

  • Modelos privados: Generalmente costo más bajo
  • Modelos anonimizados: Similar a los precios de API directos + pequeña tarifa de Venice

Comparación: Venice vs API Directa

AspectoVenice (Anonimizado)API Directa
PrivacidadMetadatos eliminados, anonimizadoTu cuenta vinculada
Latencia+10-50ms (proxy)Directa
CaracterísticasLa mayoría de características soportadasTodas las características
FacturaciónCréditos VeniceFacturación del proveedor

Ejemplos de Uso

# Usa el modelo privado por defecto
openclaw agent --model venice/kimi-k2-5 --message "Quick health check"

# Usa Claude Opus vía Venice (anonimizado)
openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task"

# Usa modelo sin censura
openclaw agent --model venice/venice-uncensored --message "Draft options"

# Usa modelo de visión con imagen
openclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image"

# Usa modelo de programación
openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"

Resolución de Problemas

Clave API no reconocida

echo $VENICE_API_KEY
openclaw models list | grep venice

Asegúrate de que la clave comience con vapi_.

Modelo no disponible

El catálogo de modelos Venice se actualiza dinámicamente. Ejecuta openclaw models list para ver los modelos actualmente disponibles. Algunos modelos pueden estar temporalmente fuera de línea.

Problemas de conexión

La API de Venice está en https://api.venice.ai/api/v1. Asegúrate de que tu red permita conexiones HTTPS.

Ejemplo de archivo de configuración

{
  env: { VENICE_API_KEY: "vapi_..." },
  agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
  models: {
    mode: "merge",
    providers: {
      venice: {
        baseUrl: "https://api.venice.ai/api/v1",
        apiKey: "${VENICE_API_KEY}",
        api: "openai-completions",
        models: [
          {
            id: "kimi-k2-5",
            name: "Kimi K2.5",
            reasoning: true,
            input: ["text", "image"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 256000,
            maxTokens: 65536,
          },
        ],
      },
    },
  },
}

Enlaces

Vercel AI GatewayvLLM