Venice AI (Venice highlight)

Venice là lựa chọn nổi bật của mình cho inference ưu tiên quyền riêng tư với khả năng truy cập ẩn danh vào các model độc quyền.

Venice AI cung cấp AI inference tập trung vào quyền riêng tư với hỗ trợ các model không kiểm duyệt và truy cập vào các model độc quyền lớn thông qua proxy ẩn danh của họ. Tất cả inference đều riêng tư theo mặc định—không training trên dữ liệu của các bạn, không ghi log.

Tại sao dùng Venice trong OpenClaw

  • Inference riêng tư cho các model mã nguồn mở (không ghi log).
  • Model không kiểm duyệt khi các bạn cần.
  • Truy cập ẩn danh vào các model độc quyền (Opus/GPT/Gemini) khi chất lượng quan trọng.
  • Endpoint /v1 tương thích với OpenAI.

Chế độ riêng tư

Venice cung cấp hai cấp độ riêng tư — hiểu rõ điều này là chìa khóa để chọn model phù hợp:

Chế độMô tảModel
PrivateHoàn toàn riêng tư. Prompt/response không bao giờ được lưu trữ hoặc ghi log. Tạm thời.Llama, Qwen, DeepSeek, Venice Uncensored, v.v.
AnonymizedĐược proxy qua Venice với metadata bị loại bỏ. Provider bên dưới (OpenAI, Anthropic) chỉ thấy các request đã ẩn danh hóa.Claude, GPT, Gemini, Grok, Kimi, MiniMax

Tính năng

  • Tập trung vào quyền riêng tư: Chọn giữa chế độ “private” (hoàn toàn riêng tư) và “anonymized” (proxy)
  • Model không kiểm duyệt: Truy cập vào các model không có hạn chế nội dung
  • Truy cập model lớn: Sử dụng Claude, GPT-5.2, Gemini, Grok qua proxy ẩn danh của Venice
  • API tương thích OpenAI: Endpoint /v1 chuẩn để tích hợp dễ dàng
  • Streaming: ✅ Hỗ trợ trên tất cả model
  • Function calling: ✅ Hỗ trợ trên các model được chọn (kiểm tra khả năng của model)
  • Vision: ✅ Hỗ trợ trên các model có khả năng vision
  • Không có giới hạn tốc độ cứng: Có thể áp dụng điều chỉnh fair-use cho việc sử dụng cực đoan

Cài đặt

1. Lấy API Key

  1. Đăng ký tại venice.ai
  2. Vào Settings → API Keys → Create new key
  3. Copy API key của các bạn (định dạng: vapi_xxxxxxxxxxxx)

2. Cấu hình OpenClaw

Tùy chọn A: Biến môi trường

export VENICE_API_KEY="vapi_xxxxxxxxxxxx"

Tùy chọn B: Cài đặt tương tác (Khuyên dùng)

openclaw onboard --auth-choice venice-api-key

Lệnh này sẽ:

  1. Nhắc nhập API key của các bạn (hoặc dùng VENICE_API_KEY hiện có)
  2. Hiển thị tất cả các model Venice có sẵn
  3. Cho các bạn chọn model mặc định
  4. Tự động cấu hình provider

Tùy chọn C: Không tương tác

openclaw onboard --non-interactive \
  --auth-choice venice-api-key \
  --venice-api-key "vapi_xxxxxxxxxxxx"

3. Xác minh cài đặt

openclaw chat --model venice/llama-3.3-70b "Hello, are you working?"

Chọn model

Sau khi cài đặt, OpenClaw hiển thị tất cả các model Venice có sẵn. Chọn dựa trên nhu cầu của các bạn:

  • Mặc định (lựa chọn của mình): venice/llama-3.3-70b cho hiệu suất cân bằng, riêng tư.
  • Chất lượng tổng thể tốt nhất: venice/claude-opus-45 cho các công việc khó (Opus vẫn mạnh nhất).
  • Quyền riêng tư: Chọn các model “private” cho inference hoàn toàn riêng tư.
  • Khả năng: Chọn các model “anonymized” để truy cập Claude, GPT, Gemini qua proxy của Venice.

Thay đổi model mặc định bất cứ lúc nào:

openclaw models set venice/claude-opus-45
openclaw models set venice/llama-3.3-70b

Liệt kê tất cả các model có sẵn:

openclaw models list | grep venice

Cấu hình qua openclaw configure

  1. Chạy openclaw configure
  2. Chọn Model/auth
  3. Chọn Venice AI

Nên dùng model nào?

Trường hợp sử dụngModel khuyên dùngTại sao
Chat chungllama-3.3-70bTốt toàn diện, hoàn toàn riêng tư
Chất lượng tổng thể tốt nhấtclaude-opus-45Opus vẫn mạnh nhất cho các tác vụ khó
Quyền riêng tư + chất lượng Claudeclaude-opus-45Lý luận tốt nhất qua proxy ẩn danh
Codingqwen3-coder-480b-a35b-instructTối ưu cho code, context 262k
Tác vụ visionqwen3-vl-235b-a22bModel vision riêng tư tốt nhất
Không kiểm duyệtvenice-uncensoredKhông có hạn chế nội dung
Nhanh + rẻqwen3-4bNhẹ, vẫn có khả năng
Lý luận phức tạpdeepseek-v3.2Lý luận mạnh, riêng tư

Các model có sẵn (Tổng cộng 25)

Model Private (15) — Hoàn toàn riêng tư, không ghi log

Model IDTênContext (token)Tính năng
llama-3.3-70bLlama 3.3 70B131kChung
llama-3.2-3bLlama 3.2 3B131kNhanh, nhẹ
hermes-3-llama-3.1-405bHermes 3 Llama 3.1 405B131kTác vụ phức tạp
qwen3-235b-a22b-thinking-2507Qwen3 235B Thinking131kLý luận
qwen3-235b-a22b-instruct-2507Qwen3 235B Instruct131kChung
qwen3-coder-480b-a35b-instructQwen3 Coder 480B262kCode
qwen3-next-80bQwen3 Next 80B262kChung
qwen3-vl-235b-a22bQwen3 VL 235B262kVision
qwen3-4bVenice Small (Qwen3 4B)32kNhanh, lý luận
deepseek-v3.2DeepSeek V3.2163kLý luận
venice-uncensoredVenice Uncensored32kKhông kiểm duyệt
mistral-31-24bVenice Medium (Mistral)131kVision
google-gemma-3-27b-itGemma 3 27B Instruct202kVision
openai-gpt-oss-120bOpenAI GPT OSS 120B131kChung
zai-org-glm-4.7GLM 4.7202kLý luận, đa ngôn ngữ

Model Anonymized (10) — Qua Venice Proxy

Model IDGốcContext (token)Tính năng
claude-opus-45Claude Opus 4.5202kLý luận, vision
claude-sonnet-45Claude Sonnet 4.5202kLý luận, vision
openai-gpt-52GPT-5.2262kLý luận
openai-gpt-52-codexGPT-5.2 Codex262kLý luận, vision
gemini-3-pro-previewGemini 3 Pro202kLý luận, vision
gemini-3-flash-previewGemini 3 Flash262kLý luận, vision
grok-41-fastGrok 4.1 Fast262kLý luận, vision
grok-code-fast-1Grok Code Fast 1262kLý luận, code
kimi-k2-thinkingKimi K2 Thinking262kLý luận
minimax-m21MiniMax M2.1202kLý luận

Khám phá model

OpenClaw tự động khám phá các model từ Venice API khi VENICE_API_KEY được đặt. Nếu API không thể truy cập, nó sẽ quay lại catalog tĩnh.

Endpoint /models là công khai (không cần xác thực để liệt kê), nhưng inference yêu cầu API key hợp lệ.

Hỗ trợ Streaming & Tool

Tính năngHỗ trợ
Streaming✅ Tất cả model
Function calling✅ Hầu hết các model (kiểm tra supportsFunctionCalling trong API)
Vision/Images✅ Các model được đánh dấu có tính năng “Vision”
JSON mode✅ Hỗ trợ qua response_format

Giá cả

Venice sử dụng hệ thống dựa trên credit. Kiểm tra venice.ai/pricing để biết giá hiện tại:

  • Model private: Thường chi phí thấp hơn
  • Model anonymized: Tương tự giá API trực tiếp + phí Venice nhỏ

So sánh: Venice vs API trực tiếp

Khía cạnhVenice (Anonymized)API trực tiếp
Quyền riêng tưMetadata bị loại bỏ, ẩn danhTài khoản của bạn được liên kết
Độ trễ+10-50ms (proxy)Trực tiếp
Tính năngHầu hết tính năng được hỗ trợĐầy đủ tính năng
Thanh toánCredit VeniceThanh toán provider

Ví dụ sử dụng

# Dùng model private mặc định
openclaw chat --model venice/llama-3.3-70b

# Dùng Claude qua Venice (anonymized)
openclaw chat --model venice/claude-opus-45

# Dùng model không kiểm duyệt
openclaw chat --model venice/venice-uncensored

# Dùng model vision với hình ảnh
openclaw chat --model venice/qwen3-vl-235b-a22b

# Dùng model coding
openclaw chat --model venice/qwen3-coder-480b-a35b-instruct

Troubleshooting

API key không được nhận dạng

echo $VENICE_API_KEY
openclaw models list | grep venice

Đảm bảo key bắt đầu bằng vapi_.

Model không có sẵn

Catalog model Venice cập nhật động. Chạy openclaw models list để xem các model hiện có sẵn. Một số model có thể tạm thời offline.

Vấn đề kết nối

Venice API ở https://api.venice.ai/api/v1. Đảm bảo mạng của các bạn cho phép kết nối HTTPS.

Ví dụ file config

{
  env: { VENICE_API_KEY: "vapi_..." },
  agents: { defaults: { model: { primary: "venice/llama-3.3-70b" } } },
  models: {
    mode: "merge",
    providers: {
      venice: {
        baseUrl: "https://api.venice.ai/api/v1",
        apiKey: "${VENICE_API_KEY}",
        api: "openai-completions",
        models: [
          {
            id: "llama-3.3-70b",
            name: "Llama 3.3 70B",
            reasoning: false,
            input: ["text"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 131072,
            maxTokens: 8192,
          },
        ],
      },
    },
  },
}

Liên kết