A
返回 指令庫
指令庫2026/05/10 君澤智庫研究員 Bryan Chan9 分鐘閱讀

三層框架大模型 API 配置總表:DS V4 Pro、Qwen 3.6、oMLX 本地

在 Hermes Agent、OpenClaw、Claude Code 中配置 DeepSeek V4 Pro、Qwen 3.6-Plus、oMLX 本地 Qwen3 Coder Next 的完整指南。

各層模型配置總覽

           Hermes Agent         OpenClaw                Claude Code
──────────────────────────────────────────────────────────────────
模型        Qwen 3.6-Plus        DS V4 Pro ✅             DS V4 Pro ✅
           (ModelStudio)         Qwen 3.6-Plus ✅         Qwen 3.6-Plus ✅
                                 oMLX Qwen3 Coder ✅      本地 Qwen3 Coder ✅
──────────────────────────────────────────────────────────────────
用途        背景搜集              主力對話                 多實例代碼
           系統檢查              任務編排                 · Pro:複雜邏輯
           技能學習              技能調度                 · Qwen:快速迭代
           (備援備用)            部署決策                 · 本地:隱私代碼

Hermes Agent — Qwen 3.6-Plus

# ~/.hermes/config.yaml
model:
  provider: modelstudio
  model: qwen3.6-plus
  api_key: "sk-xxx"
  base_url: "https://dashscope.aliyuncs.com/compatible-mode/v1"
  plan: coding  # ModelStudio Coding Plan

OpenClaw — 三個後端

// ~/.openclaw/openclaw.json
{
  "models": {
    "default": "deepseek-pro",
    "providers": {
      "deepseek-pro": {
        "api_key": "sk-xxx",
        "base_url": "https://api.deepseek.com/v1",
        "model": "deepseek-reasoner"
      },
      "qwen": {
        "api_key": "sk-xxx",
        "base_url": "https://dashscope.aliyuncs.com/compatible-mode/v1",
        "model": "qwen3.6-plus"
      },
      "local-coder": {
        "api_key": "not-needed",
        "base_url": "http://localhost:8080/v1",
        "model": "qwen3-coder-next"
      }
    },
    "routing": {
      "rules": [
        {"pattern": "code|refactor|debug", "provider": "deepseek-pro"},
        {"pattern": "中文|translate|content", "provider": "qwen"},
        {"pattern": "private|secret|key|password", "provider": "local-coder"}
      ]
    }
  }
}

oMLX 本地 Qwen3 Coder Next

啟動

# 下載模型(MLX 格式)
mlx_lm.convert --hf-path Qwen/Qwen3-Coder-Next --mlx-path ~/models/qwen3-coder-next -q

# 啟動 API Server
mlx_lm.server --model ~/models/qwen3-coder-next --port 8080

配置 Claude Code Local 實例

// ~/.claude-local.json
{
  "apiKey": "not-needed",
  "baseURL": "http://localhost:8080/v1",
  "model": "qwen3-coder-next"
}

啟動:

claude --config ~/.claude-local.json --cwd ~/my-private-project

Claude Code 三個實例管理

#!/bin/bash
# ~/bin/cc-launcher

case "$1" in
  pro)
    export CLAUDE_CONFIG=~/.claude-pro.json  # DS V4 Pro
    claude --cwd "$2"
    ;;
  qwen)
    export CLAUDE_CONFIG=~/.claude-qwen.json  # Qwen 3.6-Plus
    claude --cwd "$2"
    ;;
  local)
    export CLAUDE_CONFIG=~/.claude-local.json # oMLX 本地
    claude --cwd "$2"
    ;;
  *)
    echo "Usage: cc-launcher [pro|qwen|local] [project-dir]"
    ;;
esac
alias cc-pro='cc-launcher pro'
alias cc-qwen='cc-launcher qwen'
alias cc-local='cc-launcher local'

成本對比

模型 輸入/1M tokens 輸出/1M tokens 擅長
DS V4 Pro $0.55 $2.19 推理、架構
DS V4 Flash $0.14 $0.28 日常、快速
Qwen 3.6-Plus ~$1.00 ~$4.00 中文、內容
本地 Qwen3 Coder 免費 免費 隱私代碼

相關文章