什麼是三層 Agent 框架?
當 AI Agent 的任務變得複雜時,單一 Agent 往往無法勝任。三層 Agent 框架將任務垂直分層,每一層專注不同的抽象級別:
┌─────────────────────────────────────────┐
│ Layer 1: Hermes Agent (通訊層) │
│ ─ 管理所有外部通訊渠道 │
│ ─ 飛書/Lark、WhatsApp、微信等 │
│ ─ 接收指令、分發任務、回傳結果 │
├─────────────────────────────────────────┤
│ Layer 2: OpenClaw (編排層) │
│ ─ 任務理解、拆解、排程 │
│ ─ 管理 Claude Code Bridge 技能 │
│ ─ Skills 與工具調用 │
├─────────────────────────────────────────┤
│ Layer 3: Claude Code (執行層) │
│ ─ 代碼生成、檔案編輯、Shell 執行 │
│ ─ Git 操作、專案管理 │
│ ─ 由 ModelStudio / DeepSeek 驅動 │
└─────────────────────────────────────────┘
Layer 1:Hermes Agent(通訊層)
職責:作為系統的「耳朵和嘴巴」,管理所有對外通訊。
- 接入飛書/Lark Bot,接收用戶的自然語言指令
- 支援多渠道:WhatsApp、微信、Telegram 等
- 將用戶意圖解析後傳遞給 OpenClaw
- 把執行結果格式化回傳給用戶
為什麼需要獨立一層?
通訊邏輯(消息格式、Webhook、事件推送)和業務邏輯(任務執行)完全是兩種不同的關注點。分離後:
- 換通訊平台不影響核心業務
- Hermes 可以同時接入多個渠道
- 用戶體驗統一,不管從哪個入口發指令,行為一致
Layer 2:OpenClaw(編排層)
職責:系統的「大腦」,負責理解任務、拆解步驟、協調資源。
- 接收 Hermes 傳來的用戶意圖
- 將複雜任務拆解為可執行的子任務
- 管理 Skills(可復用的能力模塊)
- 通過 Claude Code Bridge 調用 Claude Code 執行具體操作
- 維護上下文記憶,跨任務關聯
關鍵技能:Claude Code Bridge
這是一個 OpenClaw 的插件/Skill,讓 OpenClaw 能夠直接操作 Claude Code:
User → Hermes → OpenClaw → [Claude Code Bridge] → Claude Code → 執行
橋接器封裝了 Claude Code 的 CLI 接口,讓 OpenClaw 能夠:
- 啟動 Claude Code 會話
- 傳遞任務描述
- 讀取執行結果
- 管理多個並行 Claude Code 實例
Layer 3:Claude Code(執行層)
職責:系統的「手」,實際操作文件系統、執行代碼。
- 讀取和編輯代碼庫
- 執行 Shell 命令
- Git 操作(commit、branch、diff)
- 由 LLM 驅動(ModelStudio / DeepSeek)
雙模型配置策略:
| 場景 | 模型 | 原因 | |------|------|------| | 日常編碼 | DeepSeek V3 | 性價比高、推理強 | | 複雜重構 | DeepSeek R1 | 深度推理 | | 長上下文 | ModelStudio (Qwen) | 阿里生態整合 | | 備援 | 兩者互為備份 | API 故障自動切換 |
通訊流程
一個完整的用戶請求流程:
- 用戶在飛書發送:「幫我檢查 OpenClaw 專案的最新 commit,看看有沒有 bug」
- Hermes Agent 接收消息,解析意圖 → "code review request for OpenClaw"
- Hermes 將任務傳給 OpenClaw
- OpenClaw 拆解為:
- Step 1:通過 Claude Code Bridge 啟動 Claude Code
- Step 2:
git log查看最近 commit - Step 3:
git diff檢查變更 - Step 4:Claude Code 分析代碼
- Step 5:生成 Review 報告
- OpenClaw 匯總結果,傳給 Hermes
- Hermes 格式化為飛書消息,回傳給用戶
設計原則
- 單一職責:每層只做一件事,做好一件事
- 鬆散耦合:層與層之間通過明確定義的接口通訊,可以獨立升級或替換
- 容錯隔離:某一層故障不影響其他層,例如 Claude Code API 限流時,OpenClaw 可以排隊重試
- 可觀測性:每層都有日誌輸出,方便排查問題
適用場景
- 個人開發助手(自動化日常開發任務)
- 團隊協作(多人通過飛書群組與 Agent 互動)
- CI/CD 增強(Agent 參與代碼審查和部署決策)
- 知識管理(Agent 自動整理文檔、生成報告)