OpenClaw Zero Token — 用瀏覽器登入態免費呼叫 13 家 AI 模型

你已經付了 Claude Pro 一個月 20 美金。你也付了 ChatGPT Plus 一個月 20 美金。

然後你想把這些模型接到 Cursor 或者你自己寫的 script 裡——只能再買 API Key，按 token 計費。同一個模型，瀏覽器用是吃到飽，API 接是按表計時。

這就是 OpenClaw Zero Token 想解決的事。它的核心想法簡單到幾乎像作弊：你都已經在瀏覽器登入了，把那份登入態借用一下，外面包成一個標準的 OpenAI 相容 API，讓其他工具直接接上來。13 個 Provider、28 個以上的模型，全部統一介面。

為什麼 Web 版免費、API 要錢

這個問題的答案不在技術，在商業模式。

Web 版的訂閱費是「人類使用上限」——你按字打、滑滑鼠、看到回應再決定下一句問什麼。一天能消耗的 token 量天花板很低。所以業者用月費吃到飽撈。

API 是「機器使用上限」——你可以開 10 個併行 job、批次跑幾百萬 token。所以業者用 token 計費控制成本。

但對個人開發者來說很尷尬：你已經在付月費了，每月用不到 5% 的配額，卻沒辦法把這 95% 的剩餘配額拿來餵 Cursor 或 Continue。OpenClaw Zero Token 看到的就是這條浪費掉的縫——把瀏覽器的登入態抓出來，模擬 Web 版的請求，外面披一層 OpenAI 相容 API。

對外，你的工具看到的是熟悉的 POST /v1/chat/completions。對內，它正在打開一個 headless Chrome，用你登入的 Cookie 去呼叫 Claude.ai 或 chat.openai.com 的內部 API。

三層架構：Chrome、Gateway、Tools

整個系統可以拆成三個角色。

Chrome 是「身份證件袋」。你跑 start-chrome-debug.sh 啟動一個帶 9222 除錯埠的 Chrome 實例，用獨立 profile 避免污染日常瀏覽器。在這個 Chrome 裡手動登入 Claude、ChatGPT、Gemini、DeepSeek 等等。登完，這個 Chrome 就是一個帶著 13 張身份證件的口袋。

Gateway 是「翻譯員」。跑 onboard.sh webauth，Playwright 會透過 CDP（Chrome DevTools Protocol）連上那個 Chrome，攔截 network requests 把 Cookie 和 Bearer Token 抓下來存到本地 auth.json。之後 Gateway 收到外部請求，就用這些憑證去模擬 Web 版的呼叫。

Tools 是「客人」。Cursor、Continue、Claude Code、或任何支援 OpenAI API 的東西，都可以指向 http://127.0.0.1:3001 當作 API endpoint。它們不知道背後是 13 個不同平台，看到的就是一個統一的 OpenAI 相容介面。

這個分層的好處是責任清楚。憑證管理在 Chrome 裡（你看得到、登得進去）。協議翻譯在 Gateway 裡（一個 Node.js 程序）。業務邏輯留給工具自己（OpenAI 相容讓既有生態無痛接入）。

真正巧妙的部分：讓 Web 模型會 function calling

API 版的 Claude、ChatGPT 都有 function calling——你給它一組工具定義，它會吐出結構化的 tool call。Web 版沒有這個介面。

OpenClaw Zero Token 基於 arXiv:2407.04997 這篇論文的技術，做了一件很取巧的事：用 prompt 注入模擬 function calling。

它定義了 6 個核心工具：web_search、web_fetch、exec、read、write、message。當你的訊息裡出現可能需要工具的關鍵字（內建約 50 個中英文偵測詞），Gateway 才會在 prompt 裡注入這些工具的 schema 定義。模型輸出後，再用 3 種正則模式去解析回應（fenced JSON、bare JSON、XML），跨平台格式都能 match。

幾個工程上的細節值得看：

關鍵字偵測式注入——不是每次都塞工具定義，是先看訊息裡有沒有「搜尋」「執行」「讀檔」這類動詞，有才注入。為什麼？因為平台會偵測異常 prompt 模式，每次都塞長系統提示容易被認出來。

語言適配——中國模型（DeepSeek、Doubao、智譜）用中文 prompt 工具描述效果更好。ChatGPT 走嚴格模式，會額外加 “No extra text” 抑制廢話。這是真的有人去逐家測過的細節。

多種解析模式並存——模型輸出工具呼叫的格式不統一。Claude 喜歡 fenced JSON，ChatGPT 偶爾會給 bare JSON，DeepSeek 有時候吐 XML。三種 parser 同時跑，誰先 match 誰先贏。

11 個 Provider 支援這套 prompt 注入工具調用，Doubao 因為 stream parser 限制目前還不支援。

AskOnce：同一個問題問 13 家

AskOnce 是另一個亮點，但它的價值不在「免費」，在「比較」。

你下一個 prompt，它並行送到你選的多個 Provider，回來時統一整理成 console、JSON 或 Markdown 三種輸出。要做模型選型、要看同一個問題不同模型怎麼答、要 benchmark——以前你得開十幾個分頁手動貼，現在一個指令搞定。

1 2	# 同一個問題問 Claude、ChatGPT、Gemini、DeepSeek openclaw askonce "解釋 React Server Components" --providers claude,chatgpt,gemini,deepseek

這在學習一個新概念時特別有用。每個模型訓練資料和強項都不同，看 4 個答案的交集，比看 1 個答案的細節有效率得多。

用起來會踩到的坑

這部分要老實講，因為這個專案的設計哲學就決定了它不是萬靈丹。

合規風險是真的。各平台 ToS 裡都禁止自動化存取 Web 版，Cookie 抓出來模擬瀏覽器請求屬於灰色地帶。帳號被風控降級或封禁的可能性存在。我自己的判斷：個人實驗 OK，但拿去做產品或客戶服務，遲早會出事。

Session 會過期。Web 登入態有時效性，過期就得重新登入並重跑 onboard.sh webauth。各平台過期週期不同，Claude.ai 大概兩週、ChatGPT 一個月不等。要當生產服務用，就要寫排程監控 session 健康度。

沒有多輪上下文。Gateway 只送最後一則 user message 給 Web 模型。如果你的工具預期 API 維持完整對話歷史，會出現「上下文被截斷」的怪行為。這個限制是因為 Web 版的對話狀態管理在伺服器，本地沒辦法完整重建。

單使用者設計。Gateway 走「個人助理」模式，同一個 Chrome user-data-dir 不能跑兩個實例。團隊共用要每人一份。

憑證明文存本地。Cookie 和 Bearer Token 以明文存在 auth.json。如果機器被入侵，所有平台的登入態都會外洩。檔案權限至少要設 600。

它真正的價值是什麼

把 OpenClaw Zero Token 當「免費 API」是低估了它。

它真正解鎖的，是「把瀏覽器訂閱配額拿去餵自動化工具」這個之前沒人認真做的需求。你已經有 Claude Pro、ChatGPT Plus，每月配額大量浪費，那為什麼不把這些配額接到 Cursor 上做日常開發？為什麼不接到 Telegram bot 上做家人朋友的客服？為什麼不接到 Continue 上做整個 IDE 補全？

商業上的合規問題是另一回事。但技術上，這層 Web-to-API 的橋樑是個值得理解的設計樣板。對於想做多模型並發查詢、模型比較工具、或本地 Agent 的人，源碼裡 src/zero-token/ 那塊有不少可以拆來用的零件——尤其是 prompt 注入工具調用那段，那個關鍵字偵測 + 多 parser 的設計，是面對「不可靠輸出格式」的通用解法。