你已經付了 Claude Pro 一個月 20 美金。你也付了 ChatGPT Plus 一個月 20 美金。

然後你想把這些模型接到 Cursor 或者你自己寫的 script 裡——只能再買 API Key,按 token 計費。同一個模型,瀏覽器用是吃到飽,API 接是按表計時。

這就是 OpenClaw Zero Token 想解決的事。它的核心想法簡單到幾乎像作弊:你都已經在瀏覽器登入了,把那份登入態借用一下,外面包成一個標準的 OpenAI 相容 API,讓其他工具直接接上來。13 個 Provider、28 個以上的模型,全部統一介面。


為什麼 Web 版免費、API 要錢

這個問題的答案不在技術,在商業模式。

Web 版的訂閱費是「人類使用上限」——你按字打、滑滑鼠、看到回應再決定下一句問什麼。一天能消耗的 token 量天花板很低。所以業者用月費吃到飽撈。

API 是「機器使用上限」——你可以開 10 個併行 job、批次跑幾百萬 token。所以業者用 token 計費控制成本。

但對個人開發者來說很尷尬:你已經在付月費了,每月用不到 5% 的配額,卻沒辦法把這 95% 的剩餘配額拿來餵 Cursor 或 Continue。OpenClaw Zero Token 看到的就是這條浪費掉的縫——把瀏覽器的登入態抓出來,模擬 Web 版的請求,外面披一層 OpenAI 相容 API。

對外,你的工具看到的是熟悉的 POST /v1/chat/completions。對內,它正在打開一個 headless Chrome,用你登入的 Cookie 去呼叫 Claude.ai 或 chat.openai.com 的內部 API。


三層架構:Chrome、Gateway、Tools

整個系統可以拆成三個角色。

Chrome 是「身份證件袋」。你跑 start-chrome-debug.sh 啟動一個帶 9222 除錯埠的 Chrome 實例,用獨立 profile 避免污染日常瀏覽器。在這個 Chrome 裡手動登入 Claude、ChatGPT、Gemini、DeepSeek 等等。登完,這個 Chrome 就是一個帶著 13 張身份證件的口袋。

Gateway 是「翻譯員」。跑 onboard.sh webauth,Playwright 會透過 CDP(Chrome DevTools Protocol)連上那個 Chrome,攔截 network requests 把 Cookie 和 Bearer Token 抓下來存到本地 auth.json。之後 Gateway 收到外部請求,就用這些憑證去模擬 Web 版的呼叫。

Tools 是「客人」。Cursor、Continue、Claude Code、或任何支援 OpenAI API 的東西,都可以指向 http://127.0.0.1:3001 當作 API endpoint。它們不知道背後是 13 個不同平台,看到的就是一個統一的 OpenAI 相容介面。

這個分層的好處是責任清楚。憑證管理在 Chrome 裡(你看得到、登得進去)。協議翻譯在 Gateway 裡(一個 Node.js 程序)。業務邏輯留給工具自己(OpenAI 相容讓既有生態無痛接入)。


真正巧妙的部分:讓 Web 模型會 function calling

API 版的 Claude、ChatGPT 都有 function calling——你給它一組工具定義,它會吐出結構化的 tool call。Web 版沒有這個介面。

OpenClaw Zero Token 基於 arXiv:2407.04997 這篇論文的技術,做了一件很取巧的事:用 prompt 注入模擬 function calling。

它定義了 6 個核心工具:web_searchweb_fetchexecreadwritemessage。當你的訊息裡出現可能需要工具的關鍵字(內建約 50 個中英文偵測詞),Gateway 才會在 prompt 裡注入這些工具的 schema 定義。模型輸出後,再用 3 種正則模式去解析回應(fenced JSON、bare JSON、XML),跨平台格式都能 match。

幾個工程上的細節值得看:

關鍵字偵測式注入——不是每次都塞工具定義,是先看訊息裡有沒有「搜尋」「執行」「讀檔」這類動詞,有才注入。為什麼?因為平台會偵測異常 prompt 模式,每次都塞長系統提示容易被認出來。

語言適配——中國模型(DeepSeek、Doubao、智譜)用中文 prompt 工具描述效果更好。ChatGPT 走嚴格模式,會額外加 “No extra text” 抑制廢話。這是真的有人去逐家測過的細節。

多種解析模式並存——模型輸出工具呼叫的格式不統一。Claude 喜歡 fenced JSON,ChatGPT 偶爾會給 bare JSON,DeepSeek 有時候吐 XML。三種 parser 同時跑,誰先 match 誰先贏。

11 個 Provider 支援這套 prompt 注入工具調用,Doubao 因為 stream parser 限制目前還不支援。


AskOnce:同一個問題問 13 家

AskOnce 是另一個亮點,但它的價值不在「免費」,在「比較」。

你下一個 prompt,它並行送到你選的多個 Provider,回來時統一整理成 console、JSON 或 Markdown 三種輸出。要做模型選型、要看同一個問題不同模型怎麼答、要 benchmark——以前你得開十幾個分頁手動貼,現在一個指令搞定。

1
2
# 同一個問題問 Claude、ChatGPT、Gemini、DeepSeek
openclaw askonce "解釋 React Server Components" --providers claude,chatgpt,gemini,deepseek

這在學習一個新概念時特別有用。每個模型訓練資料和強項都不同,看 4 個答案的交集,比看 1 個答案的細節有效率得多。


用起來會踩到的坑

這部分要老實講,因為這個專案的設計哲學就決定了它不是萬靈丹。

合規風險是真的。各平台 ToS 裡都禁止自動化存取 Web 版,Cookie 抓出來模擬瀏覽器請求屬於灰色地帶。帳號被風控降級或封禁的可能性存在。我自己的判斷:個人實驗 OK,但拿去做產品或客戶服務,遲早會出事。

Session 會過期。Web 登入態有時效性,過期就得重新登入並重跑 onboard.sh webauth。各平台過期週期不同,Claude.ai 大概兩週、ChatGPT 一個月不等。要當生產服務用,就要寫排程監控 session 健康度。

沒有多輪上下文。Gateway 只送最後一則 user message 給 Web 模型。如果你的工具預期 API 維持完整對話歷史,會出現「上下文被截斷」的怪行為。這個限制是因為 Web 版的對話狀態管理在伺服器,本地沒辦法完整重建。

單使用者設計。Gateway 走「個人助理」模式,同一個 Chrome user-data-dir 不能跑兩個實例。團隊共用要每人一份。

憑證明文存本地。Cookie 和 Bearer Token 以明文存在 auth.json。如果機器被入侵,所有平台的登入態都會外洩。檔案權限至少要設 600。


它真正的價值是什麼

把 OpenClaw Zero Token 當「免費 API」是低估了它。

它真正解鎖的,是「把瀏覽器訂閱配額拿去餵自動化工具」這個之前沒人認真做的需求。你已經有 Claude Pro、ChatGPT Plus,每月配額大量浪費,那為什麼不把這些配額接到 Cursor 上做日常開發?為什麼不接到 Telegram bot 上做家人朋友的客服?為什麼不接到 Continue 上做整個 IDE 補全?

商業上的合規問題是另一回事。但技術上,這層 Web-to-API 的橋樑是個值得理解的設計樣板。對於想做多模型並發查詢、模型比較工具、或本地 Agent 的人,源碼裡 src/zero-token/ 那塊有不少可以拆來用的零件——尤其是 prompt 注入工具調用那段,那個關鍵字偵測 + 多 parser 的設計,是面對「不可靠輸出格式」的通用解法。

原文來源:OpenClaw Zero Token GitHub Repo
上游專案:OpenClaw
Prompt 注入工具調用:arXiv:2407.04997