「免費」這兩個字大概是軟體界最容易讓人誤會的詞。

打開 free-claude-code 的 GitHub 頁面,第一直覺會以為「啊,這應該是某種繞過 Anthropic 訂閱、白嫖 Claude 的工具」。看完 README 才知道——它的 free 是「不付 Anthropic 訂閱費」,不是「不付任何 LLM 費用」。你還是得拿出 NVIDIA NIM、DeepSeek、Kimi 或者 OpenRouter 的 API key,或者自己在家裡跑一台 Ollama。

換個角度想:它賣的不是免費的算力,是免費的「介面」。Claude Code 的 TUI、tool use 行為、agentic loop 整套體驗,原本是綁在 Anthropic 模型上的;free-claude-code 把那層介面跟模型解綁了。


它到底在做什麼

把它拆到最基本:這是一個跑在你本機 localhost:8082 的反向代理,假扮成 api.anthropic.com

想像家裡的智慧開關。原本壁掛開關直接連到燈泡,按下去就亮。現在中間插一個小盒子,按下開關時,盒子收到訊號,再決定要點亮哪一盞燈——可能是客廳的、可能是書房的、也可能是窗外那串聖誕燈。介面(牆上的開關)一模一樣,但實際被點亮的東西完全不同。

free-claude-code 就是那個盒子。

Claude Code CLI、VS Code extension、JetBrains 的 ACP 連線——它們發出來的請求格式是 Anthropic Messages API。proxy 攔截下來,根據你的設定轉成 OpenAI chat completions 格式,或者 Anthropic-compat 格式,丟給 11 個下游 provider:NVIDIA NIM、DeepSeek、OpenRouter、Kimi(Moonshot)、Z.ai 的 GLM 系列、Wafer、Fireworks,還有本地的 LM Studio、llama.cpp、Ollama。

回應再翻譯回 Anthropic 期待的 SSE 串流格式——message_startcontent_block_deltamessage_deltamessage_stop——塞回 Claude Code。從 Claude Code 的視角看,一切跟接官方 API 一模一樣。


它不是 OpenClaude 那一類東西

這點要先講清楚,因為很容易誤會。

repo 描述寫「like OpenClaw」,這就是混淆的起點。OpenClaude、OpenClaw 那類工具的機制是盜用 Claude.ai 的 OAuth token 重放官方 API,等於是用個人訂閱代轉商業流量。Anthropic 官方今年初已經公開表態要堵這條路,被抓到帳號就 ban。

free-claude-code 完全沒打 api.anthropic.comANTHROPIC_AUTH_TOKEN=freecc 是 proxy 自訂的固定字串,跟 Anthropic 一點關係都沒有。它要付錢的對象是下游 provider,不是 Anthropic。

兩者放在同一張表上看:

工具 機制 對 Anthropic 的風險
free-claude-code 協定翻譯到第三方 LLM 不接 Anthropic,風險低
OpenClaude 變體 盜用 OAuth token 重放官方 API 明確違反 ToS
Pro/Max 代轉工具 個人訂閱跑商業流量 違反 Consumer ToS

差別在於 free-claude-code 翻譯協定、不重放認證;其他兩種繞認證、消費 Anthropic 的算力。法律與技術上完全是兩件事。


為什麼會有人想用

寫到這邊先停一下,想清楚這工具的定位很重要。如果你期待的是「免費吃到飽用 Claude Opus 4.7」,那它幫不上你的忙——下游不是 Claude,品質會有落差,特別是長 context 的 agentic 任務,DeepSeek 跟 Kimi 都跑得起來,但穩定性參差。

真正會用這東西的人,動機通常是這五種:

想試試 Claude Code 的 agentic 體驗,又不想付 Anthropic 訂閱。 Pro 每月 20 美金、Max 每月 100 到 200 美金,對 side project 來說不便宜。先用 NVIDIA NIM 的免費額度(40 RPM 限制)跑跑看 Claude Code 的工作流,覺得真的有用再付錢給 Anthropic。

公司禁止把原始碼丟到雲端 LLM。 這在金融、醫療、政府承包商很常見。用 Ollama 拉 Qwen 或 Llama 3.1 70B 在公司內網跑,搭配本地 transport,原始碼完全不出公司網路。

混合模型成本最佳化。 Haiku 等級的小事走本地 LM Studio 免費跑、中階 Sonnet 等級的走 DeepSeek(每百萬 token 不到一美金)、偶爾需要 Opus 等級的推理走 NIM 的 Kimi K2.5。同一個 Claude Code 介面,月成本可能不到 5 美金。

跨地區可用。 Anthropic 沒開放的地區——中國、俄羅斯、部分中東國家——可以用 DeepSeek 的中國境內 API、Z.ai 的 GLM,仍然享受 Claude Code 的 TUI 跟工作流。

手機遠端 coding。 配上內建的 Discord / Telegram bot,把家裡的 Mac mini 或公司開發機當作 Claude Code workspace。出門用手機傳訊息,bot 在家執行、回傳 diff。

每一種動機都對應一種我們本來解不了的問題。所以這工具存在的意義是「把介面跟模型解耦」這件事本身——不是替代品,是補位。


最小可運行流程

它的安裝設計得意外乾淨。一行指令拉完:

1
2
# macOS / Linux
curl -fsSL "https://github.com/Alishahryar1/free-claude-code/blob/main/scripts/install.sh?raw=1" | sh

腳本實際做的事:裝官方的 @anthropic-ai/claude-code、裝 uv、裝 Python 3.14、pip install 這個 repo,然後註冊四個 CLI 指令:fcc-serverfcc-claudefcc-initfree-claude-code

Python 3.14 是硬性需求——repo 用了 except X, Y: 這種 PEP 758 才開放的無括號語法,舊版會 syntax error。

跑起來只要三步:

1
2
3
4
5
6
7
8
9
10
# 1. 啟動 proxy server
fcc-server
# > Admin UI: http://127.0.0.1:8082/admin (local-only)

# 2. 開瀏覽器到 Admin UI 貼 API key
# 例如到 build.nvidia.com 拿免費 NIM key
# 填到 NVIDIA_NIM_API_KEY 欄位 → Validate → Apply

# 3. 啟動 Claude Code(會自動帶好環境變數)
fcc-claude

Admin UI 只綁 loopback(127.0.0.1),遠端連不上。這是刻意的安全設計,因為 API key 都明文存在本地——別想著把它改成 0.0.0.0 拿來「方便管理」,那等於把所有 provider 的 key 暴露在網路上。


多 Provider 分層路由

這是它比一般 OpenAI-style proxy 多做的工。

Claude Code 內部會根據任務用不同等級的模型——簡單補完走 Haiku、一般 coding 走 Sonnet、深度推理走 Opus。proxy 設定可以把每個 tier 對應到不同 provider:

1
2
3
4
MODEL_OPUS=nvidia_nim/moonshotai/kimi-k2.5
MODEL_SONNET=open_router/deepseek/deepseek-r1-0528:free
MODEL_HAIKU=lmstudio/unsloth/GLM-4.7-Flash-GGUF
MODEL=zai/glm-5.1 # fallback

當你在 Claude Code 裡用 /model 切換時,proxy 根據對應的 Claude 模型 tier 自動派發。

最有意思的是它對「雜訊請求」的處理。Claude Code 會頻繁發出網路探測、標題生成、suggestion mode、filepath extraction 這類不需要真正動用 LLM 的請求。proxy 提供 ENABLE_NETWORK_PROBE_MOCK=trueENABLE_TITLE_GENERATION_SKIP=true 這類開關,在本地直接 mock 回應,不送到下游浪費 quota。

這就是會看細節的人才會做的事。免費額度動輒 40 RPM 上限,省下這些雜訊請求可以多撐很久。


兩個容易踩的坑

第一個是本地模型 context 容易爆

llama.cpp 預設的 --ctx-size 通常是 2048 或 4096,Claude Code 一次 prompt 動輒 100k 以上。回 HTTP 400 多半是這個原因。要把 ctx 拉到 200k 以上才撐得住完整的 agentic loop,但 200k context 對應的 VRAM 需求可能會直接吃光你的 GPU。

第二個是Discord / Telegram bot 模式等於開了 RCE 後門

bot 啟動之後,使用者可以從手機傳訊息讓 bot 在你的開發機上執行 shell 指令、編輯檔案。如果 ALLOWED_DIR 沒鎖死、Discord channel ID 白名單沒設好、token 不小心外流——你家伺服器就是一個遠端 shell。

不是不能用,但要把它當成正式的 production 服務做安全規劃。channel ID 鎖死、token 用 secret manager 管、ALLOWED_DIR 永遠用最小權限原則。


該不該用

把這工具拆到最基本,它的核心觀察是這個:Claude Code 真正有價值的不是模型,是 harness

harness 是什麼?是它的 TUI、它的 tool use loop、它對 codebase 的理解、它的 plan mode、它的 subagent 機制、它的 SkillTool。這些東西原本鎖在 Anthropic 的訂閱裡。free-claude-code 把鎖打開——你想用 harness 但不想用 Claude?可以,付費給別家就好。

但這個觀察反過來看也成立:模型本身就是 Claude Code harness 最大的差異化。Sonnet 4.6 跟 Opus 4.7 在 agentic 任務上比 DeepSeek、Kimi 穩定很多。當你把模型換掉,那層 harness 還在,但體驗會明顯次一階。

所以該不該用的問題其實是:你為什麼用 Claude Code?

  • 因為它的 agent loop 邏輯設計得好 → free-claude-code 能完成 60% 的事
  • 因為 Sonnet/Opus 在這類任務上特別強 → 那就乖乖付訂閱
  • 因為公司不准雲端 LLM、或者你在 Anthropic 不開放的地區 → free-claude-code 是少數可行的選擇

工具本身做得很扎實,FastAPI + httpx + uv + Ruff + ty + Pytest 一整套現代 Python toolchain。11 個 provider 的協定翻譯不是寫寫而已的工作量。但它不是 Claude 的免費版——它是 Claude Code 介面層的開源版。先想清楚這個區別,再決定要不要裝。


相關連結