free-claude-code — 把 Claude Code 介面接到第三方 LLM 的協定翻譯 proxy

「免費」這兩個字大概是軟體界最容易讓人誤會的詞。

打開 free-claude-code 的 GitHub 頁面，第一直覺會以為「啊，這應該是某種繞過 Anthropic 訂閱、白嫖 Claude 的工具」。看完 README 才知道——它的 free 是「不付 Anthropic 訂閱費」，不是「不付任何 LLM 費用」。你還是得拿出 NVIDIA NIM、DeepSeek、Kimi 或者 OpenRouter 的 API key，或者自己在家裡跑一台 Ollama。

換個角度想：它賣的不是免費的算力，是免費的「介面」。Claude Code 的 TUI、tool use 行為、agentic loop 整套體驗，原本是綁在 Anthropic 模型上的；free-claude-code 把那層介面跟模型解綁了。

它到底在做什麼

把它拆到最基本：這是一個跑在你本機 localhost:8082 的反向代理，假扮成 api.anthropic.com。

想像家裡的智慧開關。原本壁掛開關直接連到燈泡，按下去就亮。現在中間插一個小盒子，按下開關時，盒子收到訊號，再決定要點亮哪一盞燈——可能是客廳的、可能是書房的、也可能是窗外那串聖誕燈。介面（牆上的開關）一模一樣，但實際被點亮的東西完全不同。

free-claude-code 就是那個盒子。

Claude Code CLI、VS Code extension、JetBrains 的 ACP 連線——它們發出來的請求格式是 Anthropic Messages API。proxy 攔截下來，根據你的設定轉成 OpenAI chat completions 格式，或者 Anthropic-compat 格式，丟給 11 個下游 provider：NVIDIA NIM、DeepSeek、OpenRouter、Kimi（Moonshot）、Z.ai 的 GLM 系列、Wafer、Fireworks，還有本地的 LM Studio、llama.cpp、Ollama。

回應再翻譯回 Anthropic 期待的 SSE 串流格式——message_start、content_block_delta、message_delta、message_stop——塞回 Claude Code。從 Claude Code 的視角看，一切跟接官方 API 一模一樣。

它不是 OpenClaude 那一類東西

這點要先講清楚，因為很容易誤會。

repo 描述寫「like OpenClaw」，這就是混淆的起點。OpenClaude、OpenClaw 那類工具的機制是盜用 Claude.ai 的 OAuth token 重放官方 API，等於是用個人訂閱代轉商業流量。Anthropic 官方今年初已經公開表態要堵這條路，被抓到帳號就 ban。

free-claude-code 完全沒打 api.anthropic.com。ANTHROPIC_AUTH_TOKEN=freecc 是 proxy 自訂的固定字串，跟 Anthropic 一點關係都沒有。它要付錢的對象是下游 provider，不是 Anthropic。

兩者放在同一張表上看：

工具	機制	對 Anthropic 的風險
free-claude-code	協定翻譯到第三方 LLM	不接 Anthropic，風險低
OpenClaude 變體	盜用 OAuth token 重放官方 API	明確違反 ToS
Pro/Max 代轉工具	個人訂閱跑商業流量	違反 Consumer ToS

差別在於 free-claude-code 翻譯協定、不重放認證；其他兩種繞認證、消費 Anthropic 的算力。法律與技術上完全是兩件事。

為什麼會有人想用

寫到這邊先停一下，想清楚這工具的定位很重要。如果你期待的是「免費吃到飽用 Claude Opus 4.7」，那它幫不上你的忙——下游不是 Claude，品質會有落差，特別是長 context 的 agentic 任務，DeepSeek 跟 Kimi 都跑得起來，但穩定性參差。

真正會用這東西的人，動機通常是這五種：

想試試 Claude Code 的 agentic 體驗，又不想付 Anthropic 訂閱。 Pro 每月 20 美金、Max 每月 100 到 200 美金，對 side project 來說不便宜。先用 NVIDIA NIM 的免費額度（40 RPM 限制）跑跑看 Claude Code 的工作流，覺得真的有用再付錢給 Anthropic。

公司禁止把原始碼丟到雲端 LLM。 這在金融、醫療、政府承包商很常見。用 Ollama 拉 Qwen 或 Llama 3.1 70B 在公司內網跑，搭配本地 transport，原始碼完全不出公司網路。

混合模型成本最佳化。 Haiku 等級的小事走本地 LM Studio 免費跑、中階 Sonnet 等級的走 DeepSeek（每百萬 token 不到一美金）、偶爾需要 Opus 等級的推理走 NIM 的 Kimi K2.5。同一個 Claude Code 介面，月成本可能不到 5 美金。

跨地區可用。 Anthropic 沒開放的地區——中國、俄羅斯、部分中東國家——可以用 DeepSeek 的中國境內 API、Z.ai 的 GLM，仍然享受 Claude Code 的 TUI 跟工作流。

手機遠端 coding。 配上內建的 Discord / Telegram bot，把家裡的 Mac mini 或公司開發機當作 Claude Code workspace。出門用手機傳訊息，bot 在家執行、回傳 diff。

每一種動機都對應一種我們本來解不了的問題。所以這工具存在的意義是「把介面跟模型解耦」這件事本身——不是替代品，是補位。

最小可運行流程

它的安裝設計得意外乾淨。一行指令拉完：

1 2	# macOS / Linux curl -fsSL "https://github.com/Alishahryar1/free-claude-code/blob/main/scripts/install.sh?raw=1" \| sh

腳本實際做的事：裝官方的 @anthropic-ai/claude-code、裝 uv、裝 Python 3.14、pip install 這個 repo，然後註冊四個 CLI 指令：fcc-server、fcc-claude、fcc-init、free-claude-code。

Python 3.14 是硬性需求——repo 用了 except X, Y: 這種 PEP 758 才開放的無括號語法，舊版會 syntax error。

跑起來只要三步：

# 1. 啟動 proxy server
fcc-server
# > Admin UI: http://127.0.0.1:8082/admin (local-only)

# 2. 開瀏覽器到 Admin UI 貼 API key
#    例如到 build.nvidia.com 拿免費 NIM key
#    填到 NVIDIA_NIM_API_KEY 欄位 → Validate → Apply

# 3. 啟動 Claude Code（會自動帶好環境變數）
fcc-claude

Admin UI 只綁 loopback（127.0.0.1），遠端連不上。這是刻意的安全設計，因為 API key 都明文存在本地——別想著把它改成 0.0.0.0 拿來「方便管理」，那等於把所有 provider 的 key 暴露在網路上。

多 Provider 分層路由

這是它比一般 OpenAI-style proxy 多做的工。

Claude Code 內部會根據任務用不同等級的模型——簡單補完走 Haiku、一般 coding 走 Sonnet、深度推理走 Opus。proxy 設定可以把每個 tier 對應到不同 provider：

MODEL_OPUS=nvidia_nim/moonshotai/kimi-k2.5
MODEL_SONNET=open_router/deepseek/deepseek-r1-0528:free
MODEL_HAIKU=lmstudio/unsloth/GLM-4.7-Flash-GGUF
MODEL=zai/glm-5.1   # fallback

當你在 Claude Code 裡用 /model 切換時，proxy 根據對應的 Claude 模型 tier 自動派發。

最有意思的是它對「雜訊請求」的處理。Claude Code 會頻繁發出網路探測、標題生成、suggestion mode、filepath extraction 這類不需要真正動用 LLM 的請求。proxy 提供 ENABLE_NETWORK_PROBE_MOCK=true、ENABLE_TITLE_GENERATION_SKIP=true 這類開關，在本地直接 mock 回應，不送到下游浪費 quota。

這就是會看細節的人才會做的事。免費額度動輒 40 RPM 上限，省下這些雜訊請求可以多撐很久。

兩個容易踩的坑

第一個是本地模型 context 容易爆。

llama.cpp 預設的 --ctx-size 通常是 2048 或 4096，Claude Code 一次 prompt 動輒 100k 以上。回 HTTP 400 多半是這個原因。要把 ctx 拉到 200k 以上才撐得住完整的 agentic loop，但 200k context 對應的 VRAM 需求可能會直接吃光你的 GPU。

第二個是Discord / Telegram bot 模式等於開了 RCE 後門。

bot 啟動之後，使用者可以從手機傳訊息讓 bot 在你的開發機上執行 shell 指令、編輯檔案。如果 ALLOWED_DIR 沒鎖死、Discord channel ID 白名單沒設好、token 不小心外流——你家伺服器就是一個遠端 shell。

不是不能用，但要把它當成正式的 production 服務做安全規劃。channel ID 鎖死、token 用 secret manager 管、ALLOWED_DIR 永遠用最小權限原則。

該不該用

把這工具拆到最基本，它的核心觀察是這個：Claude Code 真正有價值的不是模型，是 harness。

harness 是什麼？是它的 TUI、它的 tool use loop、它對 codebase 的理解、它的 plan mode、它的 subagent 機制、它的 SkillTool。這些東西原本鎖在 Anthropic 的訂閱裡。free-claude-code 把鎖打開——你想用 harness 但不想用 Claude？可以，付費給別家就好。

但這個觀察反過來看也成立：模型本身就是 Claude Code harness 最大的差異化。Sonnet 4.6 跟 Opus 4.7 在 agentic 任務上比 DeepSeek、Kimi 穩定很多。當你把模型換掉，那層 harness 還在，但體驗會明顯次一階。

所以該不該用的問題其實是：你為什麼用 Claude Code？

因為它的 agent loop 邏輯設計得好 → free-claude-code 能完成 60% 的事
因為 Sonnet/Opus 在這類任務上特別強 → 那就乖乖付訂閱
因為公司不准雲端 LLM、或者你在 Anthropic 不開放的地區 → free-claude-code 是少數可行的選擇

工具本身做得很扎實，FastAPI + httpx + uv + Ruff + ty + Pytest 一整套現代 Python toolchain。11 個 provider 的協定翻譯不是寫寫而已的工作量。但它不是 Claude 的免費版——它是 Claude Code 介面層的開源版。先想清楚這個區別，再決定要不要裝。