Claude Code Fast Mode 完整教學 — 用同一個 Opus 把回應速度拉快 2.5 倍
以前在 Claude Code 裡想要「回快一點」,你只有一條路:把模型換小。
卡在等回應的時候,老做法是切到 Haiku 或 Sonnet。快是快了,但你心裡很清楚自己做了什麼交易——你拿品質換速度。複雜的重構、需要繞好幾層的推理,小模型常常給你一個「跑得動但不太對」的答案,最後你還是得切回 Opus 重來一遍。等於繞了一圈,時間不見得省到。
這個老問題現在有了新解法,而且解法的方向跟過去完全相反。
先把那個交易講清楚:速度和品質,過去為什麼必須二選一
想像你去餐廳點菜。以前要「上菜快」,你只能點簡單的——三明治很快,但你想吃的是那道要慢火燉的牛肉。廚房的邏輯是:菜越複雜,做越久。想快,就得犧牲你真正想吃的東西。
過去 AI 模型的速度也是這個邏輯。模型越大越聰明,吐字就越慢,因為它要算的東西更多。所以「想快」幾乎等於「換個笨一點的腦袋」。Haiku 跑得飛快,但它本來就不是設計來扛複雜任務的。
Fast Mode 做的事,是把這條等式拆掉。它的核心很反直覺:同一道牛肉,不換廚師、不換食材,只是讓廚房用一套不一樣的流程把它端得更快。
具體來說,Fast Mode 用的還是 Claude Opus——一模一樣的模型、一模一樣的能力——只是換了一套優先衝刺速度的 API 設定。官方的說法很直接:你拿到的是「identical quality and capabilities with faster responses」,相同品質、相同能力,只是回得更快。實測最高可以快到 2.5 倍。
那代價呢?天下沒有白吃的午餐。Fast Mode 的代價不是品質,是 per-token 的單價變高。你不是用「變笨」換速度,是用「變貴」換速度。這個交易的性質,跟過去完全不同。
怎麼開:一個指令的事
開 Fast Mode 簡單到有點不真實。在 Claude Code 裡打:
1 | /fast |
就切換了。再打一次 /fast,它會告訴你現在是開還是關。這個指令是 toggle,開關同一顆。
如果你想讓它預設就開著,不想每次手動切,去你的 user settings 檔加一行:
1 | { |
有一個前提要先確認:Fast Mode 需要 Claude Code v2.1.36 以上的版本。先跑這個檢查你手上的版本:
1 | claude --version |
版本太舊就先升級,不然 /fast 會找不到。這一步別跳過——我看過有人卡在「為什麼我沒有這個指令」,最後發現只是版本沒更新。
可用範圍也講一下:Fast Mode 支援 Opus 4.8、Opus 4.7、Opus 4.6 三個版本,訂閱方案 Pro、Max、Team、Enterprise 都能用,Claude Console 也支援。
什麼時候該開,什麼時候該關
這才是重點。Fast Mode 不是「越快越好所以永遠開著」,它是個有取捨的工具,用對場景才划算。
判斷的關鍵問你自己一個問題:這個任務,你是在旁邊盯著等它回,還是丟著去做別的事?
如果你在做互動式的工作——快速迭代、現場 debug、一來一回試東西——那每一秒的等待都是你真實的時間成本,你人就坐在那裡乾等。這種時候開 Fast Mode 最值得,省下的是你的注意力,那比 token 錢貴多了。卡在 live debugging 的時候,回應快 2.5 倍的體感差異非常明顯,思路不會因為等待而斷掉。
反過來,如果你是把一個大任務丟給它,然後跑去開會、去泡咖啡、去做另一件事——那回應快不快根本無所謂,反正你不在電腦前。這種背景型、批次型的任務,開 Fast Mode 就是純燒錢,省下來的時間你根本沒在用。
逆向想一遍最清楚:什麼情況下 Fast Mode 反而是壞選擇?答案是——當你根本不在等它的時候。速度的價值來自「有人在等」,沒人等的時候,速度一文不值。
Opus 4.8 把這件事的算盤打翻了
Fast Mode 剛出來的時候,那個「變貴」的代價其實不小。在 Opus 4.7 和 4.6 上,Fast Mode 的價格是每百萬 token 輸入 30 美元、輸出 150 美元。這個價格讓很多人猶豫——快是很爽,但貴成這樣,只敢在最關鍵的時刻開。
Opus 4.8 把這個算盤整個打翻了。
在 Opus 4.8 上,Fast Mode 的價格降到每百萬 token 輸入 10 美元、輸出 50 美元。對照舊版的 30/150,這是直接砍到三分之一。同樣是 Fast Mode,在 Opus 4.8 上比在前一代便宜了三倍。
這個降價的意義,比數字本身大。它把 Fast Mode 從「只敢偶爾開的奢侈品」,變成「日常互動可以常駐的工具」。當快速回應的成本門檻降下來,你對它的使用心態也會跟著變——以前是「這次很重要才開」,現在可以是「我在跟它一來一回的時候,就讓它一直開著」。價格從來不只是價格,它決定了一個功能會被當成備用方案還是預設習慣。
跟「換小模型」的老路,到底差在哪
把新舊兩條路擺在一起,差異就很清楚了。
換小模型(Haiku/Sonnet)這條老路,你動的是「腦袋」。換來的是速度跟低價,賠掉的是處理複雜任務的能力。適合的場景是任務本身就簡單——格式整理、簡單問答、不需要深度推理的活。這條路沒有消失,它依然是省錢的好選擇,前提是你的任務配得上小模型。
Fast Mode 這條新路,你動的是「流程」。腦袋還是那顆 Opus,換來的是速度,賠掉的是 per-token 的單價。適合的場景是任務需要 Opus 級的智商,但你又坐在那裡等——複雜重構、深度 debug、需要它想清楚但你不想等那麼久。
所以這兩者根本不是互相取代的關係,是回答兩個不同的問題。「我的任務夠簡單嗎?」——夠簡單,換小模型。「我需要好答案而且我在等?」——開 Fast Mode。真正聰明的用法是兩個一起在腦子裡,看任務性質隨手切換,而不是死守其中一條。
學完這個,下一步往哪走
Fast Mode 本身很單純,一個指令就上手。但它背後牽出的那條線——「怎麼在速度、品質、成本之間做動態取捨」——才是 Claude Code 進階使用真正的功課。
順著這條線往下,你會想搞懂多模型混用的策略:什麼時候用 Haiku 打雜、什麼時候用 Sonnet 做中等任務、什麼時候非 Opus 不可,再疊上 Fast Mode 這個速度旋鈕。這四個選項組合起來,才是一套完整的「算力預算管理」心法。再往後,Opus 4.8 一起推出的 Dynamic Workflows——讓 AI 自己寫腳本指揮上百個分身——又是另一個維度的取捨:那裡你管的不是單次回應的快慢,是整個任務編排的並行度。
說到底,從「換小模型求快」到「Fast Mode 求快」,變的不只是一個功能。變的是你看待 AI 工具的方式——你不再被迫在快和好之間二選一,而是開始把速度、品質、成本當成三個可以分別調的旋鈕。會不會用 Claude Code,差距越來越不在你知道多少指令,而在你懂不懂得在對的時刻轉對的那顆旋鈕。
參考來源:Speed up responses with fast mode - Claude Code Docs
參考來源:Introducing Claude Opus 4.8 - Anthropic










