Claude Code Fast Mode 完整教學 — 用同一個 Opus 把回應速度拉快 2.5 倍

以前在 Claude Code 裡想要「回快一點」，你只有一條路：把模型換小。

卡在等回應的時候，老做法是切到 Haiku 或 Sonnet。快是快了，但你心裡很清楚自己做了什麼交易——你拿品質換速度。複雜的重構、需要繞好幾層的推理，小模型常常給你一個「跑得動但不太對」的答案，最後你還是得切回 Opus 重來一遍。等於繞了一圈，時間不見得省到。

這個老問題現在有了新解法，而且解法的方向跟過去完全相反。

先把那個交易講清楚：速度和品質，過去為什麼必須二選一

想像你去餐廳點菜。以前要「上菜快」，你只能點簡單的——三明治很快，但你想吃的是那道要慢火燉的牛肉。廚房的邏輯是：菜越複雜，做越久。想快，就得犧牲你真正想吃的東西。

過去 AI 模型的速度也是這個邏輯。模型越大越聰明，吐字就越慢，因為它要算的東西更多。所以「想快」幾乎等於「換個笨一點的腦袋」。Haiku 跑得飛快，但它本來就不是設計來扛複雜任務的。

Fast Mode 做的事，是把這條等式拆掉。它的核心很反直覺：同一道牛肉，不換廚師、不換食材，只是讓廚房用一套不一樣的流程把它端得更快。

具體來說，Fast Mode 用的還是 Claude Opus——一模一樣的模型、一模一樣的能力——只是換了一套優先衝刺速度的 API 設定。官方的說法很直接：你拿到的是「identical quality and capabilities with faster responses」，相同品質、相同能力，只是回得更快。實測最高可以快到 2.5 倍。

那代價呢？天下沒有白吃的午餐。Fast Mode 的代價不是品質，是 per-token 的單價變高。你不是用「變笨」換速度，是用「變貴」換速度。這個交易的性質，跟過去完全不同。

怎麼開：一個指令的事

開 Fast Mode 簡單到有點不真實。在 Claude Code 裡打：

/fast

就切換了。再打一次 /fast，它會告訴你現在是開還是關。這個指令是 toggle，開關同一顆。

如果你想讓它預設就開著，不想每次手動切，去你的 user settings 檔加一行：

1
2
3

{
  "fastMode": true
}

有一個前提要先確認：Fast Mode 需要 Claude Code v2.1.36 以上的版本。先跑這個檢查你手上的版本：

1	claude --version

版本太舊就先升級，不然 /fast 會找不到。這一步別跳過——我看過有人卡在「為什麼我沒有這個指令」，最後發現只是版本沒更新。

可用範圍也講一下：Fast Mode 支援 Opus 4.8、Opus 4.7、Opus 4.6 三個版本，訂閱方案 Pro、Max、Team、Enterprise 都能用，Claude Console 也支援。

什麼時候該開，什麼時候該關

這才是重點。Fast Mode 不是「越快越好所以永遠開著」，它是個有取捨的工具，用對場景才划算。

判斷的關鍵問你自己一個問題：這個任務，你是在旁邊盯著等它回，還是丟著去做別的事？

如果你在做互動式的工作——快速迭代、現場 debug、一來一回試東西——那每一秒的等待都是你真實的時間成本，你人就坐在那裡乾等。這種時候開 Fast Mode 最值得，省下的是你的注意力，那比 token 錢貴多了。卡在 live debugging 的時候，回應快 2.5 倍的體感差異非常明顯，思路不會因為等待而斷掉。

反過來，如果你是把一個大任務丟給它，然後跑去開會、去泡咖啡、去做另一件事——那回應快不快根本無所謂，反正你不在電腦前。這種背景型、批次型的任務，開 Fast Mode 就是純燒錢，省下來的時間你根本沒在用。

逆向想一遍最清楚：什麼情況下 Fast Mode 反而是壞選擇？答案是——當你根本不在等它的時候。速度的價值來自「有人在等」，沒人等的時候，速度一文不值。

Opus 4.8 把這件事的算盤打翻了

Fast Mode 剛出來的時候，那個「變貴」的代價其實不小。在 Opus 4.7 和 4.6 上，Fast Mode 的價格是每百萬 token 輸入 30 美元、輸出 150 美元。這個價格讓很多人猶豫——快是很爽，但貴成這樣，只敢在最關鍵的時刻開。

Opus 4.8 把這個算盤整個打翻了。

在 Opus 4.8 上，Fast Mode 的價格降到每百萬 token 輸入 10 美元、輸出 50 美元。對照舊版的 30/150，這是直接砍到三分之一。同樣是 Fast Mode，在 Opus 4.8 上比在前一代便宜了三倍。

這個降價的意義，比數字本身大。它把 Fast Mode 從「只敢偶爾開的奢侈品」，變成「日常互動可以常駐的工具」。當快速回應的成本門檻降下來，你對它的使用心態也會跟著變——以前是「這次很重要才開」，現在可以是「我在跟它一來一回的時候，就讓它一直開著」。價格從來不只是價格，它決定了一個功能會被當成備用方案還是預設習慣。

跟「換小模型」的老路，到底差在哪

把新舊兩條路擺在一起，差異就很清楚了。

換小模型（Haiku/Sonnet）這條老路，你動的是「腦袋」。換來的是速度跟低價，賠掉的是處理複雜任務的能力。適合的場景是任務本身就簡單——格式整理、簡單問答、不需要深度推理的活。這條路沒有消失，它依然是省錢的好選擇，前提是你的任務配得上小模型。

Fast Mode 這條新路，你動的是「流程」。腦袋還是那顆 Opus，換來的是速度，賠掉的是 per-token 的單價。適合的場景是任務需要 Opus 級的智商，但你又坐在那裡等——複雜重構、深度 debug、需要它想清楚但你不想等那麼久。

所以這兩者根本不是互相取代的關係，是回答兩個不同的問題。「我的任務夠簡單嗎？」——夠簡單，換小模型。「我需要好答案而且我在等？」——開 Fast Mode。真正聰明的用法是兩個一起在腦子裡，看任務性質隨手切換，而不是死守其中一條。

學完這個，下一步往哪走

Fast Mode 本身很單純，一個指令就上手。但它背後牽出的那條線——「怎麼在速度、品質、成本之間做動態取捨」——才是 Claude Code 進階使用真正的功課。

順著這條線往下，你會想搞懂多模型混用的策略：什麼時候用 Haiku 打雜、什麼時候用 Sonnet 做中等任務、什麼時候非 Opus 不可，再疊上 Fast Mode 這個速度旋鈕。這四個選項組合起來，才是一套完整的「算力預算管理」心法。再往後，Opus 4.8 一起推出的 Dynamic Workflows——讓 AI 自己寫腳本指揮上百個分身——又是另一個維度的取捨：那裡你管的不是單次回應的快慢，是整個任務編排的並行度。

說到底，從「換小模型求快」到「Fast Mode 求快」，變的不只是一個功能。變的是你看待 AI 工具的方式——你不再被迫在快和好之間二選一，而是開始把速度、品質、成本當成三個可以分別調的旋鈕。會不會用 Claude Code，差距越來越不在你知道多少指令，而在你懂不懂得在對的時刻轉對的那顆旋鈕。