Claude Opus 4.7 新功能實戰 — xhigh、Task Budgets 與 /ultrareview

跑一個重構任務，Claude 花了 45 分鐘、燒掉 120K token，結果最後 5% 的改動因為 context 爆了被截斷。

如果你用 Claude Code 跑過長任務，這個場景應該不陌生。Opus 4.7 帶來的三個新功能——xhigh effort、Task Budgets 和 /ultrareview——本質上都在解決同一個問題：怎麼讓 Agent 聰明地分配有限資源。

/effort xhigh — 不想等 max 但 high 不夠的時候

之前的 effort 只有三檔：low、high、max。問題是 high 和 max 之間的落差太大——high 有時候不夠仔細，max 又慢到讓你懷疑它是不是去吃飯了。

把它想成開車。low 是高速公路定速巡航，掃一眼就過；high 是市區正常開，該注意的路口會看；max 是在停車場找車位，一格一格慢慢掃。xhigh 就是「市區開但遇到複雜路口會多看兩眼」——比 high 仔細但不會像 max 那樣龜速。

在 Claude Code 裡直接用 /effort xhigh 切換。適用場景：中等複雜度的 bug 修復、跨多個檔案的重構、需要考慮邊界條件但又不想等太久的任務。

實測下來，xhigh 在處理「需要看上下文但不需要深度推理」的任務時，速度大約是 max 的 60-70%，但品質接近 max 的 90%。這個甜蜜點很實用。

Task Budgets — 讓 Agent 自己管預算

這是 Opus 4.7 最有意思的新功能，目前還在 beta。

概念很簡單：你給 Claude 一個 token 預算，它會看到一個倒數計時器，自己決定怎麼分配。比如你說「用 50K token 做完這個重構」，Claude 會先評估任務量，把最重要的改動排前面，次要的排後面，如果預算快用完就優雅地收尾而不是突然被截斷。

類比來說，這就像是專案管理裡的「固定預算，彈性範圍」。你不是告訴 Claude 該做什麼（那是 prompt 的事），而是告訴它有多少資源可以用。剩下的優先級排序，讓它自己判斷。

之前跑長任務最大的痛點就是不可預測性——你不知道 Agent 會花多少 token、會不會中途爆掉、最後一步會不會被截斷。Task Budgets 不能完全解決這個問題，但至少讓 Agent 有了「資源意識」。它知道自己有多少彈藥，會自己決定先打哪個目標。

需要注意的是，Task Budgets 目前是 beta，行為不保證穩定。而且 budget 是「大約」的參考值，不是硬性上限。Claude 可能會在關鍵步驟超出一點，或者在簡單步驟省下一些。把它當成「建議」而不是「命令」會比較不會踩坑。

/ultrareview — 模擬資深工程師的 Code Review

/ultrareview 是 Claude Code 裡的新指令，設計目標是模擬一個資深人類 reviewer 的行為。跟一般的 linter 或靜態分析不同，它不只看語法和格式，還會抓設計缺陷和邏輯漏洞。

比如說你寫了一個 retry 機制，linter 會告訴你「這裡的變數沒用到」，但 /ultrareview 會告訴你「retry 之間沒有指數退避，高流量下會變成 DDoS 自己的 API」。它看的是意圖和後果，不只是語法。

使用方式很簡單，在 Claude Code 裡打 /ultrareview 就會對當前的 diff 做一次深度審查。它會輸出分級的問題列表——critical、warning、suggestion——每個都附上具體的修改建議。

搭配 xhigh effort 一起用效果最好：先用 /effort xhigh 確保 review 的深度，再跑 /ultrareview。用 high 有時候會漏掉比較隱晦的邏輯問題，max 又太慢，xhigh 剛好。

有一點要注意：/ultrareview 的 review 品質高度依賴 context。如果你的 diff 很大（超過 500 行），建議分段 review 而不是一次全丟進去。Claude 在小範圍內的判斷力明顯比大範圍好。

高解析度視覺 — 從 1.15MP 到 3.75MP

Opus 4.7 另一個比較少人注意但很實用的改動：圖片最大解析度從 1568px / 1.15MP 拉到 2576px / 3.75MP，翻了三倍多。

這對需要讓 Claude 看截圖的場景影響很大。之前丟一張全螢幕截圖進去，小字會糊掉，Claude 常常看錯文字或忽略細節。現在解析度夠了，讀 UI 截圖、分析 dashboard、甚至看架構圖都清楚很多。

搭配 Computer Use 功能的話，高解析度意味著 Agent 能更準確地辨識螢幕上的元素，點擊錯誤率下降。

Tokenizer 的隱藏陷阱

最後一個容易忽略的點：Opus 4.7 用了新的 tokenizer。同樣的文字，新 tokenizer 可能會用 1x 到 1.35x 的 token 量。API 單價沒變（$5/$25 per million tokens），但因為同樣的內容吃更多 token，實際成本可能微幅上升。

如果你有監控 token 用量的 dashboard，升級到 Opus 4.7 之後可能會看到用量突然跳一截。不是 bug，是 tokenizer 換了。評估成本的時候記得把這個因素算進去。

回頭看 Opus 4.7 的這些更新，核心思路可以用一句話概括：讓 Agent 從「被動執行」變成「主動管理」。xhigh 讓你精準控制投入程度，Task Budgets 讓 Agent 自己分配資源，/ultrareview 把品質把關從人移到 AI。下一步可以看看怎麼把這三個功能組合起來——比如用 Task Budgets 設定整體預算，搭配 xhigh 跑主要任務，最後用 /ultrareview 做品質驗收。這就是一條完整的 AI-assisted 開發工作流。