Claude Opus 4.7 新功能實戰 — xhigh、Task Budgets 與 /ultrareview
跑一個重構任務,Claude 花了 45 分鐘、燒掉 120K token,結果最後 5% 的改動因為 context 爆了被截斷。
如果你用 Claude Code 跑過長任務,這個場景應該不陌生。Opus 4.7 帶來的三個新功能——xhigh effort、Task Budgets 和 /ultrareview——本質上都在解決同一個問題:怎麼讓 Agent 聰明地分配有限資源。
/effort xhigh — 不想等 max 但 high 不夠的時候
之前的 effort 只有三檔:low、high、max。問題是 high 和 max 之間的落差太大——high 有時候不夠仔細,max 又慢到讓你懷疑它是不是去吃飯了。
把它想成開車。low 是高速公路定速巡航,掃一眼就過;high 是市區正常開,該注意的路口會看;max 是在停車場找車位,一格一格慢慢掃。xhigh 就是「市區開但遇到複雜路口會多看兩眼」——比 high 仔細但不會像 max 那樣龜速。
在 Claude Code 裡直接用 /effort xhigh 切換。適用場景:中等複雜度的 bug 修復、跨多個檔案的重構、需要考慮邊界條件但又不想等太久的任務。
實測下來,xhigh 在處理「需要看上下文但不需要深度推理」的任務時,速度大約是 max 的 60-70%,但品質接近 max 的 90%。這個甜蜜點很實用。
Task Budgets — 讓 Agent 自己管預算
這是 Opus 4.7 最有意思的新功能,目前還在 beta。
概念很簡單:你給 Claude 一個 token 預算,它會看到一個倒數計時器,自己決定怎麼分配。比如你說「用 50K token 做完這個重構」,Claude 會先評估任務量,把最重要的改動排前面,次要的排後面,如果預算快用完就優雅地收尾而不是突然被截斷。
類比來說,這就像是專案管理裡的「固定預算,彈性範圍」。你不是告訴 Claude 該做什麼(那是 prompt 的事),而是告訴它有多少資源可以用。剩下的優先級排序,讓它自己判斷。
之前跑長任務最大的痛點就是不可預測性——你不知道 Agent 會花多少 token、會不會中途爆掉、最後一步會不會被截斷。Task Budgets 不能完全解決這個問題,但至少讓 Agent 有了「資源意識」。它知道自己有多少彈藥,會自己決定先打哪個目標。
需要注意的是,Task Budgets 目前是 beta,行為不保證穩定。而且 budget 是「大約」的參考值,不是硬性上限。Claude 可能會在關鍵步驟超出一點,或者在簡單步驟省下一些。把它當成「建議」而不是「命令」會比較不會踩坑。
/ultrareview — 模擬資深工程師的 Code Review
/ultrareview 是 Claude Code 裡的新指令,設計目標是模擬一個資深人類 reviewer 的行為。跟一般的 linter 或靜態分析不同,它不只看語法和格式,還會抓設計缺陷和邏輯漏洞。
比如說你寫了一個 retry 機制,linter 會告訴你「這裡的變數沒用到」,但 /ultrareview 會告訴你「retry 之間沒有指數退避,高流量下會變成 DDoS 自己的 API」。它看的是意圖和後果,不只是語法。
使用方式很簡單,在 Claude Code 裡打 /ultrareview 就會對當前的 diff 做一次深度審查。它會輸出分級的問題列表——critical、warning、suggestion——每個都附上具體的修改建議。
搭配 xhigh effort 一起用效果最好:先用 /effort xhigh 確保 review 的深度,再跑 /ultrareview。用 high 有時候會漏掉比較隱晦的邏輯問題,max 又太慢,xhigh 剛好。
有一點要注意:/ultrareview 的 review 品質高度依賴 context。如果你的 diff 很大(超過 500 行),建議分段 review 而不是一次全丟進去。Claude 在小範圍內的判斷力明顯比大範圍好。
高解析度視覺 — 從 1.15MP 到 3.75MP
Opus 4.7 另一個比較少人注意但很實用的改動:圖片最大解析度從 1568px / 1.15MP 拉到 2576px / 3.75MP,翻了三倍多。
這對需要讓 Claude 看截圖的場景影響很大。之前丟一張全螢幕截圖進去,小字會糊掉,Claude 常常看錯文字或忽略細節。現在解析度夠了,讀 UI 截圖、分析 dashboard、甚至看架構圖都清楚很多。
搭配 Computer Use 功能的話,高解析度意味著 Agent 能更準確地辨識螢幕上的元素,點擊錯誤率下降。
Tokenizer 的隱藏陷阱
最後一個容易忽略的點:Opus 4.7 用了新的 tokenizer。同樣的文字,新 tokenizer 可能會用 1x 到 1.35x 的 token 量。API 單價沒變($5/$25 per million tokens),但因為同樣的內容吃更多 token,實際成本可能微幅上升。
如果你有監控 token 用量的 dashboard,升級到 Opus 4.7 之後可能會看到用量突然跳一截。不是 bug,是 tokenizer 換了。評估成本的時候記得把這個因素算進去。
回頭看 Opus 4.7 的這些更新,核心思路可以用一句話概括:讓 Agent 從「被動執行」變成「主動管理」。xhigh 讓你精準控制投入程度,Task Budgets 讓 Agent 自己分配資源,/ultrareview 把品質把關從人移到 AI。下一步可以看看怎麼把這三個功能組合起來——比如用 Task Budgets 設定整體預算,搭配 xhigh 跑主要任務,最後用 /ultrareview 做品質驗收。這就是一條完整的 AI-assisted 開發工作流。
原文來源:What’s new in Claude Opus 4.7
原文來源:Claude Opus 4.7: What Changed for Coding Agents










