系列精選
查看全部Claude Code Dynamic Workflows 完整教學 — 讓 AI 自己寫腳本,在背景指揮上百個分身
把時間倒回去看,會比較容易看懂這次的改變到底大在哪。 一年多前,你想讓 AI 同時幫你做好幾件事,唯一的辦法是當人肉排程器。開三個終端機視窗,第一個叫它改 API、第二個叫它寫測試、第三個讓它跑 lint,然後你的眼睛在三個視窗之間跳來跳去,誰卡住了你補一句、誰跑完了你接著派下一個。AI 在做事,但調度它的是你,而且你一次只能盯住有限的幾個。 後來 subagent 出現,往前走了一步。Claude 開始能自己派分身去處理子任務,你不用再手動開視窗了。但這裡藏了一個很多人沒注意到的代價:每一個 subagent 做完事,它的中間結果都會回流到 Claude 主對話的 context window 裡。十個分身回來十份半成品,全堆在同一張桌子上,你寶貴的 context 就這樣被一堆「過程」吃掉,留給「真正在想的事」的空間越來越小。而且決定下一個該派誰,還是 Claude 在對話裡一輪一輪臨場判斷——它本質上還是個工頭,只是工頭從你變成了它。 到了四月的 Agent Teams,規模又上一個量級——16 個 Claude 實例真的同時開工,誇張到能合力寫出一個編譯 Linux ke...
AI 與科技新聞摘要 20260529:MCP 官方 SDK 爆系統性漏洞、OpenAI 把安全寫成合規、Google Antigravity 2.0 對打 Claude Code
這個產業最近同時在做兩件事:一邊用盡全力把 AI 工具推得更快、更會自己跑;一邊手忙腳亂地補那些跑太快留下來的洞。這週的新聞,剛好把這兩條線攤得清清楚楚。 一、OpenAI 發布 Frontier Governance Framework:把安全做成一份合規文件OpenAI 在 5/29 公布了「Frontier Governance Framework」,把原本對內的 Preparedness Framework 抽出一部分,整理成一份對外的公開治理文件。明說的目的是對齊法規——加州的 Transparency in Frontier AI Act、歐盟 AI Act 底下的通用模型行為準則。內容涵蓋網路攻擊、CBRN(生化核輻)、有害操弄、失控等風險的評估與緩解,外加模型回報、資安管理、事件應變、外部專家審查的流程。 值得停下來看的,是這份文件的「形態」。安全本來是個工程問題——你怎麼讓模型不做壞事。現在它正在變成一個合規問題——你怎麼證明給監理機關看你有在防。這兩者不一樣。前者要的是真的安全,後者要的是可被稽核的文件。當一家公司開始把安全寫成對齊法條的治理框架,代...
whisper-guard — 砍掉 87% Whisper 幻覺的不是大模型,是一個 400 行的規則引擎
Whisper 最會騙你的時刻,是它最心虛的時刻。 用過 Whisper 的人大概都撞過這個牆:一段明明安靜無聲的停頓,轉錄結果卻憑空冒出「謝謝觀看」、「記得訂閱」,或者同一句話像跳針一樣重複十幾遍。這不是 bug,是模型的天性——它在沒有有效輸入的時候,還是會硬擠出一點東西來。你可以想成一個被訓練到「必須開口」的人,被丟進一個沒人講話的房間,他不會閉嘴,他會開始編。Whisper 訓練資料裡塞了海量的 YouTube 字幕,所以它編出來的,往往就是那幾句最常出現的片尾台詞。 碰到這種狀況,工程師的直覺反應幾乎是反射性的:那就再串一個 LLM 在後面,讓它讀一遍轉錄結果,把不通順、明顯亂入的句子清掉。畢竟 2026 年了,什麼問題不是丟給大模型解決的? 這個直覺是錯的。而且錯得很乾脆。 一個 benchmark,把直覺打回原形whisper-guard 這個專案的作者跑了一組對照實驗,數字攤開來看,很難不被嚇到。 同一份音檔,原始 Whisper 跑出來有 16 次幻覺,耗時 47.7 秒。接著試「只加 LLM 後處理」這條多數人會選的路:幻覺數字是多少?16 次。一次都沒少。減...
Claude Code /usage 完整教學 — 看你的額度花在哪個 Skill、Subagent、Plugin、MCP server
打開 Claude Code 還沒輸入任何指令,光是 boot 起來這層 context window 就已經吃掉了——多少? 預設安裝一個 CLAUDE.md、五個 MCP server、幾個 skills,根據 Claude Code 官方文件的估算,起跳就要五萬個 token。其中光 GitHub MCP 一個就佔了一半以上。 這還是「什麼都還沒做」的數字。 5 月的 /usage 升級之後,這層消耗變得可見了——指令會把 skills、subagents、plugins、每個 MCP server 各自吃掉多少額度列成一張表。本來這層是黑盒子,現在打開了。 這篇拆解三件事:/usage 報表怎麼看、看到之後該怎麼動手減重、為什麼這個指令的設計值得抄到自己的工作流。 /usage 跟 /cost 跟 /stats 不是同一件事先把容易混淆的三個指令分開: 指令 看什麼 適用對象 /usage Pro / Max 訂閱的額度還剩多少、各 category 吃掉多少 訂閱戶 /cost 這個 session 跑下來花了多少美金 用 API key 的...
AI 與科技新聞摘要 20260528:Anthropic 一年 80 倍、Mistral 開始畫自己的晶片、OpenAI 把廣告收入賭到 1000 億
300 億美金。這是 Anthropic 5 月底坐穩的 run-rate 數字,跟 2025 年底的 90 億比,14 個月翻了 3 倍。再往前抓 18 個月,2024 年底是 10 億——也就是說,從 10 億跑到 300 億,Anthropic 用了一年半,翻了 30 倍。 這不是「成長很快」,這是「曲線換了一條」。 同一週,Mistral 宣布要自己設計晶片、推出企業 agentic 平台 Vibe;OpenAI 把廣告收入目標寫進了內部簡報——2026 年 25 億、2030 年 1000 億。 把這幾條放在一張桌上看,一個分岔點越來越清楚:有些公司在賣信任,有些公司在賣注意力。短期內兩條曲線都會漲,長期會分開來看。下行風險也會分開——一條被監管追,一條被基礎設施成本追。 一、Anthropic 一年 80 倍:從新創公司變成基礎設施5 月底數字底定:Anthropic 的 annualized run-rate 達到 300 億美金,相比 2024 年底的 10 億,14 個月翻了將近 30 倍。從另一個角度抓,2024 年 1 月 run-rate 才 8700 ...
agent-rules — 把 prompt 當設定檔,讓 Claude Code 跟 Cursor 共用同一套 22 個 slash 指令
下午要送 PR 之前,你又打了一次那段熟到不行的提示:「幫我審一下這個 PR 的邊界條件、有沒有資安問題、測試夠不夠」。昨天打過、上禮拜也打過,每次措辭都差一點,品質就跟著飄一點。 commit 也是。今天心血來潮把 scope 寫好、加了 conventional 格式,明天趕時間就退化成一句「fix bug」。修 bug 更慘——你明明知道該先寫一個能重現的 failing test 再動手,但十次有六次直接改 code,測試事後補(或根本沒補)。 問題不在你不懂這些紀律,在於紀律放在腦袋裡,每次都要靠自制力重新執行一遍。 你可能試過半套解法:把常用提示存成備忘錄、貼到一個 snippets app、甚至塞進 Raycast。能省幾秒打字,但治不了根——因為每次貼出去的還是「大概那個意思」的版本,不是同一個版本。 agent-rules 切進來的,正是這一步。它的主張很直接:prompt 不該每次重打,prompt 該被當成設定檔。 把那段 PR review 的提示寫死成一個檔案,丟進 ~/.claude/commands/,之後在 Claude Code 裡打 /pr-r...
Claude Code /loop 與 /schedule 完整教學 — 讓 AI 自己排程自己跑
10 分鐘。這是 /loop 沒指定間隔時的預設值——每 10 分鐘它會把你交代的任務重跑一次。 聽起來像 cron,但 cron 不會「理解」任務。/loop 在 Claude Code 的 session 裡跑,意思是它每次重跑時都帶著完整的對話脈絡。 打個比方就懂了。傳統的 cron 是個鬧鐘——時間到了它響,響完它不管事;/loop 是個記得你昨天交代什麼、今天問你「上次那件事好了沒」的助理。差別就在這。 這篇講怎麼用 /loop 跟 /schedule 把 AI 變成會自己排程的工程助手——從最簡單的「每 5 分鐘檢查 CI」到「指定時間跑部署」,把實務上會踩的坑一次列清楚。 先搞懂三個東西的差別/loop、/schedule、Desktop scheduled tasks——這三個東西常常被搞混,先把它們的定位拉開: /loop 是 session 內的重複觸發。你在當前對話裡叫它每 X 分鐘做一件事,session 還開著它就會跑。關掉 terminal、關電腦、session 結束,它就沒了。 /schedule 是 session 內的一次性定時觸發。在指定時...
AI 與科技新聞摘要 20260527:Fujitsu 押 10 萬人、Claude Code 加裝即時資安守門員、Pentagon 開始測試替代品
10 萬人。這不是某個科技巨頭的員工總數,是 Fujitsu 一家公司打算在 5/27 之後把 Claude 部署到的內部員工數量。 同一天,Anthropic 把 Claude Code 升級成「自帶資安守門員」的 IDE——一個會即時看你的 diff、看你的 commit、自動標記危險 pattern 的內建插件。 同一週傳出來的另一條新聞風味就完全不同:Pentagon 正在測試 OpenAI 跟 Google 的模型,準備在某些國防工作流裡替代 Claude。 把這三件事放在一張桌上看,是一個正在加速的系統性錯位:企業用戶在加大押注,國防客戶在分散押注。下行不對稱的風險,往往就藏在這種錯位裡。 一、Fujitsu × Anthropic:10 萬員工 + 1000 人工程隊伍,日本企業 AI 全面押注5/27 Fujitsu 正式公告:與 Anthropic 簽下策略合作,將 Claude 部署到全集團約 10 萬名員工,並組建 1000 人規模的工程團隊把這套能力交付給日本企業客戶。 部署的範圍跨度極大——政府、金融、醫療、關鍵基礎設施。這幾個領域...
Mole — 用一個 binary 取代 CleanMyMac 全家桶的開源 Mac 清理 CLI
以前要把一台 Mac 清乾淨,是一套儀式。 先開 CleanMyMac 掃快取,再開 DaisyDisk 看是誰把硬碟吃光,卸載 app 得另外開 AppCleaner 才不會留殘骸,想知道機器為什麼變慢還要瞄一眼選單列上的 iStat Menus。四個視窗、四套年費,而且這幾個工具自己就愛背景常駐——CleanMyMac 光待機就吃 300MB+ 記憶體,挺諷刺的。 同樣這套動作,現在用 brew install mole 裝完一個 binary 就全包了。下面我們把「清一次 Mac」這件事,舊做法跟新做法逐項擺在一起看。 看機器狀況:選單列 vs mo status舊做法是讓 iStat Menus 常駐在選單列,CPU、記憶體、磁碟 I/O 隨時掛在那。問題是你 99% 的時間根本沒在看它,它卻 99% 的時間都在跑。 mo status 把同樣的儀表板變成「要看才叫出來」:即時顯示 CPU、GPU、記憶體、磁碟 I/O、top processes,看完按 q 退出,平時不佔任何資源。監控本來就不該是常駐服務,是隨叫隨到的查詢。 找空間黑洞:Daisy...
Claude Code /code-review 完整教學:從 /simplify 改名後,AI 用四個 Agent 幫你掃 PR
打開 PR review,1200 行變更,今天不用吃午飯了。 這是台灣工程師每週都會遇上的場景。然後你看著 diff 想:「能不能把這事丟給 AI?」——可以,但 Claude Code 之前的 /review 命令,不是太囉嗦(順手幫你改 code)就是太保守(只列 nit)。 直到五月中,Anthropic 把它整個換過。原本叫 /simplify 的命令改名為 /code-review、移除「順手修補」的行為、改成四個平行 agent 掃 diff、confidence ≥ 80 才出聲、加上 --comment 直接把 inline 評論發到 GitHub PR。 這個改動的好玩在於——不是新增功能,是刪除功能。Anthropic 把命令收窄到「只做一件事」:找 correctness bug。其他的事它不做。 這是這篇要拆給你看的:為什麼這樣設計、怎麼用、什麼時候別用。 三秒先講結果把這個指令背起來: 12345# 在 PR 分支上,輸出到終端機/code-review high# 在 PR 分支上,把問題用 inline comment 發到 GitHub/code...









