一行指令,五個工具,同一個技能包。

4 月 16 日 GitHub 推出 gh skill 命令,讓 GitHub Copilot、Claude Code、Cursor、Codex、Gemini CLI 共用同一套技能安裝標準。這不是一個小更新。這是整個 AI coding 工具生態系第一次在「如何安裝技能」這件事上達成共識——而且是用 Claude Code 那邊流出去的 SKILL.md 格式當基礎。

把這件事和同一週的其他幾條新聞擺在一起看,你會看到一個還沒被廣泛討論的系統性趨勢:AI 工具市場正在跑一場「誰的基礎設施先成為業界標準」的賽局——不是誰的模型最強,是誰的規格先被其他人採用。先成為標準的那個,接下來的每一個新工具都得跟它相容。


Claude Code v2.1.116 — resume 快了 67%,MCP 工具結果可以不被截斷

4 月 20 日釋出的 v2.1.116,有兩個更新值得注意。

第一個:/resume 在大型 session(40MB+)上快了 67%。這個改善針對的是長期使用者——session 積累愈久、dead-fork 愈多,之前 resume 的延遲會愈明顯。現在處理邏輯被重寫,大型 session 也能快速恢復。

第二個,影響面更廣:MCP 工具結果持久化。透過 _meta annotation,工具回傳的大型結果(上限 500K)可以跨對話保留,不再每次都被截斷或重新拉取。這對需要讀大型 DB schema 或 API 文件的工作流影響很大——之前常見的痛點是 Claude Code 讀完資料庫結構後,下一輪對話又忘了。

Claude Code 在過去五週發佈了超過 30 個版本。v2.1.90 的 NO_FLICKER 渲染引擎讓 prompt 渲染循環少了 74%;Write tool 的 diff 計算快了 60%;記憶體佔用降了 80MB。每一條單獨看都是小修,加起來是整個工具感覺到的「快」。

快不只是功能,是讓人願意繼續用的理由。

原文來源:Claude Code Changelog - code.claude.com


GitHub 推出 gh skill — SKILL.md 從 Claude Code 慣例變業界標準

4 月 16 日 GitHub 宣布 gh skill 命令公開預覽。

這個命令做的事情很簡單:從 GitHub 上安裝符合 Agent Skills 規格的技能包,一行指令,不需要手動 clone repo 或複製設定。gh skill install kcchien/model-thinking,裝好在 Claude Code 和 GitHub Copilot 裡都能用。

表面上是一個 CLI 工具的更新。背後是一件更重要的事情正在發生。

SKILL.md 格式最早是 Claude Code 生態系裡流行起來的慣例,沒有正式規格、沒有標準委員會。它之所以擴散,是因為它夠簡單——一個 markdown 檔,告訴 AI agent 怎麼運作這個技能。後來 Cursor、Gemini CLI、Windsurf、Codex 陸續採用了類似格式,現在 GitHub 直接用它蓋了一個統一的安裝基礎設施。

把誘因攤開來看會更清楚。GitHub 有 1 億多個開發者的生態系,它把安裝 skill 做得跟 brew install 一樣容易,就是在告訴所有人:寫 SKILL.md 格式的技能,才能進入最大的分發管道。其他工具不跟進等於主動放棄這個分發渠道。

這是標準戰,不是功能戰。而且目前看起來,SKILL.md 在沒有任何官方機構背書的情況下,先贏了第一局。

原文來源:Manage agent skills with GitHub CLI - GitHub Changelog


Salesforce Headless 360 — 把整個 CRM 暴露給 AI agent

4 月 15-17 日,Salesforce 在 TDX 開發者大會發表 Headless 360:把整個 Salesforce 平台——所有功能——暴露成 API、MCP 工具、或 CLI 命令,讓 AI agent 不用開瀏覽器就能操作完整的客戶關係管理系統。

60 個以上的新 MCP 工具和 30 個預設的 coding skills,讓 Claude Code、Cursor、Codex、Windsurf 可以對客戶的整個 Salesforce org 進行讀寫——資料、工作流、業務邏輯。它們自己的 Agentforce Vibes 2.0 同時支援 Anthropic agent SDK 和 OpenAI agents SDK,工程師選 Claude 或 GPT-5 都行。

這件事的結構意義比功能本身更重要。

Salesforce 有 15 萬家企業客戶,把整個平台的 API 介面統一成 MCP 格式,等於讓所有 AI agent 框架都可以無縫接進去。原本每個客戶都要自己寫 Salesforce 的 API wrapper;現在不需要了,裝個 MCP client 就好。

逆向問一下:這對 Salesforce 自己的風險是什麼?它讓自己更容易被 AI agent 替換掉。如果 Claude Code 可以直接讀寫所有 Salesforce 功能,開發者可能開始繞過 Salesforce 自己的 UI,甚至繞過 Salesforce 本身去評估「這個問題需不需要 Salesforce」。把自己的護城河開放給敵人進來,通常是一個絕望的攻守之戰——或者是意識到更大的圍城快來了

Salesforce 選擇先開放,賭的是「AI agent 時代要活下去,先成為基礎設施,不要試圖攔截 AI」。這個賭注對不對,三年內有結果。

原文來源:Salesforce launches Headless 360 to turn its entire platform into infrastructure for AI agents - VentureBeat


OpenAI Codex 拿到電腦使用能力 — 同時跑多個 agent 不互相干擾

OpenAI 近期更新把 Codex 的能力範圍擴到了 computer use。原本 Codex 的定位是純粹的 coding agent,現在可以「看螢幕、點滑鼠、打字」——和 Anthropic 的 Computer Use 能力差不多,但設計上做了一個比較難的事:多個 Codex agent 在 macOS 上同時跑,不互相干擾

一個在跑測試,另一個在修 UI,第三個在查文件——都用電腦,但各自有自己的視窗邏輯,不會打架。

這個設計問題其實比它看起來難。多個 agent 同時操作 macOS 的 UI 層,涉及視窗焦點、事件系統、螢幕截圖一致性。macOS 的設計從來就不是為了多個自動化程序同時操作 UI 準備的——它假設只有一個人在用鍵盤滑鼠。能讓多個 agent 不互相覆蓋,代表 OpenAI 做了相當程度的 sandboxing 工作。

把這件事放在更長的時間軸上看:computer use 正在從「可以做到」變成「工程上可以規模化使用」。一年前這是個 demo 功能,現在變成需要解決多 agent 並發的工程問題。下一步是哪裡?可能是多個 agent 在共享資源(同一個 DB、同一個 Slack workspace)上協作而不衝突。這個問題還沒有人解得很好。

原文來源:AI News: Huge Updates From Anthropic, OpenAI and Google - Science & Tech News


OpenAI + Anthropic + Google 聯手打擊中國 AI 模型竊取

4 月初,三家公司透過 Frontier Model Forum 宣布一項共同行動:分享情報,聯手阻止中國 AI 公司透過「adversarial distillation(對抗性蒸餾)」偷他們的模型能力。

Anthropic 在內部文件中記錄了來自三家中國公司的 1600 萬筆這類請求,透過大約 2.4 萬個偽造帳號執行。三家公司:DeepSeek、Moonshot AI、MiniMax。

這是 Frontier Model Forum 第一次被當成主動威脅情報行動,而不是政策討論論壇。

從競爭策略的角度逆向看這件事更有意思:三家在幾乎所有事上互相競爭的公司,為什麼願意在這件事上合作? 答案是誘因結構。對抗性蒸餾讓竊取者可以用很低的成本複製競爭對手花幾億美金訓練出來的能力。這不是任何一家的問題,是整個西方 AI 產業的問題——所以三家的利益第一次對齊了。

這件事的系統性風險不在於這一批,而在於接下來的演化。一旦這三家建起情報共享機制,下一步會是什麼?可能是聯合識別惡意帳號的 API、可能是共享 IP 黑名單、可能是推動平台進行 KYC。每一步都進一步鞏固了「西方 AI 平台 vs 中國 AI 生態」的分野——這個分野一旦固化,很難逆轉。

技術壁壘正在從「誰訓得更好」轉向「誰能防止別人快速複製」。這場競爭的地形在改變。

原文來源:OpenAI, Anthropic, Google Unite to Combat Model Copying in China - Bloomberg


這五條新聞的共同背景是:AI 工具市場的競爭已經從「誰的模型最強」轉移到「誰的基礎設施先成為不可繞開的依賴」。SKILL.md 標準的收斂、Salesforce 把自己開放成 MCP 基礎設施、OpenAI 解決 multi-agent 的工程問題、三巨頭聯手鞏固護城河——每一個動作都是在爭奪下一個技術層的定價權。

這一輪的贏家不一定是模型最好的,而是基礎設施跑得最前面的。