Claude Code 可以自己決定要不要跑指令了、Apple 砸十億美金讓 Google Gemini 接管 Siri、OpenAI 的安全掃描工具在一百二十萬個 commit 裡抓出上萬個高嚴重度漏洞。今天的新聞有幾條挺重的。


1. Anthropic 推出 Claude Code Auto Mode — AI 自己判斷該不該執行

Claude Code 新增了 Auto Mode,讓 AI 自主決定檔案寫入和 bash 指令的執行權限。以前每個動作都要你按同意,現在它會用雙層分類器先過濾:安全的直接跑,有風險的擋下來。

內部測試數據:0.4% 的誤攔率(安全指令被擋),5.7% 的漏放率(危險指令沒攔到)。目前僅限 Enterprise 和 API 用戶,建議在 sandbox 環境使用。

這是 Anthropic 在「給 AI 更多自主權」和「不要讓它搞砸東西」之間找平衡的一步。方向是對的,但 5.7% 的漏放率放在 production 還是讓人有點緊張。

原文來源:Anthropic hands Claude Code more control, but keeps it on a leash
原文來源:Anthropic releases safer Claude Code ‘auto mode’


2. Apple 拿 Gemini 改造 Siri — 一年十億美金的賭注

Bloomberg 報導 Apple 正在開發代號「Project Campos」的獨立 Siri App,預計 iOS 26.5 beta 就會搭載 Gemini 驅動的升級版。完整版本六月 WWDC 亮相,隨 iOS 27 發佈。

新 Siri 的定位從語音助手轉型為跨 App 的 AI Agent,支援螢幕感知、跨應用推理、存取訊息和筆記。Google 的 Gemini 模型負責底層推理,Apple 透過 Private Cloud Compute 和本地處理維持隱私。

一年十億美金給 Google,這筆帳到底值不值得,要看 Siri 能不能真的從「幫我設鬧鐘」進化到「幫我整理今天的會議重點然後寄給團隊」。目前看起來野心不小,但 Apple 在 AI 上的執行力一直是個問號。

原文來源:iOS 27 Features: Apple AI Reboot With Siri App - Bloomberg
原文來源:Apple To Schedule Gemini-Powered Siri Debut For iOS 26.5 Beta


3. OpenAI Codex Security 掃了 120 萬個 Commit,抓出 10,561 個高嚴重度問題

OpenAI 的 Codex Security 在過去 30 天掃描超過 120 萬個外部 commit,找到 792 個 critical 級別和共 10,561 個高嚴重度漏洞。這工具不只找問題,還能提出修復建議。

同時,OpenAI 也推出了 Aardvark — 一個 agentic 安全研究員,專門做自動化的漏洞挖掘和分析。

用 AI 掃安全漏洞這件事已經從概念變成實用工具了。120 萬個 commit 的規模不小,如果準確率夠高,對 DevSecOps 流程是個實質的加速。

原文來源:OpenAI Codex Security Scanned 1.2 Million Commits
原文來源:Introducing Aardvark: OpenAI’s agentic security researcher


4. MCP 2026 路線圖更新 — 企業級痛點終於要處理了

Model Context Protocol 的 2026 路線圖在三月初發佈,重點四個方向:傳輸層擴展性、Agent 間通訊、治理成熟化、企業就緒度。

企業端反映最多的問題:audit trail、SSO 整合認證、gateway 行為定義、設定可攜性。這些東西在個人用的時候感覺不到,但一到組織規模就變成必要條件。

另外 Fingerprint 推出了第一個開源的詐欺防護 MCP Server,SurePath AI 則發佈了即時 MCP Policy Controls。生態系在擴張,但標準化的速度需要跟上。

原文來源:The 2026 MCP Roadmap
原文來源:MCP’s biggest growing pains for production use


5. OpenAI 收購 Astral — Python 工具鏈的未來歸屬

OpenAI 正在收購 Astral,就是做 uv、Ruff、ty 這些 Python 開發工具的公司。uv 是目前最快的 Python 套件管理器,Ruff 是最快的 linter。幾百萬 Python 開發者每天在用。

收購的目的很明顯:強化 Codex 的 AI 編程平台。掌握了底層工具鏈,AI 寫出來的 code 品質和開發體驗都能往上拉一個層級。

開源社群對這件事的反應兩極。一派覺得有大公司撐腰工具會更好,一派擔心開源專案被收購後會慢慢變味。Astral 的工具目前都還是 MIT/Apache 授權,但後續怎麼走值得持續關注。

原文來源:7 Open-Source AI Tools Changing How Developers Build in 2026
原文來源:GitHub’s Points to a More Global, AI-Challenged Open Source Ecosystem


6. NVIDIA Agent Toolkit 與 AI-Q Blueprint — Agent 開發的新基礎設施

NVIDIA 三月中發佈了 Agent Toolkit,包含開源的 OpenShell runtime(用來建構可自我演化的 agent)和 AI-Q Blueprint(用 LangChain 做的 agentic search,在 DeepResearch Bench 準確率排第一)。

同一時間,微軟推出 Copilot Cowork 和 Agent 365,前者做多步驟任務委派,後者管控組織內的 agent 安全。

Agent 工具鏈的軍備競賽已經開打。有趣的是大家都在強調「安全」和「可控」——顯然在實際部署中吃過虧了。

原文來源:NVIDIA Ignites the Next Industrial Revolution in Knowledge Work
原文來源:Latest AI Agent Tools 2026: The March News Roundup


7. GPT-5.4 登場 — 統一模型取代分散架構

OpenAI 三月初發佈 GPT-5.4,把之前散在不同模型的能力(推理、編程、電腦操作)整合成一個統一系統。在 OSWorld-Verified 上拿到 75% 成功率,超過人類的 72.4%。

幻覺率降低 33%,token 使用量透過新的 Tool Search API 減少 47%,支援 1M context window。

模型整合是趨勢。與其維護五個各有所長的模型,不如一個全能的。對開發者來說,少了選模型的煩惱,多了一致性的保證。

原文來源:OpenAI Launches GPT-5.4 With Advanced Reasoning, Coding, and Computer-Use Capabilities
原文來源:OpenAI’s GPT-5.4 doubles down on safety


今天的重點如果只能挑一條:Auto Mode 和 Agent 自主權的議題。不管是 Claude Code、Apple Siri、還是 NVIDIA 的 Agent Toolkit,所有人都在解同一道題——怎麼讓 AI 做更多事,同時不讓它失控。答案還在摸索中,但方向很明確:分層的安全機制,而不是全有或全無的權限開關。