AI 與科技新聞摘要 — 2026/03/26

Claude Code 可以自己決定要不要跑指令了、Apple 砸十億美金讓 Google Gemini 接管 Siri、OpenAI 的安全掃描工具在一百二十萬個 commit 裡抓出上萬個高嚴重度漏洞。今天的新聞有幾條挺重的。

1. Anthropic 推出 Claude Code Auto Mode — AI 自己判斷該不該執行

Claude Code 新增了 Auto Mode，讓 AI 自主決定檔案寫入和 bash 指令的執行權限。以前每個動作都要你按同意，現在它會用雙層分類器先過濾：安全的直接跑，有風險的擋下來。

內部測試數據：0.4% 的誤攔率（安全指令被擋），5.7% 的漏放率（危險指令沒攔到）。目前僅限 Enterprise 和 API 用戶，建議在 sandbox 環境使用。

這是 Anthropic 在「給 AI 更多自主權」和「不要讓它搞砸東西」之間找平衡的一步。方向是對的，但 5.7% 的漏放率放在 production 還是讓人有點緊張。

原文來源：Anthropic hands Claude Code more control, but keeps it on a leash
原文來源：Anthropic releases safer Claude Code ‘auto mode’

2. Apple 拿 Gemini 改造 Siri — 一年十億美金的賭注

Bloomberg 報導 Apple 正在開發代號「Project Campos」的獨立 Siri App，預計 iOS 26.5 beta 就會搭載 Gemini 驅動的升級版。完整版本六月 WWDC 亮相，隨 iOS 27 發佈。

新 Siri 的定位從語音助手轉型為跨 App 的 AI Agent，支援螢幕感知、跨應用推理、存取訊息和筆記。Google 的 Gemini 模型負責底層推理，Apple 透過 Private Cloud Compute 和本地處理維持隱私。

一年十億美金給 Google，這筆帳到底值不值得，要看 Siri 能不能真的從「幫我設鬧鐘」進化到「幫我整理今天的會議重點然後寄給團隊」。目前看起來野心不小，但 Apple 在 AI 上的執行力一直是個問號。

原文來源：iOS 27 Features: Apple AI Reboot With Siri App - Bloomberg
原文來源：Apple To Schedule Gemini-Powered Siri Debut For iOS 26.5 Beta

3. OpenAI Codex Security 掃了 120 萬個 Commit，抓出 10,561 個高嚴重度問題

OpenAI 的 Codex Security 在過去 30 天掃描超過 120 萬個外部 commit，找到 792 個 critical 級別和共 10,561 個高嚴重度漏洞。這工具不只找問題，還能提出修復建議。

同時，OpenAI 也推出了 Aardvark — 一個 agentic 安全研究員，專門做自動化的漏洞挖掘和分析。

用 AI 掃安全漏洞這件事已經從概念變成實用工具了。120 萬個 commit 的規模不小，如果準確率夠高，對 DevSecOps 流程是個實質的加速。

原文來源：OpenAI Codex Security Scanned 1.2 Million Commits
原文來源：Introducing Aardvark: OpenAI’s agentic security researcher

4. MCP 2026 路線圖更新 — 企業級痛點終於要處理了

Model Context Protocol 的 2026 路線圖在三月初發佈，重點四個方向：傳輸層擴展性、Agent 間通訊、治理成熟化、企業就緒度。

企業端反映最多的問題：audit trail、SSO 整合認證、gateway 行為定義、設定可攜性。這些東西在個人用的時候感覺不到，但一到組織規模就變成必要條件。

另外 Fingerprint 推出了第一個開源的詐欺防護 MCP Server，SurePath AI 則發佈了即時 MCP Policy Controls。生態系在擴張，但標準化的速度需要跟上。

原文來源：The 2026 MCP Roadmap
原文來源：MCP’s biggest growing pains for production use

5. OpenAI 收購 Astral — Python 工具鏈的未來歸屬

OpenAI 正在收購 Astral，就是做 uv、Ruff、ty 這些 Python 開發工具的公司。uv 是目前最快的 Python 套件管理器，Ruff 是最快的 linter。幾百萬 Python 開發者每天在用。

收購的目的很明顯：強化 Codex 的 AI 編程平台。掌握了底層工具鏈，AI 寫出來的 code 品質和開發體驗都能往上拉一個層級。

開源社群對這件事的反應兩極。一派覺得有大公司撐腰工具會更好，一派擔心開源專案被收購後會慢慢變味。Astral 的工具目前都還是 MIT/Apache 授權，但後續怎麼走值得持續關注。

原文來源：7 Open-Source AI Tools Changing How Developers Build in 2026
原文來源：GitHub’s Points to a More Global, AI-Challenged Open Source Ecosystem

6. NVIDIA Agent Toolkit 與 AI-Q Blueprint — Agent 開發的新基礎設施

NVIDIA 三月中發佈了 Agent Toolkit，包含開源的 OpenShell runtime（用來建構可自我演化的 agent）和 AI-Q Blueprint（用 LangChain 做的 agentic search，在 DeepResearch Bench 準確率排第一）。

同一時間，微軟推出 Copilot Cowork 和 Agent 365，前者做多步驟任務委派，後者管控組織內的 agent 安全。

Agent 工具鏈的軍備競賽已經開打。有趣的是大家都在強調「安全」和「可控」——顯然在實際部署中吃過虧了。

原文來源：NVIDIA Ignites the Next Industrial Revolution in Knowledge Work
原文來源：Latest AI Agent Tools 2026: The March News Roundup

7. GPT-5.4 登場 — 統一模型取代分散架構

OpenAI 三月初發佈 GPT-5.4，把之前散在不同模型的能力（推理、編程、電腦操作）整合成一個統一系統。在 OSWorld-Verified 上拿到 75% 成功率，超過人類的 72.4%。

幻覺率降低 33%，token 使用量透過新的 Tool Search API 減少 47%，支援 1M context window。

模型整合是趨勢。與其維護五個各有所長的模型，不如一個全能的。對開發者來說，少了選模型的煩惱，多了一致性的保證。

原文來源：OpenAI Launches GPT-5.4 With Advanced Reasoning, Coding, and Computer-Use Capabilities
原文來源：OpenAI’s GPT-5.4 doubles down on safety

今天的重點如果只能挑一條：Auto Mode 和 Agent 自主權的議題。不管是 Claude Code、Apple Siri、還是 NVIDIA 的 Agent Toolkit，所有人都在解同一道題——怎麼讓 AI 做更多事，同時不讓它失控。答案還在摸索中，但方向很明確：分層的安全機制，而不是全有或全無的權限開關。