六週。GPT-5.4 到 GPT-5.5,就是六週。

上個月還在討論 GPT-5.4 夠不夠用,這週 GPT-5.5 已經在 ChatGPT 和 Codex 上線。AI 模型的發布週期現在短到讓人懷疑:這些版本之間的差距到底是「真進化」還是「讓人有理由繼續訂閱的節奏感」?

同一天,DeepSeek 在台灣上午發布了 V4-Pro 和 V4-Flash。定價讓人有點沉默。


OpenAI GPT-5.5 — 「Spud」上線,主打 Agentic 能力

4 月 23 日,OpenAI 推出 GPT-5.5,內部代號 Spud,向 Plus、Pro、Business、Enterprise 用戶全面開放,同時升級了 Codex 的底層模型。

API 定價:$5/百萬 input tokens,$30/百萬 output tokens,context window 1M。跟 GPT-5.4 相比,token 延遲持平,但能力更強——OpenAI 的說法是「更少 tokens 做更多事的思考者」。

重點能力是多步驟工作流的自主性:GPT-5.5 設計上可以在更少用戶介入的情況下跑完複雜的 agentic 任務。OpenAI 內部 10,000 名員工已經在用 GPT-5.5 驅動的 Codex,涵蓋工程、法務、行銷、財務、HR——不只限工程師。

邊界在哪裡?GPT-5.5 上線六週後的現在,GPT-5.4 就已經變成過時選項。這是廠商意圖的體現:不斷讓用戶感到「需要升級」,而不是「已經夠用」。從風險的角度看,這個節奏對企業客戶不友善——IT 採購、評估、合規審查都需要時間,模型每六週換一次讓企業的穩定性需求和廠商的競爭節奏永遠對不齊。

原文來源:Introducing GPT-5.5 | OpenAI
原文來源:OpenAI releases “Spud” GPT-5.5 model - Axios


DeepSeek V4 今日發布 — 定價才是重點

4 月 24 日,DeepSeek 推出 V4-Pro 和 V4-Flash 預覽版。

技術規格:V4-Pro 總參數 1.6T,但只有 49B 是 active 的(MoE 架構);V4-Flash 則是 284B 總參數,13B active。兩個版本 context window 都是 1M。

效能比較:V4-Pro 超越 GPT-5.2 和 Gemini 3.0-Pro 的基準測試,接近 Claude Opus 4.5 的水準,略低於 GPT-5.4 和 Gemini 3.1-Pro。

然後是定價。V4-Flash:$0.14/百萬 input tokens,$0.28/百萬 output。V4-Pro:$1.74/百萬 input,$3.48/百萬 output。

拿 GPT-5.5 的 $5 input 跟 V4-Pro 的 $1.74 比,同等能力區間便宜超過 60%。跟 V4-Flash 比,是將近 35 倍的差距。

逆向問這件事:如果性能差距不到 20%,但價格差六倍,企業客戶的採購決策邏輯應該是什麼?理性算法很簡單,但現實裡還有資料主權、地緣政治風險、合規需求、vendor reliability 這些因子。DeepSeek 的定價不斷逼迫市場給這些因子標上明確的價格——你願意多付多少,換取「不是中國廠商」這件事?

原文來源:DeepSeek V4 - Simon Willison
原文來源:China’s DeepSeek unveils latest model - Al Jazeera


MCP 架構設計漏洞 — 7,000 個伺服器暴露在 RCE 風險

資安研究人員在 MCP 的架構層發現了一個「by design」的漏洞,可以在執行任何 MCP 實作的系統上達成 RCE(遠端程式碼執行),直接存取用戶資料、內部資料庫、API keys 和對話歷史。

影響範圍:超過 7,000 個公開可存取的 MCP 伺服器,以及總計超過 1.5 億次下載的軟體套件。部分資料來源估計真正暴露的伺服器超過 20 萬個。

技術根因是 MCP STDIO 傳輸介面的不安全預設值,攻擊路徑涵蓋:未驗證的指令注入(via MCP STDIO)、直接 STDIO 設定的未驗證指令注入(帶繞過強化機制的變體)、以及透過 zero-click prompt injection 的 MCP 設定修改。

更值得注意的:Anthropic 拒絕修改協定架構,理由是這是「預期行為」。部分 vendors 自行發 patch,但根本問題在 Anthropic 的官方 SDK 裡未修復,等於讓所有基於這個 SDK 開發的工具繼承了這個風險。

這是 MCP 成為事實標準之後必然會出現的系統性問題。越多工具支援 MCP、越多開發者直接用 Anthropic 的 SDK 建 MCP server,這個架構缺陷的攻擊面積就越大。一個生態系的標準化,帶來的不只是互通性,同時帶來了風險的均一化——一個協定層的漏洞,等於所有工具同時受影響。

如果你目前有跑 MCP server,先確認你的 STDIO 設定和授權邏輯,不要等官方修復。

原文來源:Anthropic MCP Design Vulnerability Enables RCE, Threatening AI Supply Chain - The Hacker News
原文來源:The Mother of All AI Supply Chains: Critical, Systemic Vulnerability - OX Security


NIST 限縮 CVE 補充速度 — 漏洞提交量暴增 263%

NIST 在 4 月 15 日新規生效後,開始限制 CVE 的 enrichment 工作——不再對所有進來的 CVE 條目做完整分析和資料補充,改為優先處理 CISA 已知被利用漏洞清單(KEV)上的項目。

原因很直接:CVE 提交量同比暴增 263%。AI 工具讓漏洞研究和報告的門檻大幅降低,同時 AI framework 本身成為新的攻擊標的,兩個因素疊加,讓 CVE 系統的處理量超過 NIST 現有人力可以應對的範圍。

後果是什麼?大量剛進 NVD 的 CVE 條目長期停在「Awaiting Analysis」狀態,沒有 CVSS 分數、沒有 CWE 分類、沒有詳細描述。依賴 NVD 做自動化漏洞掃描的安全工具,拿到的資料會是不完整的。

這件事的系統性含義比表面看起來嚴重。整個資安產業有大量 SLA 綁著「確認漏洞的 CVSS 分數後 N 天內修復」,如果漏洞進 NVD 但遲遲沒有分數,觸發修復流程的 threshold 就永遠不會到。這不是 NIST 的問題,是 AI 讓漏洞提交速度和安全基礎設施處理速度之間的落差變成了結構性問題。

原文來源:NIST Limits CVE Enrichment After 263% Surge in Vulnerability Submissions - The Hacker News


Anthropic Project Glasswing — AI 找漏洞,公開給業界用

Anthropic 對外公布了 Project Glasswing——一個在發現軟體漏洞方面特別強的 AI 模型,並且已經開放給 Apple、Microsoft、Google、Amazon 和一批合作伙伴使用,目標是在惡意行為者利用之前找到並修復漏洞。

這件事有兩層。第一層是技術:AI 找漏洞的能力在這一年內快速提升,Glasswing 是 Anthropic 把這個能力產品化的第一個動作。第二層是策略:Anthropic 在 AI 安全上的品牌定位一直是核心,Glasswing 把「我們比別人更在意安全」這個敘事,從公司原則層轉化成了可以被合作夥伴實際使用的工具。

有趣的地方是:就在同一週,MCP 的架構漏洞被公開,Anthropic 選擇不修。兩條新聞放在一起,敘事有點複雜——一方面在跟業界說「我們幫你找漏洞」,一方面對自家協定的架構問題說「這是預期行為」。怎麼解讀這個落差,各自判斷。

原文來源:CISA Adds 6 Known Exploited Flaws in Fortinet, Microsoft, and Adobe Software - The Hacker News


今天幾條新聞讀起來,有一個共同的底層結構:AI 的推進速度,正在逼迫依賴穩定性的各種系統露出破口。CVE 補充速度跟不上漏洞提交量、企業採購週期跟不上模型發布節奏、MCP 生態系的安全基礎設施跟不上協定擴散速度。

這不是「AI 進步太快」的道德命題,是系統脆弱性在加速暴露的工程命題。哪些地方有冗餘、哪些環節是單點失敗——現在是把這個清單認真列出來的時候。