你有沒有想過,當一個工具強到可以「自己跑下去不用你盯」的時候,出事的責任算誰的?

這禮拜的幾條新聞排開來,主角不是哪個模型又刷新了哪個分數。能力線一如往常往上爬,真正在動的,是「讓 AI 自己動手、自己跑久一點、自己決定下一步」這件事——而且是各家一起往這個方向推。問題在於,油門踩得越深,那個「萬一它跑歪了誰來踩煞車」的位子,反而越來越空。

一、OpenAI 讓 Codex 自己跑到目標達成才停

6 月 22 日,OpenAI 一口氣給 Codex 加了幾個讓它「更會自己跑」的功能。Goal mode 全面開放——你給它一個結果跟成功條件,它就一輪一輪做下去,不用你每一步都下指令,直到它自己判斷達標。同時上的還有 macOS 的 Appshots:一個快捷鍵就能把某個 app 視窗連同截圖跟可讀文字塞進 Codex 的對話,讓它直接「看到」你在看什麼,省掉一長串描述。再加上專為長時間任務優化的 Codex-Maxxing,整套更新的方向只有一個——把人從迴圈裡拿掉得越多越好。

這跟 Claude Code 早就在做的事是同一條路。值得記下來的不是「誰抄誰」,而是這個產業已經悄悄達成共識:CLI 上跑的自主編碼,不是玩具階段了,是一個會長期存在的類別。但這裡有個容易被功能光環蓋過的問題——當你把人從「每一步都要點頭」改成「設個目標讓它自己跑」,你省下的是時間,賭上的是「它跑歪的時候,要跑多久你才會發現」。自主性是有代價的,只是帳單晚一點到。

來源:OpenAI News

二、五角大廈在測 OpenAI 和 Google,準備把 Claude 換掉

另一條沒那麼吵但分量很重的消息:美國國防部證實,正在測試 OpenAI 跟 Google 的模型,評估是否在機密系統裡取代目前用的 Anthropic Claude。

把這條跟前一陣子「美國政府出口管制 Anthropic 高階模型」的新聞放在一起看,會看到一件事——當你的關鍵系統綁死在單一供應商身上,你以為買到的是「最好的能力」,其實同時買進了一個你看不見的單點。今天因為政策、價格、或哪天供應商自己出事,這條線說斷就斷。國防部現在做的事,本質上就是在拆這個單點:與其哪天被迫換,不如現在先養好第二個、第三個選項。

這個道理對任何把業務接上某家 AI 的公司都成立。先別問「哪家模型最強」,先問「如果我現在用的這家明天漲價三倍、或乾脆不賣我了,我多久能搬走、搬家要付多少代價」。答不出來,代表你不是在用工具,是工具在綁你。

來源:WaveSpeed Blog — June 2026 AI Launch Wave

三、有人一個月付 1.5 億美元租晶片,租到 2029 年

據報導,Reflection AI 將從 7 月 1 日起,每個月支付約 1.5 億美元,一路付到 2029 年,換取 Nvidia 最新 GB300 晶片跟周邊硬體的優先使用權——這些算力擺在 SpaceX 的 Colossus 2 資料中心裡。

算一下,這是三年總額超過 50 億美元的固定承諾。先不論這數字多誇張,真正要留意的是「固定」這兩個字。AI 這行的算力需求、晶片價格、模型效率,每隔幾個月就翻一輪。今天簽下一個鎖到 2029 年的天價合約,等於賭未來三年的賽局不會大變——但這行唯一確定的事,就是它一定會大變。如果哪天出現一個效率高十倍的架構,或更便宜的晶片世代提早來了,這份合約就從「搶到稀缺資源的先機」變成「綁在脖子上的水泥塊」。

換個角度想反而更清楚:怎樣會讓這筆投資穩賠?答案就是「賭的那個前提變了,但你已經沒辦法回頭」。承擔得起巨大上行的人很多,承擔得起「賭錯了還跑不掉」的人很少。

來源:Crescendo AI — Latest AI News

四、微軟自己做模型,要把「靠 OpenAI」這條依賴拆掉

微軟在 Build 大會上端出了自家的模型:MAI-Code-1-Flash,吃你寫的文字描述、吐出網站跟應用程式的程式碼;還有走私人預覽的 MAI-Thinking-1。官方說法很官方,但這步棋的意圖藏不住——微軟想降低對 OpenAI 的依賴,順便把開發者用模型的成本壓下來。

微軟跟 OpenAI 的綁定有多深不用我多講。但越深的綁定,越會逼出「自己也得有一手」的動作。這不是微軟不信任 OpenAI,是任何一家把命脈押在別人身上的公司,遲早都會走到這一步——你越依賴某個供應商,那個供應商對你的議價權就越大,大到某個程度,自建的成本再高也划算,因為你買的不只是模型,是「不被掐住」的保險。垂直整合從來不是因為自己做比較便宜,是因為被人掐住的代價更貴。

來源:CNBC — Microsoft unveils new AI models

五、Arcade 募了 6,000 萬,要做「管 AI 能動手做什麼」的那層

前面四條都在講「讓 AI 更會自己動手」。第五條剛好補在反方向:Arcade 完成 6,000 萬美元的 A 輪募資,要做的是一個「安全行動層」——讓企業能精確控管自主 agent 在正式環境裡到底被授權做哪些事。

這條新聞單看不起眼,放在這禮拜的脈絡裡卻是最關鍵的一塊拼圖。當前面所有人都在比誰能讓 AI 跑得更遠、管得更少,總得有人回頭問:那它真的動手把事情搞砸的時候,是誰先擋下來?一個能自己跑、能呼叫工具、能改正式環境的 agent,跟一把交到陌生人手裡、沒上保險的槍,差別只在於你有沒有事先想清楚「它能扣哪些扳機、不能扣哪些」。市場願意丟錢進這個方向,說明連最樂觀的人也開始意識到:自主性衝得越前面,那道煞車就越值錢。

來源:Crescendo AI — Latest AI News


這五條看起來各講各的,但底下是同一個動作:整個產業都在用力把人從決策迴圈裡移出去,讓 AI 自己跑得更久、更遠、更少被打斷。能力上這當然是進步。

只是進步的方向,決定了你該拿什麼當判準。下次有人興奮地告訴你某個 agent 「現在可以全自動跑了」,先別急著鼓掌——倒過來問三件事就好:它跑歪的時候,多久會被發現?發現了,誰有權限把它按停?按停之後,爛攤子算誰的?這三題答得清楚的自主化,是真本事;答不清楚的,只是把闖禍的速度也一起自動化了而已。