禮拜一打開電腦,發現能選的前沿模型,比上禮拜又多了一整排。西邊一批、東邊一批,benchmark 數字咬得死緊,價格卻差到一個數量級。對一個只想把活幹完的工程師來說,這不是好消息——選擇變多,從來不等於決策變簡單。這禮拜的幾條新聞放在一起看,浮出來的不是「誰最強」,而是「誰把自己推到了一個下行很大的位置」。

一、Anthropic 一次推兩個模型,最強的那個卻可能你用不到

Anthropic 同時端出 Claude Fable 5 和 Claude Mythos 5。底層是同一個模型,差別在安全護欄:Fable 5 是給一般人用的版本,Mythos 5 把護欄拿掉,專門服務資安和生物領域那些「需要它真的會找漏洞」的場景。官方說 Mythos 這一檔,能力是壓在 Opus 之上的新層級。

聽起來是好事,但有個地方要冷靜看:能力最強的 Fable 5,正卡在一樁美國監管行動裡,可用性還是未知數;而真正解放的 Mythos 5,只透過 Project Glasswing 對少數大組織開放。

這就是越接近前沿越逃不掉的那種不對稱。模型越強,它能造成的下行就越大,於是監管和門檻自然往上疊——你拿到的永遠是「被綁過的版本」。真正該記住的不是「Anthropic 又領先了」,而是:當一家公司最好的東西必須鎖起來才能賣,這個產業的成熟,是用一道一道閘門換來的。

原文來源:Claude Fable 5 and Claude Mythos 5 (Anthropic)

二、OpenAI 準備 GPT-5.6,但真正的武器是價格

OpenAI 下一批 GPT-5.6 要來了,傳聞包含 Mini 和 Pro、附帶升級的語音模式,context window 往 1.5M token 推(上一代 4 月是 1M)。帳面上是衝著 Anthropic 最頂那一層去的,開發者說它在 agentic coding 上略勝 Mythos 線。

但別只看能力。真正值得注意的是價格:OpenAI 的 token 本來就比 Anthropic 便宜大概一半,這次傳要再往下砍,擺明要打一場價格戰。

價格戰聽起來對用戶是天大的好事,先別急著開心。換個角度問:一場價格戰,誰會先流血到撐不住?當每一家都用「比對手再低一截」當主要武器,賺錢這件事就被無限期往後推。能力可以靠技術拉開,價格只能靠燒錢扛住——前者是護城河,後者是流沙。對用戶來說,今天便宜不代表明天還在,把整條工作流綁死在「現在最便宜的那家」身上,本身就是一個被低估的風險。

原文來源:OpenAI prepares GPT-5.6 models for the upcoming release (TestingCatalog)

三、中國模型兩週內全發,市場從「三強」變成「兩個池子」

最容易被忽略、但結構意義最大的是這條:Qwen 3.7、DeepSeek V4.1、Hunyuan Large 3、ERNIE 5.1、GLM-6——中國這一排前沿模型,幾乎在同一個兩週窗口內全部出貨。GLM 那條甚至傳出是完全用華為昇騰晶片訓出來、沒碰一張 Nvidia。

更要命的是價格。在差不多的能力層級上,中國這一池的推理成本大概便宜 5 到 25 倍。

這讓「2026 的模型市場是 Anthropic vs OpenAI vs Google」這個敘事整個過時了。實際的盤面是兩個區域池子——西方前沿和中國前沿,能力區間重疊,價格卻差一個數量級。一個東西活得久、便宜又夠用,它就會慢慢吃掉那些只贏在「最後 5% 能力」的對手。對只想把事情做完、不在乎是不是用最尖端模型的多數人來說,這個價格鴻溝遲早會改變預設選項。頂尖實驗室現在拚的那 5%,市場未必願意一直為它買單。

原文來源:June 2026 LLM Release Roundup (Presenc AI)

四、Anthropic 自己的數據:程式設計師曝險最高,但還沒變成失業

Anthropic 用 Claude 上百萬則真實對話,做了一份勞動市場研究,提出一個叫「observed exposure(觀測曝險)」的指標——不是問「AI 理論上能取代什麼」,而是看「人們實際上拿 AI 來做什麼工作」。它還刻意把兩種用法分開算:AI 自己獨立完成的(automation)權重高,AI 只是從旁協助的(augmentation)權重低。

結果排第一的是電腦程式設計師,觀測曝險 74.5%。客服、資料輸入、病歷管理緊跟在後。注意,這些不是入門打工,是大家辛苦讀書、以為「有專業就安全」的職業。

但這份研究最該被完整引用的,是它的克制:高曝險到目前為止,並沒有換來統計上顯著的失業。沒有看到對應職業的失業率飆高。先別鬆口氣——它同時發現,曝險每多 10%,官方對 2034 年的就業成長預測就低一截,而且新鮮人和早期職涯者的雇用已經有放緩跡象。

這正是不能用單一數字下結論的典型。「74.5%」嚇人,「失業率沒漲」安心,兩個都對,但都不是全貌。真相藏在分母和時間軸裡:市場不會用大規模裁員這種看得見的方式調整,它會用「少招一個人」這種看不見的方式慢慢調。等到數字顯著,已經來不及反應了。

原文來源:Anthropic Economic Index 勞動市場研究

五、Google 默默補上影像線,這是另一種把你綁住的方式

當所有人盯著文字模型的 benchmark 廝殺,Google 這邊安靜地把 Gemini 的影像線補齊——Gemini 3 Pro Image、Gemini 3.1 Flash Image 陸續上架,同一個品牌切成 Pro、Flash、Image 一整套。

這看起來只是「又多了幾個型號」,但底層是另一種競爭邏輯。比能力是短期的,比生態是長期的。當你的文字、影像、程式碼全都跑在同一家的版本矩陣裡,哪天想換,遷移成本會大到你寧可繼續忍。

所以這禮拜真正值得你做的不是去追哪個模型最新最強,而是回頭問自己一個更實際的問題:你現在到底跑幾種模型、綁了多深?如果答案是「全押在一家、而且懶得換」,那不管那家現在多便宜多強,你已經把選擇權交出去了。在一個每兩週就洗牌一次的市場裡,保留隨時能換的能力,比追到最尖端那一檔,划算得多。

原文來源:AI Updates Today June 2026 (LLM Stats)