模型又快了幾趴、benchmark 又被誰刷新——這種新聞每週都有,看久了會麻痺。這禮拜真正值得停下來的,是另一條更安靜、也更難回頭的線:當所有人的模型能力都逼近天花板,戰場就不再是「誰更聰明」,而是「這份聰明到底歸誰」。能力可以被偷、算力可以被斷、組織的知識可以長在別人的伺服器裡。把這禮拜幾條排開來看,主角全是這件事。

一、Anthropic 直接點名阿里巴巴:史上最大規模的「偷能力」行動

6 月 24 日這條新聞的份量,遠超過一般的公司互槓。Anthropic 寫了一封信給美國參議院銀行委員會,指控與阿里巴巴 Qwen 實驗室有關的操作者,在 4 月 22 日到 6 月 5 日之間,用大約 25,000 個假帳號,對 Claude 發動了 2,880 萬次的對話交換——目標很精準,全衝著 Claude 最值錢的兩項能力去:軟體工程跟 agentic 推理。

這在業界叫「蒸餾」(distillation):你不用自己訓練一個頂級模型,只要不停餵問題給對手的模型、把它的回答收集起來,拿這些回答去訓練一個便宜很多的山寨版,就能逼近原版的能力。Anthropic 今年 2 月才抓過 DeepSeek、Moonshot、MiniMax 三家,加起來 1,600 萬次交換、2.4 萬個假帳號。這次光阿里一家,就超過那三家的總和。

為什麼這條比帳單漲價重要太多?因為它戳破了一個大家默認的假設——你以為前沿模型的護城河是「訓練它有多難」,其實真正的護城河早就漏了,因為「複製它」比「訓練它」便宜一個數量級。更麻煩的下行在後面:用蒸餾抄出來的模型,往往沒把原版那套安全護欄一起抄過去。能力複製得很像,煞車系統卻是空的。這種東西流到市面上,風險不是抄襲,是一台沒煞車的車掛著名牌車的引擎。Anthropic 還順手把這件事接上了地緣政治——五角大廈 6 月 8 日才把阿里列進中國軍工企業黑名單,阿里這禮拜回頭告了國防部。一條技術新聞,底下壓著的是國家層級的角力。

要提醒一句:這目前是 Anthropic 的單方指控,不是中立調查的結論。假帳號怎麼抓到的、Qwen 到底因此進步多少,信裡都沒講。看的時候帶著這個保留。

原文來源:Anthropic accuses Alibaba of campaign to ‘brazenly’ and ‘illicitly’ extract AI capabilities - CNBC

二、Claude Tag 鑽進 Slack:以後 AI 不是你私下用,是整個團隊養的

同一個禮拜,Anthropic 推了 Claude Tag。它把 Claude 從「每個人自己開一個視窗私聊」,變成「整個 Slack workspace 共用的一個團隊成員」——有自己的身分、自己的記憶、管理員指定的工具跟程式碼權限。你在頻道裡 tag 一下 @Claude 丟個任務,它會自己把事情拆成幾段、一段一段跑完,做完回你一條 thread。

幾個設計值得留意。它是多人共享的:同一個頻道裡只有一個 Claude,誰都能看到它在忙什麼、誰都能接手上一個人沒講完的話。它能非同步幹活,你設成背景任務就走人,它甚至會自己排程、連續跑好幾個小時甚至好幾天。它有長期記憶,跟著頻道久了就累積出脈絡,不用每次從頭跟它解釋公司在幹嘛。打開 ambient 模式後它還會主動冒出來,提醒你某個 thread 卡住沒人收尾。

最炸的一個數字是 Anthropic 自己爆的:今天他們產品團隊 65% 的程式碼,是內部版的 Claude Tag 寫的。

但這個數字要怎麼讀,才是重點。Anthropic 沒公布那 65% 是怎麼算的——AI 寫的程式碼怎麼定義、人類改了多少、有沒有拿來跟缺陷率和長期維護成本對照。一個漂亮的單點數字,最容易讓人忽略它隱藏了什麼。真正的轉變其實藏在計費模型裡:Claude Tag 把用量從「個人帳號」搬到「組織帳號」,每個連接的工具都要管理員開一個 service account。換句話說,AI 正在從「個人生產力工具」變成「組織的基礎設施」——而基礎設施一旦長進你的流程,要拔掉的成本就完全不是換個 app 那麼簡單了。舊的 Claude in Slack app 8 月 3 日就要收掉,沒動作的組織會被自動遷移過去。

原文來源:Introducing Claude Tag - Anthropic

三、Mistral 開峰會:模型只是門面,它真正在蓋的是「自己的算力」

歐洲這邊,Mistral 在六月底辦了 AI Now Summit,端出一堆東西——統一的 Vibe agent(長時間跑的生產力跟 coding 任務)、新的 OCR 4(號稱獨立標註員在 72% 的比較裡更偏好它)。但最該看的不是這些模型,是另一件更重的事:他們要自己蓋資料中心。

地點在巴黎南邊 Essonne 的 Les Ulis,一座 10 MW、專門做推論(inference)的設施,預計第三季開。蓋這個的理由講得很白——「應對算力供應鏈的風險」。

這句話翻成白話就是:當你的整套生意都建在別人的 GPU、別人的雲、別人的供應鏈上,你看起來在做 AI,其實命脈捏在上游手裡。模型能力會收斂,大家遲早都做得出夠好的模型;真正分出生死的,是斷鏈的時候誰還活得下去。自己蓋資料中心是貴、是慢、是「不能規模化」的笨功夫,但它換到的是一個別人拿不走的東西。能不能持有十年的資產,跟租十分鐘的方便,是兩種完全不同的賭注。

原文來源:Frontier AI LLMs, assistants, agents, services - Mistral AI

被 Cognition 收購的 Windsurf,6 月 2 日正式改名叫 Devin Desktop,整個併進 Devin 那套雲端 agent 平台,捆上 Devin Cloud agent 跟 Devin Terminal CLI。它的招牌 Cascade agent 還在,自家的 SWE-1.5 模型號稱比 Sonnet 4.5 快 13 倍。

換個名字看起來是小事,但放進這禮拜的脈絡裡就有味道了:AI coding 工具正在快速整併。Copilot 改用量計費、Kiro 把 Amazon Q 整碗換掉、現在 Windsurf 被吸進 Devin。獨立工具一個個被收編進更大的平台。對天天靠這些工具吃飯的人來說,這裡有個很實際的下行——你習慣的工具,可能哪天就不叫那個名字、改了計費、綁進一套你沒打算買的全家桶。把生產流程綁死在單一供應商身上,省下來的學習成本,是用「哪天被換掉時的轉換痛苦」借來的。

原文來源:AI Coding Agents 2026 比較 - Lushbinary

五、DeepSeek 繞開 NVIDIA:被掐脖子的人,正在學會不用對方的手

最後這條跟第一條遙相呼應。DeepSeek 發了一篇論文,提出一套叫 Manifold-Constrained Hyper-Connections 的訓練框架,主打在算力跟能耗大幅降低的前提下還能擴展——白話講,就是想辦法在拿不到頂級 NVIDIA GPU 的限制下,把模型訓練這件事做下去。更狠的是它最新的 V4 系列,直接針對華為昇騰、寒武紀的晶片做優化,把早期存取從 NVIDIA 跟 AMD 那邊抽掉。

這是一個很值得記住的訊號。出口管制的本意,是用「掐算力」來拖慢對手。但壓力這種東西很弔詭——它有時候不是讓系統垮掉,而是逼它長出本來不會去長的肌肉。你斷它的 NVIDIA,它就回頭把演算法、把國產晶片這條路打通。第一條新聞是「偷你的能力」,這條是「繞開你的硬體」——同一股力量的兩種出口。靠管制建起來的優勢,本質上是脆弱的,因為它把對手逼到非自立不可。

原文來源:DeepSeek Publishes Open Source AI Training Framework To Bypass Nvidia Chip Limits - Open Source For You


把這五條擺在一起,你會發現一件反直覺的事:當模型能力本身越來越像水電——人人都有、差異不大——競爭就整個從「檯面上」轉到「檯面下」。檯面上是 benchmark 分數、是誰又快了幾趴;檯面下是能力歸誰(蒸餾攻擊)、算力押在誰手上(自建資料中心、繞開 NVIDIA)、組織的知識長在哪台機器裡(Slack agent)。

未來真正分勝負的,可能不是哪家模型在排行榜上多兩分,而是當供應鏈被切斷、當能力被複製、當你想換掉某個供應商的那一刻——誰手上還握著拔不走的東西。看 AI 新聞,別只盯著能力線往上爬。盯住那條更安靜的線:你正在依賴的東西,有多少是別人隨時可以收回的。