15 個。

這是 Anthropic 昨天丟進中小企業市場的預製 AI 工作流數量。不是 15 個 prompt template,是 15 個直接串進 QuickBooks、PayPal、HubSpot、Canva、DocuSign 的 agentic workflow。Claude 可以自己對帳、追發票、分析毛利、整理月報——不需要你寫一行程式碼。

同一天,OpenAI 成立了一間叫 DeployCo 的子公司,專門幫企業把 AI 塞進生產環境。Google 把 Gemini 縫進 Android 的每一層,從 app 操作到瀏覽器摘要到桌面 widget。微軟用一群 AI agent 挖出了 16 個 Windows 零日漏洞,其中四個是遠端程式碼執行。DeepSeek V4 Pro 以 Opus 4.7 六分之一的價格,在 benchmark 上貼到了同一個水準。

五條新聞,一個共同訊號:AI 公司不再只是賣模型了。它們在搶的是——誰先嵌進你的日常工作流,誰就拔不掉。


Claude for Small Business:15 個工作流,7 個軟體整合,零行程式碼

Anthropic 昨天發布 Claude for Small Business,正式把火力從企業客戶延伸到中小企業。

這不是「把 Claude 加上一個 Small Business 標籤」的行銷操作。它是一整套連接器和預製工作流——直接串進 Intuit QuickBooks、PayPal、HubSpot、Canva、DocuSign、Google Workspace、Microsoft 365。15 個內建的 agentic workflow 涵蓋財務、營運、銷售、行銷、HR、客服六大領域。

具體能做什麼?Claude 可以幫你對帳、標記可疑交易、產出損益表摘要、準備月結報表。還有發票催收器、毛利分析器、稅季整理器、合約審查器、lead 分類器、內容策略師。每一個都是一個獨立的 AI 技能,可以組合使用。

定價很簡單:不額外收費。你只需要 Claude 的訂閱費加上你已經在付的 QuickBooks、HubSpot 之類的費用。

但真正有意思的不是產品本身,是 Anthropic 的下一步。從五月十四號開始,Anthropic 啟動十城巡迴——芝加哥、達拉斯、紐澤西、舊金山等——每站辦半天免費 AI 培訓,每場 100 位中小企業主。

換個角度想:怎樣讓這個策略失敗?讓中小企業主自己去看文件、自己設定整合、自己搞懂 AI 能幹嘛。Anthropic 顯然知道這行不通,所以它乾脆把教育成本也吃下來了。這不是慈善,這是用戶獲取成本。但對被獲取的那些中小企業來說,真的是佛心來的。

原文來源:Anthropic launches Claude for Small Business — SiliconANGLE
原文來源:Introducing Claude for Small Business — Anthropic


不賣模型了。賣的是「幫你把 AI 塞進去」這件事本身。


OpenAI DeployCo:一間專門幫企業「把 AI 裝好」的子公司

五月十三號,OpenAI 宣布成立 DeployCo——一間獨立的企業部署公司,任務只有一個:幫企業把 frontier AI 帶進生產環境,並且轉化成可量測的商業影響。

這件事表面上很無聊。AI 公司成立企業服務部門,有什麼好報的?

但仔細看結構,這其實是 OpenAI 對一個尷尬現實的回應:大多數買了 ChatGPT Enterprise 的公司,其實不知道怎麼用。 帳號開了,API key 發了,然後呢?工程團隊忙著維護現有系統,產品團隊不知道 AI 該塞在哪個環節,管理層只看到帳單但看不到 ROI。

DeployCo 的模式是派人進去——不是賣 license,是賣「把 AI 真正用起來」的全流程服務。從找痛點、設計工作流、到上線後的效果追蹤。

逆向問一下:如果你是 OpenAI 的競爭對手,你應該擔心什麼?不是 DeployCo 的技術——它不做模型。你應該擔心的是 lock-in。一旦 OpenAI 的團隊幫一間企業設計完整個 AI 工作流、訓練完整個團隊、建好衡量框架,那間企業要換到你的模型的成本就不只是 API 費率的差距了。它是整個組織慣性的差距。

這招 Accenture 玩了二十年,現在 OpenAI 也學會了。

原文來源:OpenAI launches the OpenAI Deployment Company — OpenAI


Gemini Intelligence for Android:Google 把 AI 縫進手機的每一層

Google 宣布 Gemini Intelligence for Android——一個跨越手機、Chrome、筆電、汽車的 AI 整合層。

這不是 Google Assistant 改名。Gemini Intelligence 可以自動執行跨 app 的多步驟操作、摘要網頁內容、用自然語言建立桌面 widget。今年夏天開始在部分 Samsung Galaxy 和 Google Pixel 上推出。

跨 app 操作是關鍵。以前的手機助理只能在單一 app 內做事——設鬧鐘、查天氣、播音樂。Gemini Intelligence 的目標是串聯多個 app 的操作流。「幫我把這張收據拍照,存到 Google Drive 的報帳資料夾,然後在 Google Sheets 的報帳表新增一筆」——一句話,三個 app。

但 Google 做語音助理的歷史紀錄不算漂亮。Google Assistant 推出十年了,大多數人用它做的事還是設鬧鐘和問天氣。Gemini Intelligence 能不能打破這個慣性?

決定因素不是技術能力。是可靠度。一個每十次出錯一次的跨 app 操作,比手動操作更浪費時間——因為你不知道它「這次」會不會出錯,所以每次都要盯著看。可靠度要到 98% 以上,使用者才會放心「丟了就走」。Gemini Intelligence 能不能達到這個門檻,現在沒人知道。

不過 Google 的時機選得很巧。Apple 的 AI 重塑計畫還沒正式推出,Google 在搶的是「成為 Android 上預設 AI 層」的先機。一旦搶到了,後面的人就不是在追技術,是在追使用者習慣。而使用者習慣,才是真正的護城河。

原文來源:Google races to put Gemini at the center of Android — CNBC


16 個零日漏洞。在 Windows 裡。其中四個是遠端程式碼執行。發現者不是人類研究員,是一群 AI agent。


Microsoft MDASH:AI Agent 挖出 16 個 Windows 零日漏洞

微軟內部代號 MDASH 的多模型 agentic 安全系統,在 Windows 的網路和認證元件中發現了 16 個先前未知的漏洞。其中四個是嚴重等級的遠端程式碼執行。

MDASH 不是一個模型,是一群模型。多個 AI agent 分工——有的負責模糊測試,有的負責靜態分析,有的負責驗證漏洞是否可被利用。它們之間會互相交叉確認,降低誤報率。

16 個零日漏洞。如果這些是由人類安全研究員發現的,會是一年份的安全公告。AI agent 在短時間內就做到了。

但這裡有一個結構性矛盾。

微軟用 AI 找自家產品的漏洞,這是防守。但同樣的技術——多模型 agent、自動化漏洞挖掘、攻擊鏈驗證——如果被攻擊者用在別人的產品上呢?

上週我們報導過 OpenAI 的 GPT-5.5-Cyber 在模擬環境中十次攻擊成功兩次。這週微軟的 MDASH 在真實環境中找到 16 個零日。攻防兩端同時在加速,但加速的曲線不一定對稱。防守方要修所有漏洞,攻擊方只需要找到一個。

更值得注意的是規模效應。一個人類安全研究團隊一年能審計多少行程式碼?一百萬行算頂尖。AI agent 不需要睡覺、不需要休假、可以同時跑一百個實例。當漏洞挖掘的速度超過修補的速度,整個安全生態系的平衡就會改變。

微軟至少在用這個技術保護自己的產品。問題是:有多少其他公司的產品,還沒被同等級的工具審計過?

原文來源:Microsoft agentic security system finds 16 Windows zero-days — Crescendo AI


DeepSeek V4 Pro:六分之一的成本,同一個水準的表現

四月二十四號,DeepSeek 發布 V4 Pro,1.6 兆參數,MIT License,開源權重。

價格是重點。Input $1.74、Output $3.48,每百萬 token。跟 Claude Opus 4.7 比是六分之一的成本。跟 GPT-5.5 比也在同一個量級的折扣。

Benchmark 表現呢?agentic benchmark 上緊貼 GPT-5.5 和 Opus 4.7。不是超越,是「在同一張桌子上」。考慮到價格差距,這個結果足以讓很多企業重新算一次帳。

DeepSeek V4 有兩個版本。Pro 是旗艦版,1.6T 參數。Flash 是輕量版,284B 參數,適合延遲敏感的場景。兩個版本都有開源權重——你可以下載下來自己部署,完全不經過 DeepSeek 的 API。

對開發者來說,這個開源授權是最大的差異化。Opus 和 GPT 都是閉源模型,你只能透過 API 使用,定價權完全在模型供應商手裡。DeepSeek V4 Pro 讓你可以自己 host,自己定價。長期來看,這是成本結構的根本性差異。

但別急著全線切換。Benchmark 分數跟實際體驗之間的落差向來不小。DeepSeek V4 Pro 在中文場景的表現通常比英文好一截——這對台灣開發者可能是加分,但如果你的產品主要面對英語市場,拿 benchmark 當決策依據之前最好自己跑一輪 eval。

還有一件事值得留意:DeepSeek 的模型訓練基礎設施在中國。對部分受監管行業的企業來說,這是一個不能用 benchmark 分數抵消的風險因子。技術能力跟合規可用性是兩回事。

原文來源:DeepSeek V4 arrives at 1/6th the cost of Opus 4.7 — VentureBeat
原文來源:DeepSeek V4: Features, Benchmarks, and Comparisons — DataCamp


五條新聞,一個模式。

Anthropic 帶著 15 個工作流直接嵌進中小企業的日常工具鏈。OpenAI 成立子公司專門幫企業「把 AI 裝好」。Google 把 Gemini 縫進 Android 的作業系統層。微軟用 AI agent 挖自家產品的漏洞。DeepSeek 用六分之一的價格提供同級能力。

每一家都在做同一件事:從「提供 AI 能力」轉向「嵌入 AI 能力」。

能力是可以切換的——今天用 Claude,明天換 GPT,成本就是 API key 換一個。嵌入是拔不掉的——工作流設好了、團隊訓練完了、資料管線建好了,換一家供應商的成本不再是技術成本,是組織成本。

所以真正的競爭不在 benchmark 分數上。在你的 QuickBooks 裡。在你的 Android 桌面上。在你的安全審計流程裡。在你的基礎設施帳單裡。

該問的問題不是「哪個模型最強」。是:你現在正在被哪一家嵌入?你有意識到嗎?