AI 與科技新聞摘要 - 2026/05/14

15 個。

這是 Anthropic 昨天丟進中小企業市場的預製 AI 工作流數量。不是 15 個 prompt template，是 15 個直接串進 QuickBooks、PayPal、HubSpot、Canva、DocuSign 的 agentic workflow。Claude 可以自己對帳、追發票、分析毛利、整理月報——不需要你寫一行程式碼。

同一天，OpenAI 成立了一間叫 DeployCo 的子公司，專門幫企業把 AI 塞進生產環境。Google 把 Gemini 縫進 Android 的每一層，從 app 操作到瀏覽器摘要到桌面 widget。微軟用一群 AI agent 挖出了 16 個 Windows 零日漏洞，其中四個是遠端程式碼執行。DeepSeek V4 Pro 以 Opus 4.7 六分之一的價格，在 benchmark 上貼到了同一個水準。

五條新聞，一個共同訊號：AI 公司不再只是賣模型了。它們在搶的是——誰先嵌進你的日常工作流，誰就拔不掉。

Claude for Small Business：15 個工作流，7 個軟體整合，零行程式碼

Anthropic 昨天發布 Claude for Small Business，正式把火力從企業客戶延伸到中小企業。

這不是「把 Claude 加上一個 Small Business 標籤」的行銷操作。它是一整套連接器和預製工作流——直接串進 Intuit QuickBooks、PayPal、HubSpot、Canva、DocuSign、Google Workspace、Microsoft 365。15 個內建的 agentic workflow 涵蓋財務、營運、銷售、行銷、HR、客服六大領域。

具體能做什麼？Claude 可以幫你對帳、標記可疑交易、產出損益表摘要、準備月結報表。還有發票催收器、毛利分析器、稅季整理器、合約審查器、lead 分類器、內容策略師。每一個都是一個獨立的 AI 技能，可以組合使用。

定價很簡單：不額外收費。你只需要 Claude 的訂閱費加上你已經在付的 QuickBooks、HubSpot 之類的費用。

但真正有意思的不是產品本身，是 Anthropic 的下一步。從五月十四號開始，Anthropic 啟動十城巡迴——芝加哥、達拉斯、紐澤西、舊金山等——每站辦半天免費 AI 培訓，每場 100 位中小企業主。

換個角度想：怎樣讓這個策略失敗？讓中小企業主自己去看文件、自己設定整合、自己搞懂 AI 能幹嘛。Anthropic 顯然知道這行不通，所以它乾脆把教育成本也吃下來了。這不是慈善，這是用戶獲取成本。但對被獲取的那些中小企業來說，真的是佛心來的。

原文來源：Anthropic launches Claude for Small Business — SiliconANGLE
原文來源：Introducing Claude for Small Business — Anthropic

不賣模型了。賣的是「幫你把 AI 塞進去」這件事本身。

OpenAI DeployCo：一間專門幫企業「把 AI 裝好」的子公司

五月十三號，OpenAI 宣布成立 DeployCo——一間獨立的企業部署公司，任務只有一個：幫企業把 frontier AI 帶進生產環境，並且轉化成可量測的商業影響。

這件事表面上很無聊。AI 公司成立企業服務部門，有什麼好報的？

但仔細看結構，這其實是 OpenAI 對一個尷尬現實的回應：大多數買了 ChatGPT Enterprise 的公司，其實不知道怎麼用。 帳號開了，API key 發了，然後呢？工程團隊忙著維護現有系統，產品團隊不知道 AI 該塞在哪個環節，管理層只看到帳單但看不到 ROI。

DeployCo 的模式是派人進去——不是賣 license，是賣「把 AI 真正用起來」的全流程服務。從找痛點、設計工作流、到上線後的效果追蹤。

逆向問一下：如果你是 OpenAI 的競爭對手，你應該擔心什麼？不是 DeployCo 的技術——它不做模型。你應該擔心的是 lock-in。一旦 OpenAI 的團隊幫一間企業設計完整個 AI 工作流、訓練完整個團隊、建好衡量框架，那間企業要換到你的模型的成本就不只是 API 費率的差距了。它是整個組織慣性的差距。

這招 Accenture 玩了二十年，現在 OpenAI 也學會了。

原文來源：OpenAI launches the OpenAI Deployment Company — OpenAI

Gemini Intelligence for Android：Google 把 AI 縫進手機的每一層

Google 宣布 Gemini Intelligence for Android——一個跨越手機、Chrome、筆電、汽車的 AI 整合層。

這不是 Google Assistant 改名。Gemini Intelligence 可以自動執行跨 app 的多步驟操作、摘要網頁內容、用自然語言建立桌面 widget。今年夏天開始在部分 Samsung Galaxy 和 Google Pixel 上推出。

跨 app 操作是關鍵。以前的手機助理只能在單一 app 內做事——設鬧鐘、查天氣、播音樂。Gemini Intelligence 的目標是串聯多個 app 的操作流。「幫我把這張收據拍照，存到 Google Drive 的報帳資料夾，然後在 Google Sheets 的報帳表新增一筆」——一句話，三個 app。

但 Google 做語音助理的歷史紀錄不算漂亮。Google Assistant 推出十年了，大多數人用它做的事還是設鬧鐘和問天氣。Gemini Intelligence 能不能打破這個慣性？

決定因素不是技術能力。是可靠度。一個每十次出錯一次的跨 app 操作，比手動操作更浪費時間——因為你不知道它「這次」會不會出錯，所以每次都要盯著看。可靠度要到 98% 以上，使用者才會放心「丟了就走」。Gemini Intelligence 能不能達到這個門檻，現在沒人知道。

不過 Google 的時機選得很巧。Apple 的 AI 重塑計畫還沒正式推出，Google 在搶的是「成為 Android 上預設 AI 層」的先機。一旦搶到了，後面的人就不是在追技術，是在追使用者習慣。而使用者習慣，才是真正的護城河。

原文來源：Google races to put Gemini at the center of Android — CNBC

16 個零日漏洞。在 Windows 裡。其中四個是遠端程式碼執行。發現者不是人類研究員，是一群 AI agent。

Microsoft MDASH：AI Agent 挖出 16 個 Windows 零日漏洞

微軟內部代號 MDASH 的多模型 agentic 安全系統，在 Windows 的網路和認證元件中發現了 16 個先前未知的漏洞。其中四個是嚴重等級的遠端程式碼執行。

MDASH 不是一個模型，是一群模型。多個 AI agent 分工——有的負責模糊測試，有的負責靜態分析，有的負責驗證漏洞是否可被利用。它們之間會互相交叉確認，降低誤報率。

16 個零日漏洞。如果這些是由人類安全研究員發現的，會是一年份的安全公告。AI agent 在短時間內就做到了。

但這裡有一個結構性矛盾。

微軟用 AI 找自家產品的漏洞，這是防守。但同樣的技術——多模型 agent、自動化漏洞挖掘、攻擊鏈驗證——如果被攻擊者用在別人的產品上呢？

上週我們報導過 OpenAI 的 GPT-5.5-Cyber 在模擬環境中十次攻擊成功兩次。這週微軟的 MDASH 在真實環境中找到 16 個零日。攻防兩端同時在加速，但加速的曲線不一定對稱。防守方要修所有漏洞，攻擊方只需要找到一個。

更值得注意的是規模效應。一個人類安全研究團隊一年能審計多少行程式碼？一百萬行算頂尖。AI agent 不需要睡覺、不需要休假、可以同時跑一百個實例。當漏洞挖掘的速度超過修補的速度，整個安全生態系的平衡就會改變。

微軟至少在用這個技術保護自己的產品。問題是：有多少其他公司的產品，還沒被同等級的工具審計過？

原文來源：Microsoft agentic security system finds 16 Windows zero-days — Crescendo AI

DeepSeek V4 Pro：六分之一的成本，同一個水準的表現

四月二十四號，DeepSeek 發布 V4 Pro，1.6 兆參數，MIT License，開源權重。

價格是重點。Input $1.74、Output $3.48，每百萬 token。跟 Claude Opus 4.7 比是六分之一的成本。跟 GPT-5.5 比也在同一個量級的折扣。

Benchmark 表現呢？agentic benchmark 上緊貼 GPT-5.5 和 Opus 4.7。不是超越，是「在同一張桌子上」。考慮到價格差距，這個結果足以讓很多企業重新算一次帳。

DeepSeek V4 有兩個版本。Pro 是旗艦版，1.6T 參數。Flash 是輕量版，284B 參數，適合延遲敏感的場景。兩個版本都有開源權重——你可以下載下來自己部署，完全不經過 DeepSeek 的 API。

對開發者來說，這個開源授權是最大的差異化。Opus 和 GPT 都是閉源模型，你只能透過 API 使用，定價權完全在模型供應商手裡。DeepSeek V4 Pro 讓你可以自己 host，自己定價。長期來看，這是成本結構的根本性差異。

但別急著全線切換。Benchmark 分數跟實際體驗之間的落差向來不小。DeepSeek V4 Pro 在中文場景的表現通常比英文好一截——這對台灣開發者可能是加分，但如果你的產品主要面對英語市場，拿 benchmark 當決策依據之前最好自己跑一輪 eval。

還有一件事值得留意：DeepSeek 的模型訓練基礎設施在中國。對部分受監管行業的企業來說，這是一個不能用 benchmark 分數抵消的風險因子。技術能力跟合規可用性是兩回事。

原文來源：DeepSeek V4 arrives at 1/6th the cost of Opus 4.7 — VentureBeat
原文來源：DeepSeek V4: Features, Benchmarks, and Comparisons — DataCamp

五條新聞，一個模式。

Anthropic 帶著 15 個工作流直接嵌進中小企業的日常工具鏈。OpenAI 成立子公司專門幫企業「把 AI 裝好」。Google 把 Gemini 縫進 Android 的作業系統層。微軟用 AI agent 挖自家產品的漏洞。DeepSeek 用六分之一的價格提供同級能力。

每一家都在做同一件事：從「提供 AI 能力」轉向「嵌入 AI 能力」。

能力是可以切換的——今天用 Claude，明天換 GPT，成本就是 API key 換一個。嵌入是拔不掉的——工作流設好了、團隊訓練完了、資料管線建好了，換一家供應商的成本不再是技術成本，是組織成本。

所以真正的競爭不在 benchmark 分數上。在你的 QuickBooks 裡。在你的 Android 桌面上。在你的安全審計流程裡。在你的基礎設施帳單裡。

該問的問題不是「哪個模型最強」。是：你現在正在被哪一家嵌入？你有意識到嗎？