AI 與科技新聞摘要 - 2026/05/13

393%。

這是 2026 年第一季，AI 驅動的流量導向美國零售網站的年增幅。不是 39.3%，是 393%。接近四倍。而且這些 AI 帶來的流量，購買轉換率比傳統管道高出 42%。

同一天，Anthropic 宣布 Claude 正式進軍法律科技，帶著 12 個法律 Plugin 和 20 多個 MCP 連接器。GitHub 把 Copilot 從月費制改成用量計費，開發者社群的反應可以用一句話總結：「付一樣的錢，拿更少的東西。」Cloudflare 發表了一個把 LLM 權重無損壓縮 22% 的技術。Cursor 推出 2.0，自研 coding model 加上八個 agent 同時平行執行。

如果你把這五條新聞疊在一起看，會發現一件事：AI 正在同時吃掉基礎設施層、工具層、和應用層。不是「即將」，是「正在」。

Claude for Legal：AI 進法律業，不是替代律師，是替代律師的工具鏈

Anthropic 不做法律 AI 產品已經不可能了。

五月十二日，Anthropic 正式推出 Claude for Legal。這不是「Claude 幫你看合約」這種玩具級整合。這是一整套法律實務堆疊——12 個 Plugin 涵蓋商業法律顧問、僱傭法顧問、訴訟助理、甚至法律系學生的學習輔助。20 多個 MCP 連接器直接串進 Ironclad、DocuSign、Definely、iManage、NetDocuments、Relativity、Everlaw、Consilio 這些法律科技產業的核心系統。

但真正的大事是 Thomson Reuters 那一塊。

CoCounsel Legal——Thomson Reuters 的法律 AI 產品——被用 Anthropic Claude Agent SDK 從頭重建了。使用者用自然語言描述案件，CoCounsel 自動規劃任務、選擇工具、去 Westlaw 和 Practical Law 裡檢索內容、產出附帶完整引用的工作成果。

翻譯一下：一個 AI agent 可以自己決定要查哪些判例、用哪個法律資料庫、怎麼組合出一份有引用來源的法律分析報告。

逆向想一下：怎樣做這件事一定會失敗？答案是——讓 AI 直接面對終端客戶，沒有律師在中間做品質把關。Anthropic 顯然也想到了，所以它的定位是「律師的工具」而不是「律師的替代品」。但定位歸定位，當工具夠好的時候，客戶的第一個問題一定是：「我為什麼要付律師的時薪來操作一個 AI 工具？」

法律科技市場的底層邏輯正在翻轉。以前的法律 AI 是「幫律師搜索更快」，現在是「幫律師思考更少」。這兩者之間的距離，就是整個法律業商業模式的斷層線。

原文來源：Claude for Legal Launches — Artificial Lawyer
原文來源：Thomson Reuters and Anthropic Expand Partnership — PR Newswire

付一樣的錢，拿更少的東西。開發者社群的怒氣不在於價格，在於被當盤子。

GitHub Copilot 用量計費：$10 美金的心理學實驗

六月一日，GitHub Copilot 全線轉為 AI Credits 用量計費制。

Pro 方案還是 $10/月，但現在你拿到的不是「無限使用 Copilot」，而是 $10 的 AI Credits。用完就沒了。Pro+ 是 $39/月含 $39 Credits。Business 是 $19/用戶/月。計費方式按 token 消耗——input + output + cached——全算。

好消息是 code completions 和 Next Edit 維持無限使用。壞消息是，其他所有功能——Chat、Agent mode、Copilot Workspace——都吃 Credits。

月繳用戶 6/1 自動遷移，連個同意的機會都沒有。年繳用戶可以撐到合約到期。

開發者社群的反應非常直接。Visual Studio Magazine 下了這個標題：「You Will Get Less, but Pay the Same Price」。這句話精準到不需要翻譯。

但真正值得注意的不是情緒，是結構。

用量計費的邏輯是什麼？表面上是「用多少付多少」。但在實務上，它創造了一個每次按下 Tab 鍵都要做成本計算的心理負擔。你不會再毫無顧忌地讓 Copilot 幫你探索三種解法然後選最好的——因為每一次探索都在燒 Credits。

這跟雲端運算早期的陷阱一模一樣。按用量計費聽起來合理，直到你發現帳單比固定費率高了三倍，而且你完全預測不了下個月要花多少錢。

GitHub 的算盤是：大多數用戶其實用不到 $10 的量，所以轉用量計費對 GitHub 來說是淨賺。少數重度用戶會超支——而這些人正好是最離不開 Copilot 的人，價格彈性最低。完美的價格歧視。

原文來源：GitHub Copilot Is Moving to Usage-Based Billing — GitHub Blog
原文來源：Devs Sound Off on Usage-Based Copilot Pricing — Visual Studio Magazine

Cloudflare Unweight：壓縮 22%，零損失，GPU 直接解壓

LLM 推理的瓶頸不是算力，是記憶體頻寬。

Cloudflare 發表 Unweight，一個無損壓縮 LLM 權重的技術。在 Llama-3.1-8B 上，MLP 層的權重壓縮了約 30%，整體模型大小減少約 20~22%。重點是：完全無損，bit-exact outputs。壓縮前後跑出來的結果一模一樣，連最後一個 bit 都不差。

技術原理很漂亮。把 BF16 浮點數拆成兩部分：sign + mantissa 和 exponent。然後對 exponent 做 Huffman 編碼——因為 LLM 權重的 exponent 分布極度集中，最常見的 16 個值覆蓋了 99% 以上的權重。高度集中的分布，正是 Huffman 編碼最擅長壓縮的對象。

更妙的是解壓縮路徑。GPU 直接在 shared memory 裡解壓，繞過 main memory。這意味著壓縮不只省了儲存空間，還減少了記憶體到 GPU 的傳輸量——而這正是推理延遲的主要瓶頸。

用工程師的話說：這是一個「沒有 trade-off 的優化」。壓縮率不高不低剛好在甜蜜點——22% 不足以改變模型架構，但足以讓你在同一張 GPU 上多塞幾個並行請求。配合 Cloudflare 正在建設的全球 LLM 推理基礎設施，這個技術的戰略價值遠大於技術本身。

逆向問一個問題：為什麼之前沒人做這件事？因為 LLM 權重的統計特性——exponent 分布集中——是一個已知事實，Huffman 編碼是資訊理論的第一堂課。答案可能是：大家都太忙著做有損壓縮（量化）了，沒人回頭看這個最基本的無損路線。有時候最大的盲點不是你不知道的事，是你以為不值得做的事。

原文來源：Unweight: Tensor Compression — Cloudflare Blog
原文來源：Cloudflare LLM Infrastructure — InfoQ

八個 agent 同時跑。一個人的生產力乘以八。但 bug 的生產力也乘以八。

Cursor 2.0：自研模型 + 八個平行 Agent，開發者的分身術

Cursor 推出 2.0，一次拉開了兩個戰線。

第一條戰線：自研 coding model。Cursor 把它叫做 Composer，號稱速度是同等智力模型的四倍。這句話很微妙——「similarly intelligent」——等於承認它不是最聰明的模型，但它是同級裡最快的。在 coding 場景中，這個 trade-off 通常是值得的。寫程式不像寫論文，你不需要模型花三十秒深度思考然後給你一個完美答案。你需要它在三秒內給你一個八十分的答案，然後你迭代。

第二條戰線：平行 agent。新介面支援最多八個 agent 同時工作，用 git worktrees 或 remote machines 做隔離。Tiled layout 讓你同時看到所有 agent 的狀態。

八個 agent 同時跑。一個人坐在螢幕前，管理八條平行的開發線。這不是科幻，這是 Cursor 2.0 的預設體驗。

但想一下失敗模式：八個 agent 同時寫程式碼，每個 agent 都在自己的 worktree 裡獨立工作。當你把八條 worktree 合併回去的時候——merge conflict 的數量和複雜度是線性增長還是指數增長？如果其中兩個 agent 都決定重構同一個模組的介面呢？

另外值得注意的是 Security Review（beta）。Cursor 加了一個 always-on 的安全審查器和漏洞掃描器。這暗示了一件事：當 AI agent 大量產出程式碼的時候，安全漏洞的注入速率也會等比例上升。Cursor 自己顯然意識到了這個問題——所以它在加速油門的同時，也開始裝煞車。

原文來源：Cursor 2.0 — Cursor Blog
原文來源：Cursor 2.0 Changelog

AI 導流電商：轉換率高 42%，但誰在決定你買什麼？

2026 年第一季，AI 驅動的流量導向美國零售網站，年增 393%。

這個數字的意義不在於大小——年增率在基期小的時候本來就容易飆高。真正值得注意的是轉換率：AI 導流的購買轉換率比其他管道高出 42%。

為什麼高？因為 AI 代理——ChatGPT、Claude、Perplexity——在推薦產品的時候，做的不是「列出十個選項讓你自己挑」。它做的是「理解你的需求，直接告訴你買這個，附上連結」。這跟 Google 搜尋的體驗完全不同。搜尋引擎給你選擇。AI 代理給你答案。

選擇讓人猶豫。答案讓人行動。所以轉換率高 42% 一點都不意外。

但這裡藏著一個系統性風險。當消費者的購買決策從「我搜尋、我比較、我選擇」變成「AI 推薦、我點連結、我付款」，決定你買什麼的人就不再是你了。是訓練 AI 的資料。是 AI 公司和品牌之間的合作協議。是推薦演算法的權重分配。

這不是陰謀論，這是商業邏輯。如果 AI 導流的轉換率比搜尋引擎高 42%，品牌商願意為這個管道付多少溢價？當溢價夠高的時候，AI 公司有沒有動機把「最好的產品」換成「付最多錢的產品」？

搜尋引擎時代我們花了十五年才搞清楚 SEO 和付費排名的遊戲規則。AI 推薦時代的遊戲規則還沒建立，但利益結構已經在形成了。

原文來源：各大科技媒體報導

五條新聞，五個不同的領域，一個相同的結構。

Anthropic 進法律業——AI 從「幫你搜索」進化到「幫你思考」。GitHub Copilot 轉用量計費——工具供應商開始對 AI 的真實成本做更精確的定價。Cloudflare 壓縮 LLM 權重——基礎設施層在為 AI 的規模化部署掃除瓶頸。Cursor 八個 agent 平行——單一開發者的產出能力在非線性膨脹。AI 導流電商轉換率飆升——消費者的決策權正在靜默轉移。

把這些拼在一起，你會看到一個模式：AI 的能力邊界每擴張一步，人類的某個決策環節就被壓縮一步。 法律判斷、程式碼審查、購買決策、甚至「用多少 AI」這個決定本身——都在從人的手裡滑向系統的手裡。

這不是好或壞的問題。這是結構性的。

所以該問的問題不是「AI 會不會取代我」。該問的是：在這個加速的過程中，哪些決策環節是你絕對不能外包的？ 畫出那條線，然後守住它。因為如果你不主動畫線，系統會幫你畫——而系統畫的線，通常不在你想要的地方。