系列精選
查看全部Claude Code /code-review 完整教學:從 /simplify 改名後,AI 用四個 Agent 幫你掃 PR
打開 PR review,1200 行變更,今天不用吃午飯了。 這是台灣工程師每週都會遇上的場景。然後你看著 diff 想:「能不能把這事丟給 AI?」——可以,但 Claude Code 之前的 /review 命令,不是太囉嗦(順手幫你改 code)就是太保守(只列 nit)。 直到五月中,Anthropic 把它整個換過。原本叫 /simplify 的命令改名為 /code-review、移除「順手修補」的行為、改成四個平行 agent 掃 diff、confidence ≥ 80 才出聲、加上 --comment 直接把 inline 評論發到 GitHub PR。 這個改動的好玩在於——不是新增功能,是刪除功能。Anthropic 把命令收窄到「只做一件事」:找 correctness bug。其他的事它不做。 這是這篇要拆給你看的:為什麼這樣設計、怎麼用、什麼時候別用。 三秒先講結果把這個指令背起來: 12345# 在 PR 分支上,輸出到終端機/code-review high# 在 PR 分支上,把問題用 inline comment 發到 GitHub/code...
AI 與科技新聞摘要 20260526:兩個三萬人、Copilot 轉成計量收費、AI 框架本身變成 0-day 攻擊面
兩個三萬。一週內,PwC 用 3 萬名顧問押注 Claude;Bristol Myers Squibb 用 3 萬名員工押注 Claude。沒有人押注 OpenAI。 同一週,GitHub 宣布 Copilot 六月一號全部改用 AI Credits 計費;Cursor 估值飆到 500 億美元、SpaceX 留了 600 億的收購選項——AI IDE 從補貼戰打進燒錢戰。 同一週,一個叫 PraisonAI 的開源 agent 框架被公告漏洞,四小時內就有掃描器探到了。 這五件事連起來,是一個正在加速的趨勢:企業 AI 的採用從「試點」進入「全員部署」階段,模型供應商從「賣 token」進入「綁定客戶」階段,而底層的攻擊面才剛開始有人盯。下行的風險,正以遠快於上行收益的速度長大。 一、PwC 把 3 萬人押在 Claude 上:四大會計事務所第一個正式入場5/14 公布、5/15 開始鋪:PwC 與 Anthropic 擴大合作,三萬名顧問做 Claude 認證,並設立聯合 Center of Excellence。 具體動作不只是「導入工具」這麼簡單。C...
Learn Harness Engineering — 讓 AI Coding Agent 在真實專案穩定工作的開源課程
9 美金跟 200 美金。同一個模型、同一個 prompt,做同一個 2D retro game editor。 裸跑那次跑了 20 分鐘,產出一個跑不動的東西。加上 planner / generator / evaluator 完整馬具的那次跑了 6 小時,做出一個能玩的遊戲。模型沒換,prompt 沒改,差別只在外面包了一層工程環境。 這個對照實驗是 Anthropic 自己做的,數字寫得很乾淨:環境的價值是模型的 22 倍。 大部分人在用 Claude Code 不順的時候,第一反應是換更大的模型、寫更長的 prompt、加更多 example。這就像馬不會拉車的時候,你想換一匹更貴的馬,而不是去買馬具。 walkinglabs/learn-harness-engineering 在解的,剛好就是這個。 馬具到底是什麼Harness 這個詞在軟體圈被用爛了。Harness.io 是 CI/CD 平台、test harness 是測試骨架、LLM eval harness 是評估管線——這門課裡的 harness 跟以上都沒關係。 它指的是包覆...
Claude Managed Agents 自架沙箱與 MCP Tunnels 完整教學 — 讓 AI Agent 在你自己的基礎設施上跑
你要跑一個 Claude agent 自動處理 Jira ticket。 問題是這個 Jira 在公司 VPN 後面、沒有 public endpoint,外面打不進來。傳統做法你會做什麼?開個反向代理、租個跳板機、塞個 OAuth proxy 在 DMZ、然後跟資安部門吵兩個月。最後上線時候那個架構複雜到沒人敢動。 Anthropic 5 月 19 日為 Claude Managed Agents 加了兩個東西,讓上面那段話可以縮成「裝個 daemon、跑一個指令、收工」:Self-hosted sandboxes(自架沙箱)和 MCP Tunnels(私有通道)。前者把 tool 執行搬回你自己的機房,後者讓 Anthropic 那邊的 agent 不開外網就能連你內網的 MCP server。 要看懂這兩個功能設計上的精巧之處,要先把「Claude agent 到底由幾塊組成」這件事拆開來。 一個 AI Agent 拆成兩塊:思考 vs 動手把 agent 想成餐廳: 主廚坐在中央廚房想菜單、看訂單、決定接下來該炒哪盤——這是 agent loop,負責 orchestr...
AI 與科技新聞摘要 - 2026/05/25
OpenAI 的共同創辦人,現在在 Anthropic 上班。 Andrej Karpathy——你可能記得他在 Tesla 帶過 Autopilot AI、後來離開做 nanoGPT 教學影片紅遍 ML 圈、再前面更早他是 OpenAI 創始八人組之一——上禮拜公開宣布他要加入 Anthropic 的 pre-training team。這是 frontier lab 之間人才流動的一個極端案例:不是 senior engineer 跳槽,是創辦人等級的人跳到對家。 同一週,Ramp 釋出 2026 年 4 月的企業 AI 採用率數據——Anthropic 34.4%、OpenAI 32.3%。第一次反超。Anthropic 公開了 Claude for Small Business 把 AI 塞進中小企業工具鏈的策略。OpenAI 機密遞了 IPO 文件給 SEC,Anthropic 同期預告首季營業利潤。Drupal 核心爆出 CVSS 高危的 SQL injection 漏洞,CISA 三天內加進 KEV catalog。 五件事的共通底色:上一波 AI 浪潮是技術競賽,...
notebooklm-py — 用 Python 程式驅動 Google NotebookLM
Google NotebookLM 沒有公開 API。 按理說,這種情況下你只剩兩條路:要嘛開瀏覽器自動化點按鈕,要嘛放棄自動化。但是 GitHub 上有個 14.9k star 的 repo 選了第三條——它打開 Chrome DevTools,把網頁裡每一次點擊背後的 XHR 請求抓下來,逆向出 Google 內部的 RPC 端點和那些被混淆過的 method ID,然後包成一個 Python SDK。 這個專案叫 notebooklm-py。它今天還在合併 PR,是少見的「非官方 Google 服務客戶端」做到專業到誇張的案例:6,186 unit tests、90% coverage、嚴格 SemVer、完整 ADR 記錄。Teng Lin 一個人寫的。 很多人聽到「沒有 API」會反射性想到 Selenium、Playwright、Puppeteer 那一套。但這個 repo 給了一個更值得想清楚的答案:瀏覽器自動化是為了當人,不是為了當機器。如果你能直接跟對方的 RPC 講話,為什麼還要假裝自己是個會點滑鼠的人? 它到底怎麼跟 NotebookLM 講話你打開 No...
工程師夏天續航指南|MacBook 燙手、人腦過熱、咖啡因失靈,三個系統要分開調
下午兩點半,MacBook Pro 風扇開始轉。鍵盤底下的手心冒汗。明明早上喝了咖啡,眼皮卻越來越重。冷氣設 24 度,還是覺得這個房間「悶」。 大部分人會把這個狀態統稱為「夏天就是這樣」,然後繼續泡第二杯咖啡。 但其實這裡同時有三個獨立的系統在當機。它們互相干擾、看起來像同一件事,其實機制完全不同。三個一起調,永遠調不好——因為你不知道哪個變因該動。 把它們一個一個拆開來,反而清楚。 系統一:MacBook 的熱包圍先從最容易觀察的那個說起。 MacBook Air M3 沒有風扇。整台機器就是一塊金屬殼當散熱片。當室溫超過 30 度,外殼跟空氣的溫差變小,散熱效率掉一半以上。當散熱跟不上 SoC 產生的熱,CPU 就會自動降頻——這叫 thermal throttling。 降頻不是「慢一點」這麼溫和。M3 在熱節流狀態下,多核心效能可以直接掉到 60%。你以為自己「電腦怎麼變慢了」,其實是它在自我保護。 如果你用的是 Pro 系列有風扇的型號,狀況不一樣。風扇會開始轉、噪音變大,但效能維持。代價是電池消耗加快、噪音干擾思考。 兩種情況都有同一個解法:讓 MacBook 的下...
AI 與科技新聞摘要 20260524|漏洞利用首次擠掉憑證、Claude 進駐 SaaS、ChatGPT 變廣告平台
19 年。Verizon 的資料外洩調查報告(DBIR)做了 19 年,每一年「憑證濫用」都穩穩坐在初始入侵向量榜首。直到今年。 今年漏洞利用以 31% 拿下第一,憑證濫用直接掉到 13%。中間 18 個百分點不是慢慢挪過去的,是一個季度內翻過去的。這種等級的結構性翻轉,過去要等到「典範轉移」這四個字才有資格用。 當一個用 19 年資料追蹤的趨勢忽然反過來,重點從來不是去爭論排名,而是去問:那個讓 it 翻過來的力量是什麼?接下來會往哪個方向繼續推? 今天 5 則新聞,挑出來的標準很簡單——能不能讓我們看到那股力量。 漏洞利用躍居 #1:攻防失衡正在加速2026 Verizon DBIR 把這個趨勢的細節攤開講。漏洞利用佔了 31% 的初始入侵向量,憑證濫用降到 13%。中位數修補時間從前年的 32 天延長到 43 天,CISA KEV(已知被利用漏洞)目錄裡企業真正修掉的比例,從 2024 年的 38% 掉到 2025 年的 26%。 這幾個數字單獨看都很無聊。組合起來就是一張清晰的攻防失衡圖:攻擊端的時鐘從月跑到小時,防守端的時鐘從週跑到月。原因報告也講白了——AI 在縮短...
用 Claude Skill 把 Prompt 寫對一次勝過快送 10 次|AI Media Generator 拆解
大部分人寫 prompt 的時候,腦袋裡只有一張表:那張表叫做「英文形容詞越多越好」。cinematic, 8k, masterpiece, beautiful, hyper-detailed,一路堆到 token 上限。 這套打法在 Midjourney v4 時代還算管用,到了現在已經是純粹的雜訊。Seedance 看到 fast 會擺爛,要寫 extreme speed 它才動;Flux 看到任何藝術家名字直接拒絕;Midjourney v7 看到 cinematic 已經當你沒講話。同一句 prompt 在 14 個平台會拍出 14 種天壤之別的結果,這個事實沒人在意,因為大家都假設「我寫得越用力,模型就越聽話」。 反過來才對。 真正的問題不是 prompt 寫得不夠長最近翻到一個 repo 叫 ai-media-generator,作者 Hao0321,2026-05-13 才開的 repo,28 顆星、5 個 fork、0 個 issue。從外觀看就是一個無人聞問的個人專案,但裡面藏了一個我覺得很值得拿出來講的觀察: Writing the prompt corre...
冷氣是工程師最便宜的複利投資 — 2026 變頻、CSPF 與補助策略
便宜的冷氣其實是貴的。 這不是文字遊戲。一台 15,000 塊定頻冷氣,跟一台 32,000 塊一級變頻冷氣,買的時候差 17,000。乍看貴了一倍。但如果你跟我一樣,整天在家寫 code,夏天從五月吹到十月,一天平均開十二小時——那台便宜冷氣多吃掉的電費,三年內會超過 17,000 的差價。 從第四年開始,你每年都在用前面累積的差額,幫自己付電費。 這就是工程師最便宜的複利投資。不是 ETF,不是定存——是你頭頂上那台機器。 為什麼今年的選購邏輯完全變了如果你還在用「看不看一級變頻」當買冷氣的標準,那你已經落後一個世代。 2026 年起,台灣全面套用新版 MEPS 能效制度,CSPF(Cooling Seasonal Performance Factor,季節性能源效率比)才是真正能反映省電的指標。一級變頻只代表「比同類產品省電」,但它沒告訴你「整個夏天平均能省多少」。CSPF 數字越大代表整季運轉下來越省。 舉個實際的對比。同樣標示「一級變頻」的兩台機器,CSPF 可能差 0.5 到 1.0。一年下來,這個小小的數字差距會變成幾千塊的電費差。 換個角度想。冷氣不是廚房裡的烤...









