系列精選
查看全部Claude Agent SDK 完整教學 — 用 Python 打造你自己的 AI Agent 應用程式
你雇了一個很聰明的實習生。他什麼都懂,但你得告訴他三件事:可以用哪些工具、什麼時候該停下來問你、最後要交出什麼。 Claude Agent SDK 做的事情差不多。它是一個 Python 套件,讓你用幾十行程式碼就能造出一個會自己用工具、跑多輪對話、遇到卡關會問你的 AI agent。不是 Claude Code 裡面的 sub-agent,不是 Managed Agents 的雲端服務——是你自己的程式,跑在你自己的機器上。 跟你已經知道的東西有什麼不同先釐清三個容易搞混的名詞。 Claude API Tool Use 是最底層的能力。你呼叫一次 API、Claude 回你一個 tool call、你執行完把結果丟回去。一來一回,你自己管 loop。 Claude Code Sub-agents 是 Claude Code 裡面的功能。你在 Claude Code 的對話中啟動一個子任務,它在 Claude Code 的環境裡跑。你沒辦法把它搬到自己的應用程式裡。 Agent SDK 在中間。它幫你把「收到 tool call → 執行 → 丟回去 → 再問一次」這整個迴圈包起...
AI 與科技新聞摘要 - 2026/05/20
Google 剛剛提議讓所有網站都能被 AI agent 直接操作。 不是透過螢幕截圖、不是用 Selenium 點按鈕。WebMCP 要讓 agent 繞過整個視覺介面,直接呼叫網站後端的 JavaScript 函式和 HTML 表單。你訂機票,不再是 agent 幫你一格一格填日期——它直接呼叫航空公司的查詢 API,30 秒內回來一份天氣最佳化的行程。 同一天,研究人員證明這些 agent 在拿到工具之後會作弊。Exchange 的零日漏洞正在被打。NGINX 一個藏了 18 年的洞被挖出來。Anthropic 宣布六月要把 Agent SDK 的帳單拆開算。 五條新聞,一個結構性矛盾:我們正在加速讓 AI agent 接管更多系統操作權,同時卻連現有的系統都守不住。 Google I/O 2026:不是 Gemini 4,但可能更重要市場等了三個月,等的是 Gemini 4。Google 端出來的是 Gemini 3.5 Flash。 版本號比期待低了半代,但 Flash 做了一件更有意思的事:它跑 agentic task 的速度是同級 frontier m...
VirtualMe — 用 8 週訪談萃取你的 AI 分身
$60 美金和 8 週的時間。 這是 VirtualMe 宣稱「複製你」的全部成本。市面上那些「打造你的 AI 分身」課程要價 $3,000 到 $5,000,本質上就做三件事:填一份人格問卷、串一個 LLM API、加上同儕壓力讓你不要中途放棄。VirtualMe 把這三件事拆開重組,然後做了一個根本性的改動——把問卷換成訪談。 這個改動不是包裝差異。它改變了萃取出來的東西。 填問卷的問題你填過那種「你是什麼類型的人」問卷嗎?每次填,你其實是在寫「你覺得自己應該是什麼樣的人」。這叫表演式人格——你不自覺地寫出理想中的自己,不是真實的自己。 Stanford 的 Joon Park 等人在 2024 年做了一個實驗(arXiv:2411.10109)。他們用 2 小時訪談搭配 LLM,達到了 85% 的人格重現準確度。關鍵在於:訪談會追問。你說「我重視效率」,訪談者會問「上次你為了效率犧牲什麼?」,你閃躲,它會從另一個角度再問。問卷不會追你,訪談會。 VirtualMe 把訪談拉到 4 到 6 小時,分散在 8 週裡面(每週 30 分鐘),遠遠超過那個研究的門檻。 R1 到 R5...
Claude Code Agent View 完整教學 — 在一個終端機裡同時管理多個 AI 任務
昨天下午我同時開了四個 Claude Code session。一個在寫測試、一個在重構 API 層、一個在改 CI pipeline、還有一個在幫另一個 repo 做 code review。四個 terminal tab,四個不同的 context,我得不斷切來切去——第三個問我要不要執行 rm -rf dist/,我差點在第一個的 tab 裡按了 Enter。 四個 terminal tab 管四個 AI,你管理的不是任務,是 tab 焦慮。 這週我改用 claude agents 做同樣的事。一個畫面,四個任務排成清單,哪個在跑、哪個等我回覆、哪個做完了,一目瞭然。空白鍵看一眼最新回應,需要介入再按 Enter 跳進去。 工頭不用親自搬磚工地上有個角色叫工頭。工頭不砌牆、不拉線、不灌水泥。他站在一個可以看到整個工地的位置,手上一張清單:A 區在灌漿、B 區等材料、C 區完工待驗收。哪邊出狀況他走過去看一眼、下個指令、再回到他的位置。 以前用 Claude Code 跑多個任務,你像一個在每個工位之間跑來跑去的工頭——沒有制高點,不知道其他人在幹嘛,只能靠記憶和 tab ...
AI 與科技新聞摘要 - 2026/05/19
AI 找漏洞的速度,已經比人類修漏洞的速度更快。 HackerOne 三月暫停了 Internet Bug Bounty 計畫。不是因為沒人參加,是因為 AI 輔助的漏洞研究把開源專案的漏洞利用窗口壓縮到維護者根本來不及反應。你的 patch cycle 是兩週,AI 找到新漏洞只需要兩小時。這個速差不是線性的,是指數級的,而且只會繼續拉開。 同一天,Google I/O 2026 開場,預計丟出 Gemini 4。OpenAI 推出 Daybreak 資安平台,用 AI 來找漏洞修漏洞。Kiro Web 版上線讓你在瀏覽器裡跑 coding agent。Windsurf 2.0 把整個 Devin 塞進編輯器。GitHub Copilot 暫停接受新用戶——需求超過了供給。 六條新聞,一個結構性問題:AI 工具的擴張速度,正在系統性地超越安全防線的建設速度。 Google I/O 2026 今天登場:Gemini 4 可能來了今天早上十點(太平洋時間),Google I/O 2026 keynote 正式開場。距離二月發布 Gemini 3.1 P...
x-algorithm — X 平台「為你推薦」推薦演算法完整解析
你以為推薦演算法是在「猜你喜歡什麼」。不是。它在預測你「會做什麼動作」。 xAI 把 X 平台「為你推薦」的完整推薦系統原始碼丟上了 GitHub。不是示意圖,不是論文,是真的在跑的那套程式碼。從幾十億則貼文裡,即時幫你挑出最相關的幾十則——決定你每天打開 X 會看到什麼。 23,761 顆星,Apache 2.0 授權。這是目前公開過最完整的 production-level 社群推薦系統,包含檢索、排序、過濾、廣告混合、內容安全,整條鏈路一次攤開。 不是猜你喜歡,是算你會幹嘛先搞懂一件事:推薦系統不是在做「你喜歡貓所以推貓」這種事。 想像你走進一間有三萬道菜的自助餐。餐廳不可能讓你一道一道看,所以它分兩步:第一步,服務生先從三萬道菜裡撈出三百道你可能感興趣的(粗篩);第二步,主廚根據你的口味、今天的心情、甚至你上次剩了什麼菜沒吃,幫你排出最上面那十道。 x-algorithm 就是這樣。Two-Tower Retrieval 負責粗篩,Transformer Ranking 負責精排。 粗篩用的是「雙塔模型」——一邊是你的使用者特徵,一邊是貼文特徵,兩邊各自算出一個向量,距離...
Claude Code TDD 工作流完整教學 — 讓 AI 先寫測試再寫程式的正確姿勢
你去餐廳點餐的時候,不會先讓廚師煮完再告訴他你要什麼。你會先點菜——「我要一份牛排,七分熟,不要蘑菇醬」——然後廚師根據你的規格去做。 寫程式也是一樣。測試就是你的點單。程式碼就是廚師做出來的菜。 大部分人用 Claude Code 的時候,順序是反的:先叫 AI 寫程式碼,然後自己補測試,發現問題再改。這就像讓廚師先做一道他覺得你應該會喜歡的菜,然後你看了之後說「我其實不吃蘑菇」。浪費時間,浪費食材。 TDD(Test-Driven Development)把順序翻過來:先寫測試,再寫程式碼,最後重構。跟 Claude Code 搭配的時候,這個順序的效果特別好——因為測試就是最精確的需求規格。你用測試告訴 AI「我要的結果長這樣」,AI 就不用猜了。 Red-Green-Refactor:三步循環TDD 的核心只有三步,用顏色記最快: Red — 寫一個會失敗的測試。這個測試描述你要的行為,但對應的程式碼還不存在,所以它一定會失敗。跑一下確認是紅的。 Green — 寫最少的程式碼讓測試通過。不要多寫,不要考慮架構,不要想「順便加個 feature」。目標就是從紅變綠,其他...
AI 與科技新聞摘要 - 2026/05/18
18 個月。 微軟 AI 主管 Mustafa Suleyman 說,再過一年半,所有坐在電腦前面的白領工作都會被 AI 自動化。律師、會計師、行銷、專案管理——全部。 同一週,Apple 宣布 iOS 27 會讓你把 Claude 或 Gemini 設成預設 AI,結束 ChatGPT 獨佔兩年的局面。Meta 的 Avocado 模型再次跳票,1,350 億美元的 AI 投資被華爾街盯著看。歐洲的 AI 資料中心發現自己被電價和電網卡住。Anthropic 則簽下 SpaceX 的 Colossus 1 資料中心——22 萬顆 NVIDIA GPU——然後把 Claude Code 的使用限速翻了一倍。 五條新聞,一個共同訊號:AI 產業正在從「模型夠不夠強」的問題,轉向「基礎設施撐不撐得住」。 Apple iOS 27:iPhone 的 AI 不再只有 ChatGPTApple 確認 iOS 27、iPadOS 27 和 macOS 27 將開放第三方 AI 服務作為 Apple Intelligence 的預設選項。使用者可以在 Writing Tools、Image ...
OpenClaw 101 — 七天從零部署你的 AI 私人助理
大部分 AI 聊天機器人解決的是「回答問題」這個問題。但真正浪費你時間的,不是等答案——是你根本不知道今天該先做什麼。 每天早上打開 email、行事曆、Slack,花二十分鐘搞清楚今天的優先順序。這件事不需要你來做。需要的是一個看得到你所有資料、而且會主動整理好再推給你的助理。 OpenClaw 就是這個東西。 一句話講完:可以自己架設的 ChatGPT + Siri + 自動化工作流跟普通 AI 聊天機器人的差別在哪?普通聊天機器人是你問它答。OpenClaw 不一樣——你不問它,它也會動。 它可以定時掃描你的 Gmail,把未讀郵件按緊急程度分類,然後用 Telegram 推給你。可以每週自動搜集競品動態、產出分析報告。可以在你什麼都沒說的情況下,每天早上九點整理好今天的行事曆摘要。 而且所有資料都留在你自己的設備上,不經過任何第三方雲端服務。 這聽起來像是要寫很多程式。其實不用。OpenClaw 101 這個 repo 用七天課程帶你從零開始,每天大概花一到兩小時,第七天你就有一個跑在自己機器上的 AI 助理了。 讓 AI 懂你的關鍵:三個 Markdown 檔案Op...
168 斷食不是節食 — 一個工程師拆解間歇性斷食的運作原理
你的身體有兩種運作模式。一種叫「處理食物」,另一種叫「修東西」。 問題在於,大部分工程師的一天長這樣:早上八點吃早餐,中午吃便當,下午三點零食,晚上七點晚餐,十一點寫 code 寫到一半再來一包洋芋片。從早上八點到晚上十一點,身體有十五個小時都在處理食物。 「修東西」的時間呢?幾乎沒有。 168 斷食做的事情很簡單:把一天切成 16 小時不吃、8 小時吃。聽起來像在虐自己。但搞懂背後的機制之後,你會發現這不是節食,比較像是幫身體排一個 cron job。 身體的兩種模式吃東西之後,血糖上升,胰臟分泌胰島素把血糖搬進細胞當燃料。這個過程大約持續 3 到 5 小時。在這段時間裡,身體的優先任務是「處理剛進來的食物」——消化、吸收、儲存。其他事情排後面。 等食物處理完、血糖降回基線、胰島素也跟著降下來,身體才會切換模式。 切換之後會發生什麼? 自噬作用(autophagy)啟動了。這個詞拆開來看——auto(自己)+ phagy(吃)——就是「自己吃自己」。聽起來恐怖,但它做的是把細胞裡的損壞蛋白質、老化的胞器、堆積的廢物拆掉回收。你可以把它想成身體層級的 garbage colle...









