系列精選
查看全部Claude Code /goal 完整教學 — 設一個完成條件,讓 AI 自己跑到目標達成才停
先別管 /goal 能拿來做什麼。先看它每一輪做完之後,第一件事是去找誰。 答案有點出乎意料:它去找一個「快速模型」當裁判,問一個是非題——「你剛剛設的那個條件,現在成立了嗎?」如果裁判說還沒,Claude 不會像平常那樣把控制權交還給你、停在那裡等你下一句話,而是自己再開一輪繼續做。成立了,這個 goal 才自動解除。 整個 /goal 的魔法,全在這個「每輪結束問一次裁判」的迴圈裡。把這顆齒輪看懂,剩下的就都是它的推論。 先拆第一個零件:什麼叫「完成條件」平常你跟 Claude 講話,給的是動作——「跑一下測試」「把這個函式改掉」。/goal 要你給的是另一種東西:一個終點的描述。 官方文件給的範例長這樣: 1> /goal all tests in test/auth pass and the lint step is clean 讀一下這句話的結構。它沒有叫 Claude 做任何具體動作,它描述的是「事情做完之後,世界會長什麼樣子」——test/auth 底下所有測試都過、lint 那關是乾淨的。這是一個可以被驗證真假的狀態,不是一串待辦清單。 這個差別是整個機制...
AI 與科技新聞摘要 20260612 — SpaceX 上市、Apple 把 Siri 外包給對手、三個沒修的舊洞被打穿
這週檯面上最吵的是錢——SpaceX 上市、IPO 潮起跑。但底下其實有條更安靜的線在跑:好幾件看似無關的事,講的都是同一件事——你把多少東西,交到了你控制不了的人手上。順著這條線,今天這幾則就不是各自獨立的新聞了。 一、SpaceX 上市,史上最大 IPO,散戶被放進了前排今天,6 月 12 日,SpaceX 在 Nasdaq 開始交易,代號 SPCX。週四晚間定價每股 135 美元,週五開盤前的指標一度指向 175 美元、比定價高出三成。公司釋出 5.556 億股,募得約 750 億美元,承銷商手上還握著約 8,300 萬股、價值約 112 億美元的「綠鞋」選擇權。這個規模,把整間公司的初始市值頂到約 1.78 兆美元,正式超越沙烏地阿美的約 1.74 兆,成為史上最大 IPO。馬斯克在德州 Starbase 敲鐘,上市前幾小時還順手發射了一枚 Falcon 9 送 29 顆星鏈衛星上軌道。 這次有個不尋常的地方:散戶配額傳出上看三成,遠高於一般 IPO 的 5% 到 10%。 為什麼這件事值得多看一眼?因為「讓散戶站前排」聽起來像佛心,實際上要分清楚誰站在前排、誰站在出口。...
ValueCell — 散戶的投資研究,從開二十個分頁變成交給一支 AI 團隊
先講一個大部分散戶都很熟的下午。你想搞清楚一支美股值不值得買,於是螢幕上開始長出分頁:一個開著 SEC EDGAR 在啃那份四十幾頁、又臭又長的英文 10-K,一個開著三四家財經媒體追最新消息,一個開著看盤軟體盯線,還有一個 Google 翻譯隨時待命。Bloomberg Terminal 一年要幾萬美金,不在考慮範圍。研究到一半,你已經忘了最初想問的問題是什麼。 這套流程的問題不在哪一步特別難,而在它假設「研究的人」要同時是會計、是記者、是程式設計師、還是個不會累的盯盤機器。ValueCell 這個開源專案的切入點,剛好就是把這個假設拆掉。 舊做法:一個人要會所有事把上面那個下午拆開來看,散戶其實在同時扮演四種角色。 查財報基本面,是分析師的活;追即時新聞、判斷哪條跟你持倉有關,是記者的活;想做量化交易卻不會寫策略程式,卡的是工程師那一關;每天盯盤怕錯過重大消息,那是一個全職的活。一個人要把這四件事都做好,現實上不可能,所以散戶的研究品質,通常就卡在自己最弱的那一環。 英文不好的,財報那關就過不去。不會寫 code 的,量化那關就過不去。沒時間盯盤的,新聞那關就漏掉。瓶頸從來不...
Claude Code /cd 完整教學 — 在 monorepo 切目錄,又不用重燒 prompt cache
場景是這樣的。你在一個 monorepo 裡工作,剛剛在 services/auth 這個模組跟 Claude Code 來回了二十幾輪——它讀過這塊的 CLAUDE.md、摸清了你的 service 怎麼串、改完了一個 bug。現在你要去隔壁 services/billing 做下一件事。 過去你只有兩條路,而且兩條都不太舒服。 第一條,開一個新 session。乾淨是乾淨,但剛才那二十幾輪建立起來的上下文全沒了,你得重新跟它解釋一遍這個 repo 的慣例。更痛的是 prompt cache 從零開始重建——前面那段對話本來已經被快取住、每輪只算增量,現在等於把整本書重新影印一次,又慢又貴。 第二條,用 /add-dir 把 billing 加進來。但這個指令的本意不是「搬過去」,是「順便也讓我看得到那個資料夾」。你的 session 還釘在 auth,billing 的 CLAUDE.md 預設不會自動載入,--resume 之後也還是從 auth 找回來。它解的是「跨目錄讀檔」,不是「換工作目錄」。 繞了一圈會發現,你真正想要的那件事——「把這場對話原封不動搬到新目錄,ca...
AI 與科技新聞摘要 20260611
這幾天的消息有個很容易被忽略的共同點:沒有一條是「某個模型又變強了」。它們講的全是 AI 怎麼被接進你已經在用的東西——既有的雲端採購預算、既有的 IDE、既有的 VPN 閘道。模型強不強這場仗大致打完了,現在比的是誰能把自己塞進你已經繞不開的流程裡。這件事比多幾分 benchmark 危險得多,因為你一旦接上去,要拔就難了。 一、OpenAI 把模型塞進 Oracle 的採購單,企業用既有雲端額度就能買6 月 10 到 11 日,OpenAI 宣布跟 Oracle 合作:OCI(Oracle Cloud Infrastructure)的客戶,未來幾週內可以拿手上已經承諾的 Oracle Universal Credits,直接折抵 OpenAI 的前沿模型和 Codex。講白話,就是企業不用再為了用 AI 另外簽一份合約、走一遍採購流程,原本買 Oracle 雲端的預算直接挪過來用。 這一步聰明在它根本不碰技術,碰的是摩擦力。大公司導入 AI 最大的卡點從來不是模型不夠好,是法務、採購、資安要重新審一遍新供應商,這一審就是好幾個月。OpenAI 等於繞過這整關,直接站到企業早就...
VoxCPM 語音合成 — 繞了五年才有人說,別再把聲音剁成 Token 了
把時間倒回 2023 年初。那時候語音合成圈子最熱的東西叫 VALL-E,微軟丟出來的。它做了一件當時看起來理所當然的事:把一段聲音先壓成一串離散的 token,然後拿語言模型去預測下一個 token,就像 GPT 預測下一個字一樣。聲音被它當成另一種語言來處理。 這個想法太順了。語言模型那幾年正在橫掃一切,誰都想把自己的領域「翻譯」成 token 序列,這樣就能搭上那班車。於是 Bark 這麼做、ChatTTS 這麼做、阿里的 CosyVoice 也這麼做。差別只在 token 怎麼切、切幾層、解碼器長什麼樣。整個領域有志一同地往同一個方向走了好幾年。 VoxCPM 是清華 OpenBMB 團隊做的開源 TTS,最新版叫 VoxCPM2。它最值得停下來看一眼的地方,不是它支援 30 種語言、也不是 48kHz 的輸出,而是它在所有人都覺得理所當然的那一步上,按了暫停鍵:它不做離散化。 先搞懂大家到底在剁什麼「離散 token 化」聽起來很玄,拆開其實不難。 聲音本身是連續的——空氣壓力隨時間平滑變化的一條曲線。電腦存不下無窮多的點,所以要採樣。但採樣完還是一大堆浮點數,直接餵給...
Claude Code --safe-mode 完整教學 — 你的 AI 壞掉時,先把所有客製化關掉再說
先問你一個會決定要不要讀下去的問題:你的 Claude Code,是不是已經被你自己改到認不出來了? 裝了五六個 plugin、寫了一份越長越像憲法的 CLAUDE.md、掛了幾個 hook 在存檔時自動跑、接了三四個 MCP server。某天它開始怪怪的——一進 session 第一句話就莫名其妙切去 fallback 模型、某個指令行為跟昨天不一樣、或者就是慢得不正常。這時候你要回答的問題只有一個:這麼多客製化,到底是哪一個在搞鬼? 過去的答案很土法煉鋼:一個一個關掉,關一個試一次,看什麼時候恢復正常。Claude Code 在 6 月 8 日的 v2.1.169 加進來的 --safe-mode,就是來終結這個過程的。但這篇真正想講清楚的,是它「救得了」跟「救不了」的那條界線——因為搞錯這條線,你會對著一個它根本治不了的病猛灌它的藥。 它在做的事,就是醫生的「停藥觀察」想像你身體出了狀況,同時在吃五種保健食品、三種藥。醫生不會猜,他會請你全部停掉,看症狀還在不在。如果停光了就好了,問題出在某個你吃的東西,再一個一個加回來找兇手;如果全停了症狀還在,那代表病根本不在這些藥上...
AI 與科技新聞摘要 20260610
一個漏洞要嚴重到什麼程度,你才會願意半夜爬起來修?這週有好幾家公司被迫回答了這個問題,而且答得很狼狽。把這幾則新聞放在一起,會發現它們講的不是各自獨立的倒楣事,而是同一個正在加速的賽跑——找漏洞的速度和補漏洞的速度,雙方都被 AI 餵了興奮劑,差別只在誰先撐不住。 一、Veeam 備份伺服器爆 RCE,CVSS 9.4,網域內任何人都能打6 月 9 日,Veeam Backup & Replication 公開了一個編號 CVE-2026-44963 的漏洞,CVSS v4 評分 9.4。問題的嚴重性不在分數,在門檻:只要是「已驗證的網域使用者」——也就是公司內網裡任何一個有帳號的人——就能在備份伺服器上遠端執行程式碼。影響 12.3.2.4465 以前的所有 v12 版本,修補版 12.3.2.4854 同日釋出,13.x 因為架構改寫過不受影響。GitHub 上已經有人放出概念驗證程式碼。 備份伺服器是什麼地位的東西?它是你被勒索軟體打穿之後,最後一條退路。Akira、Fog、FIN7 這些勒索集團早就把 Veeam 當頭號目標,因為攻擊者最想做的事,就是先把你的備份...
Browser Harness — 用不到 600 行 Python 讓 AI Agent 接管你開著的 Chrome
讓 AI 操控瀏覽器這件事,過去一年的解法方向全錯了。 大家都在往「更完整」走:更多 action、更聰明的 retry、更嚴謹的 session manager、更漂亮的 tool schema。框架疊得越來越厚,號稱替你把每一種狀況都想好了。結果是,agent 能做的事,被它能呼叫的那幾個 action 框死;遇到框架沒設計過的網站怪癖,它就卡在那,因為它沒有權限自己長出新工具。 browser-use 團隊在 2026 年 4 月丟出來的 browser-harness,走的是完全相反的路。整個專案不到 600 行 Python,沒有 retry、沒有 session manager、沒有 action DSL。它只做一件事:把一條通往你 Chrome 的 CDP WebSocket 交到 agent 手上,剩下的——你想點哪、想抓什麼、遇到問題怎麼繞——agent 自己寫 Python 解決。 把廚房鑰匙交出去傳統 agent framework 像飯店的自助餐。廚師在後場把流程都準備好了:action registry、prompt template、tool sche...
Claude Code Fallback Models 完整教學 — 主模型過載時自動換一台繼續跑
先別急著問這功能能幹嘛。先看一個瞬間。 你掛了一個 background agent 在跑重構,自己跑去倒咖啡。就在你離開的那 30 秒,Anthropic 的 Opus 流量尖峰來了,你的請求撞上一個 529 overloaded 錯誤——伺服器在說「我現在忙不過來,等等」。過去,這一撞,你那個背景任務就直接死了,回來只看到一行紅字躺在那。 fallbackModel 這個 v2.1.166 加進來的設定,要處理的就是這 30 秒裡發生的事。但要真的搞懂它,最好的方式不是先聽它的功能清單,而是把那一瞬間慢動作拆開來看:當 529 回來的時候,Claude Code 心裡到底在跑什麼判斷。 把過載的那一刻拆成慢動作想像你打電話叫披薩,最常去那家店線路忙線。你有兩種人。一種會掛掉、坐在那生氣、等十分鐘再重撥同一個號碼。另一種手邊貼了一張紙條,上面照順序寫了三家店的電話——第一家忙線,立刻撥第二家。 沒設 fallback 的 Claude Code 是第一種人。請求撞上 529,它就停在那,要嘛報錯收場,要嘛傻等。設了 fallbackModel 之後,它變成第二種人:主模型回傳過...









