系列精選
查看全部Claude Code /cd 完整教學 — 在 monorepo 切目錄,又不用重燒 prompt cache
場景是這樣的。你在一個 monorepo 裡工作,剛剛在 services/auth 這個模組跟 Claude Code 來回了二十幾輪——它讀過這塊的 CLAUDE.md、摸清了你的 service 怎麼串、改完了一個 bug。現在你要去隔壁 services/billing 做下一件事。 過去你只有兩條路,而且兩條都不太舒服。 第一條,開一個新 session。乾淨是乾淨,但剛才那二十幾輪建立起來的上下文全沒了,你得重新跟它解釋一遍這個 repo 的慣例。更痛的是 prompt cache 從零開始重建——前面那段對話本來已經被快取住、每輪只算增量,現在等於把整本書重新影印一次,又慢又貴。 第二條,用 /add-dir 把 billing 加進來。但這個指令的本意不是「搬過去」,是「順便也讓我看得到那個資料夾」。你的 session 還釘在 auth,billing 的 CLAUDE.md 預設不會自動載入,--resume 之後也還是從 auth 找回來。它解的是「跨目錄讀檔」,不是「換工作目錄」。 繞了一圈會發現,你真正想要的那件事——「把這場對話原封不動搬到新目錄,ca...
AI 與科技新聞摘要 20260611
這幾天的消息有個很容易被忽略的共同點:沒有一條是「某個模型又變強了」。它們講的全是 AI 怎麼被接進你已經在用的東西——既有的雲端採購預算、既有的 IDE、既有的 VPN 閘道。模型強不強這場仗大致打完了,現在比的是誰能把自己塞進你已經繞不開的流程裡。這件事比多幾分 benchmark 危險得多,因為你一旦接上去,要拔就難了。 一、OpenAI 把模型塞進 Oracle 的採購單,企業用既有雲端額度就能買6 月 10 到 11 日,OpenAI 宣布跟 Oracle 合作:OCI(Oracle Cloud Infrastructure)的客戶,未來幾週內可以拿手上已經承諾的 Oracle Universal Credits,直接折抵 OpenAI 的前沿模型和 Codex。講白話,就是企業不用再為了用 AI 另外簽一份合約、走一遍採購流程,原本買 Oracle 雲端的預算直接挪過來用。 這一步聰明在它根本不碰技術,碰的是摩擦力。大公司導入 AI 最大的卡點從來不是模型不夠好,是法務、採購、資安要重新審一遍新供應商,這一審就是好幾個月。OpenAI 等於繞過這整關,直接站到企業早就...
VoxCPM 語音合成 — 繞了五年才有人說,別再把聲音剁成 Token 了
把時間倒回 2023 年初。那時候語音合成圈子最熱的東西叫 VALL-E,微軟丟出來的。它做了一件當時看起來理所當然的事:把一段聲音先壓成一串離散的 token,然後拿語言模型去預測下一個 token,就像 GPT 預測下一個字一樣。聲音被它當成另一種語言來處理。 這個想法太順了。語言模型那幾年正在橫掃一切,誰都想把自己的領域「翻譯」成 token 序列,這樣就能搭上那班車。於是 Bark 這麼做、ChatTTS 這麼做、阿里的 CosyVoice 也這麼做。差別只在 token 怎麼切、切幾層、解碼器長什麼樣。整個領域有志一同地往同一個方向走了好幾年。 VoxCPM 是清華 OpenBMB 團隊做的開源 TTS,最新版叫 VoxCPM2。它最值得停下來看一眼的地方,不是它支援 30 種語言、也不是 48kHz 的輸出,而是它在所有人都覺得理所當然的那一步上,按了暫停鍵:它不做離散化。 先搞懂大家到底在剁什麼「離散 token 化」聽起來很玄,拆開其實不難。 聲音本身是連續的——空氣壓力隨時間平滑變化的一條曲線。電腦存不下無窮多的點,所以要採樣。但採樣完還是一大堆浮點數,直接餵給...
Claude Code --safe-mode 完整教學 — 你的 AI 壞掉時,先把所有客製化關掉再說
先問你一個會決定要不要讀下去的問題:你的 Claude Code,是不是已經被你自己改到認不出來了? 裝了五六個 plugin、寫了一份越長越像憲法的 CLAUDE.md、掛了幾個 hook 在存檔時自動跑、接了三四個 MCP server。某天它開始怪怪的——一進 session 第一句話就莫名其妙切去 fallback 模型、某個指令行為跟昨天不一樣、或者就是慢得不正常。這時候你要回答的問題只有一個:這麼多客製化,到底是哪一個在搞鬼? 過去的答案很土法煉鋼:一個一個關掉,關一個試一次,看什麼時候恢復正常。Claude Code 在 6 月 8 日的 v2.1.169 加進來的 --safe-mode,就是來終結這個過程的。但這篇真正想講清楚的,是它「救得了」跟「救不了」的那條界線——因為搞錯這條線,你會對著一個它根本治不了的病猛灌它的藥。 它在做的事,就是醫生的「停藥觀察」想像你身體出了狀況,同時在吃五種保健食品、三種藥。醫生不會猜,他會請你全部停掉,看症狀還在不在。如果停光了就好了,問題出在某個你吃的東西,再一個一個加回來找兇手;如果全停了症狀還在,那代表病根本不在這些藥上...
AI 與科技新聞摘要 20260610
一個漏洞要嚴重到什麼程度,你才會願意半夜爬起來修?這週有好幾家公司被迫回答了這個問題,而且答得很狼狽。把這幾則新聞放在一起,會發現它們講的不是各自獨立的倒楣事,而是同一個正在加速的賽跑——找漏洞的速度和補漏洞的速度,雙方都被 AI 餵了興奮劑,差別只在誰先撐不住。 一、Veeam 備份伺服器爆 RCE,CVSS 9.4,網域內任何人都能打6 月 9 日,Veeam Backup & Replication 公開了一個編號 CVE-2026-44963 的漏洞,CVSS v4 評分 9.4。問題的嚴重性不在分數,在門檻:只要是「已驗證的網域使用者」——也就是公司內網裡任何一個有帳號的人——就能在備份伺服器上遠端執行程式碼。影響 12.3.2.4465 以前的所有 v12 版本,修補版 12.3.2.4854 同日釋出,13.x 因為架構改寫過不受影響。GitHub 上已經有人放出概念驗證程式碼。 備份伺服器是什麼地位的東西?它是你被勒索軟體打穿之後,最後一條退路。Akira、Fog、FIN7 這些勒索集團早就把 Veeam 當頭號目標,因為攻擊者最想做的事,就是先把你的備份...
Browser Harness — 用不到 600 行 Python 讓 AI Agent 接管你開著的 Chrome
讓 AI 操控瀏覽器這件事,過去一年的解法方向全錯了。 大家都在往「更完整」走:更多 action、更聰明的 retry、更嚴謹的 session manager、更漂亮的 tool schema。框架疊得越來越厚,號稱替你把每一種狀況都想好了。結果是,agent 能做的事,被它能呼叫的那幾個 action 框死;遇到框架沒設計過的網站怪癖,它就卡在那,因為它沒有權限自己長出新工具。 browser-use 團隊在 2026 年 4 月丟出來的 browser-harness,走的是完全相反的路。整個專案不到 600 行 Python,沒有 retry、沒有 session manager、沒有 action DSL。它只做一件事:把一條通往你 Chrome 的 CDP WebSocket 交到 agent 手上,剩下的——你想點哪、想抓什麼、遇到問題怎麼繞——agent 自己寫 Python 解決。 把廚房鑰匙交出去傳統 agent framework 像飯店的自助餐。廚師在後場把流程都準備好了:action registry、prompt template、tool sche...
Claude Code Fallback Models 完整教學 — 主模型過載時自動換一台繼續跑
先別急著問這功能能幹嘛。先看一個瞬間。 你掛了一個 background agent 在跑重構,自己跑去倒咖啡。就在你離開的那 30 秒,Anthropic 的 Opus 流量尖峰來了,你的請求撞上一個 529 overloaded 錯誤——伺服器在說「我現在忙不過來,等等」。過去,這一撞,你那個背景任務就直接死了,回來只看到一行紅字躺在那。 fallbackModel 這個 v2.1.166 加進來的設定,要處理的就是這 30 秒裡發生的事。但要真的搞懂它,最好的方式不是先聽它的功能清單,而是把那一瞬間慢動作拆開來看:當 529 回來的時候,Claude Code 心裡到底在跑什麼判斷。 把過載的那一刻拆成慢動作想像你打電話叫披薩,最常去那家店線路忙線。你有兩種人。一種會掛掉、坐在那生氣、等十分鐘再重撥同一個號碼。另一種手邊貼了一張紙條,上面照順序寫了三家店的電話——第一家忙線,立刻撥第二家。 沒設 fallback 的 Claude Code 是第一種人。請求撞上 529,它就停在那,要嘛報錯收場,要嘛傻等。設了 fallbackModel 之後,它變成第二種人:主模型回傳過...
AI 與科技新聞摘要 20260609
當一個東西同時被搶著請進門、又被防著請出門,通常代表它變得太重要,重要到所有人都開始計算「萬一哪天少了它會怎樣」。今天這幾則新聞,從蘋果的舞台到五角大廈的機密系統,表面上各講各的,底下其實在問同一個問題:當整個產業把脖子伸進同一組模型,這條脖子有多脆。 一、蘋果 WWDC:Siri 換上 Gemini,Claude 第一次成為 iPhone 的選項台灣時間週一深夜,Tim Cook 以執行長身分最後一次站上 Apple Park 的舞台,丟出的東西比往年都重:Siri 底層換成 Google 的 Gemini,同時推出一套「Multi-AI Extensions」機制,讓 Claude 第一次成為 iPhone 上可選的 AI;iOS 27 Beta 1 當天下午就放出來。Anthropic 那邊也補上一個 Swift 套件,讓 Apple 開發者能用帶型別的 Swift 輸出直接交棒給 Claude 做多步推理、程式生成、網頁搜尋。 蘋果一向是「軟硬整套自己掌控」的代表,現在卻把最貼身的語音入口外包給對手的模型,這個轉向本身就值得停一下。但更該注意的是那套 Multi-AI E...
AI Website Cloner — 把線上網站逆向重建成 Next.js 的 AI 協作管線
要把一個還在線上跑的網站搬到 Next.js,而原始碼已經不知道去哪了——這件事我以前的做法是這樣的:開瀏覽器,按 F12,把 DevTools 拉出來,對著每一個區塊一格一格量。這個按鈕的 padding 是多少、那段標題的 font-size 是 28px 還是 30px、hover 上去顏色變成哪個值、捲到一半那條 navbar 是怎麼黏住的。量完一頁,手已經痠了,而這還只是「抄外觀」——抄完還要自己用 React 重寫一遍。 一個中等複雜度的行銷網站,這樣搞兩三天跑不掉。而且抄到後面你會開始懷疑人生:我到底是在開發,還是在當人肉掃描器。 AI Website Cloner Template 這個 13,000 多顆星的開源模板,把同一件事換了一種做法。它的前提跟你我一樣——網站還在、原始碼沒了、想搬到乾淨的 Next.js。差別在於,量 CSS、抄結構、重寫元件這些事,它全部丟給 AI agent 去做。 以前是下載 HTML,現在是「看著重蓋」先講一個容易搞混的地方。傳統做法裡,如果你不想手動量,還有一招叫 wget 整站打包,把 HTML、CSS、圖檔全抓下來。但抓回...
Claude Code Statusline 完整教學 — 讓終端機底部長出一條儀表板
我同時開了四個終端機分頁,每個都跑著一個 Claude Code。一個在改後端、一個在跑測試、一個在弄部署腳本、還有一個我已經忘記在幹嘛。切過去切過來,每次都要先問自己「這個是哪個專案來著」,然後等它吐一段話我才從內容認出來。 更糟的是 context。我在某一個分頁裡聊得正起勁,完全沒注意到 context window 已經快滿了,直到它開始忘記前面講過的事、開始鬼打牆,我才意識到「啊它已經塞爆了」。等我發現的時候,已經浪費了好幾輪對話。 這兩個問題的共通點是:我需要的資訊一直都在,只是我看不到。 我先試了笨方法第一個念頭是手動。我在每個分頁開頭先 cd 到對的目錄、把專案名打在提示字元裡。撐了半天就放棄了——因為這些是靜態的,context 用到幾趴、這次 session 花了多少錢,這些會一直變的東西,手打根本跟不上。 第二個念頭是去翻 /cost 之類的指令,需要的時候手動敲一下查。問題是「需要的時候」永遠是「已經太遲的時候」。儀表這種東西的意義,就在於你不用主動去問它。你開車不會每隔幾分鐘輸入一個指令去查時速,時速就該一直在那。我要的不是一個查詢工具,是一條一直亮著的...









