系列精選
查看全部Claude Code 背景子代理完整教學 — 開一個 subagent 不再卡死整個對話
你叫 Claude 開一個 subagent 去跑整套測試,心想趁這空檔先去改另一個檔案——結果游標卡住了。你打字沒反應,整個對話凍在那裡,畫面上就一行「subagent running…」。測試跑三分鐘,你就盯著螢幕乾等三分鐘。 這個情境每個重度用 subagent 的人都遇過。而它有解,解法叫「背景執行」。這篇就從這個卡死的現場講起,把它怎麼解、解到什麼程度、又得付出什麼代價,一次說完。 先搞懂:為什麼開一個 subagent 會把你整個卡住要解這個問題,得先知道它為什麼會發生。 預設情況下,Claude Code 開出來的 subagent 是「前景」執行的。前景的意思是——它佔住了你跟主對話之間那條唯一的通道。subagent 在忙的時候,主對話被擋住,你送不了新訊息,因為那條線正被它佔線。 打個比方。你是辦公室主管,手下有個實習生。你叫他去檔案室找一份三年前的合約,然後你做了一件有點蠢的事:你跟著走到檔案室門口,站在那裡,什麼都不做,等他翻箱倒櫃找出來。他找十分鐘,你就在門口站十分鐘。這就是前景 subagent——你明明可以回座位繼續做自己的事,卻選擇站在門口等。 問...
AI 與科技新聞摘要 2026/06/30 — 開放與封閉,這禮拜偷偷換了位置
「開源」這兩個字,這禮拜到底站在哪一邊? 如果你三年前問這個問題,答案很清楚:開放的是 Meta、是新創、是想挑戰大公司的那群人;封閉的是握著最強模型不放的巨頭。這禮拜的新聞,幾乎是把這張地圖整個翻了過來——當年扛開源大旗的轉身關門,被當成追趕者的反而接過旗子,而你天天在用的工具,有的連名字都換掉了。一條一條看,會發現它們其實在問你同一件事。 一、開源旗手 Meta,悄悄把門關上了最反直覺的一條,來自最不該發生的地方。Meta 推出了 Muse Spark,這是 Meta Superintelligence Labs 的第一個對外發布——而它是閉源的。 這件事的份量,得放回脈絡才看得出來。過去兩年,「開源 LLM」這個詞幾乎跟 Llama 是同義詞,Meta 靠著開放權重,把自己塑造成對抗 OpenAI、Anthropic 的那一方,整個開源社群都建在 Llama 的地基上。現在第一個新品牌的旗艦,直接選了關門。產業媒體把這解讀成一次明確的轉向——不是這一代剛好閉源,是策略層級的調頭。 為什麼值得記?因為它戳破了一個很多人沒意識到的假設:你以為某家公司「開源」是它的本性,其實那只...
Notion MCP 接 Claude Code — 官方那個 OAuth 外掛,反而是最不該用的接法
想把 Claude Code 接上 Notion,第一個該做的決定,是跳過 Notion 官方那個 OAuth 外掛。 這句話聽起來不太對。官方推薦的、長得最正規的、會自動幫你管 token 的那個接法,怎麼會是最不該選的?但你真的去接一次就知道了——那條看起來最體面的路,會在三個不同的地方斷給你看,而旁邊那條土到不行、要你自己去後台複製一串鑰匙的路,三步就接上,而且接上之後再也不掉線。 這篇就是要講為什麼。順便把接上之後你還會踩的幾個坑,一次說完。 那個體面的接法,是怎麼一步步斷掉的先還原現場。你照官方文件走,用 OAuth 外掛(plugin:Notion:notion)連,瀏覽器跳出來叫你授權,你按下「允許」——然後第一個東西就炸了: Internal Server Error。Notion 的 OAuth 回呼在這一步直接掛掉,連錯誤訊息都懶得給你細節。 你想說可能是一時的,重試。這次走得遠一點,到了 token 交換階段,跳出來的是 MCP OAuth requires a redirect_uri (invalid_grant)。翻成人話:拿授權碼去換正式 token...
Claude Code Fork 完整教學 — 複製一份對話比開新分身更省錢的祕密
先別管 fork 能拿來幹嘛。 很多教學一上來就告訴你「fork 適合用在 XXX 場景」,然後你照做、有時有用、有時莫名其妙更貴,但你始終不知道為什麼。所以這篇反過來——我們先把 fork 收到任務後,第一件事在底層做了什麼拆開看。看懂那一步,它什麼時候該用、什麼時候比 subagent 便宜,你自己就推得出來,不用背。 那個底層的第一步,關鍵字只有一個:prompt cache。 先搞懂:模型每次回話,前面那一大段它怎麼處理你跟 Claude 對話時,每送出一則新訊息,模型實際收到的不是只有那一則。它收到的是「一整包」:最前面是固定的系統提示(system prompt)、接著是所有工具的定義(tool definitions),然後才是你們從頭到現在的完整對話歷史,最後接上你剛打的那句。 這一整包它每次都得重新讀一遍、算一遍,才能接話。問題是,這包的前半段——系統提示、工具定義、早期的對話——每一輪幾乎一模一樣。每次都重算,等於每次都把同一本書從第一頁朗讀到你問問題的那一頁,純粹浪費。 prompt cache 就是來解這個的。它把這包的「前綴」(prefix)算過的結果存...
AI 與科技新聞摘要 20260629
這禮拜值得記下來的新聞,沒有一條是「某個模型又變聰明了」。最強的模型發了,卻被政府攔在門口只放 20 家進場;另一個模型被指控遭人偷偷蒸餾了兩千多萬次;還有一個直接開源白送,順便把成本砍半。能力這條軸線好像突然不再是重點了,所有的張力都跑到了另一個地方。 一、GPT-5.6 Sol 發表,但你大概還用不到——它得先過政府那關OpenAI 在 6/26 發表了新一代模型家族 GPT-5.6,分成三個能力層:旗艦 Sol、平衡的 Terra、低成本的 Luna。命名規則也換了——數字代表世代,Sol/Terra/Luna 代表能力層級,各自能用不同節奏進化,等於把以前 mini、nano 那套混亂的命名收乾淨。Sol 在 Terminal-Bench 2.1 這種命令列工作流的測試上創了新高,還加了「max 推理強度」和會自己派子代理的 ultra 模式。定價 Sol 是每百萬 token 輸入 5 美元、輸出 30 美元。 聽起來是場標準的旗艦發表。真正的新聞在後半段:GPT-5.6 是限定預覽,初期只開放約 20 家公司,而且這些公司的參與資格是政府核准的。這要追到 6...
skills — 你的 AI 技能換一個 agent 就得重裝,有人把它做成了 npm
你在 Claude Code 裡寫了一個 skill,把團隊的 PR 規範、commit 慣例、release notes 格式全包進去。用得很順。隔天你開 Cursor 想做同一件事,發現它不在了——skill 躺在 .claude/skills/,Cursor 根本不看那個目錄。 於是你手動複製一份到 Cursor 的目錄。過兩天 Codex 也想用,再複製一份。然後 skill 改了一版,你得回頭把三個地方各更新一次,還很容易漏掉其中一個。再然後新同事加進來,問你「這個 skill 要怎麼裝」,你開始懷疑自己是不是該寫一份安裝說明。 這整條路我走過,每一步都不難,但加起來就是一堆瑣碎到讓人不想做的搬運工。問題的形狀其實很清楚:skill 本身是可攜的,可攜的東西卻沒有一個負責搬運的工具。 試過的兩條死路第一條是手動複製。能動,但你等於把自己變成人肉同步器。三個 agent、五個專案、十個 skill,排列組合一拉開,維護成本就爆了。而且 symlink、相對路徑、版本號這些細節,手動做遲早出錯。 第二條是「那我把 skill 寫進每個工具各自的設定」。聽起來乾淨,實際上更糟...
外送又要漲了 — 工程師三餐該外送、外食還是自煮的一套判準
你叫一份 180 塊的便當外送,那間店實際拿到手的,可能只剩 120。 中間那 60 塊去哪了?平台抽走了。台灣主流外送平台對店家的抽成,平均落在每單 30% 到 35%,這還沒算上架費、每月使用費、買曝光的廣告費。店家不是慈善機構,這些成本最後一定會反映在菜單價格上——所以你在外送 App 上看到的那份便當,本來就比你走進店裡點貴了一截。你以為外送費只是那筆「運費 39 元」,其實餐點本身早就被偷偷加了價。 而這筆帳,7 月之後還要更貴。 先搞懂這次到底漲什麼台灣的「外送專法」7 月正式上路。趕在新法之前,Uber Eats 先開了第一槍:7 月 21 日起調漲對商家的服務費,美食類漲 2.5 個百分點、生鮮雜貨漲 3 個百分點,設了個 35% 的上限。foodpanda 暫時按兵不動,說還在「審慎評估」——但業界普遍認為,這只是時間問題。 表面上漲的是「商家服務費」,跟你這個消費者好像沒關係。別天真。商家的成本一往上加,最後幾乎都會傳導到你點的那份餐上,差別只在多快、多明顯。 更有感的是另一件事:疊單。你可能沒注意過,平台把順路的訂單併在一起送(疊單),根據內政部統計,這個機...
FunASR — 中文語音辨識,以前要拼四個工具,現在一行 API 全包
想在自己的 Mac 上,把一段三小時的會議錄音變成一份能直接讀的逐字稿,過去你得先當一次系統整合商。 先抓 OpenAI 的 Whisper 來轉文字。轉完一看,中文的字錯率大概 5%,每隔幾句就要回去校一個同音字;而且它吐出來的是一坨沒有標點的長文,得再接一個標點恢復模型把句子斷開。逐字稿要標「誰在講話」,Whisper 不管這件事,你還得另外裝 pyannote 做說話人分離。錄音有三小時這麼長,丟整段進去會爆記憶體,所以前面還得先放一個 VAD 把沒人講話的空白段切掉。 四五個工具,四五種輸入輸出格式,你花在「把它們縫成一條線」的時間,比花在辨識本身還多。這才是中文語音辨識真正惱人的地方——不是哪個模型不夠強,是沒有人把這條線幫你接好。 pip install funasr。這一行,就是來把上面那整段流程收掉的。 一個容器,不是一個模型FunASR 是阿里巴巴達摩院開源的語音辨識工具包,GitHub 上 15K 顆星,程式碼走 MIT 授權。它最該先理解的一點是:它不是「又一個語音模型」,而是一個容器。 裡面裝了一整排各司其職的模型——Paraformer 負責辨識、Sen...
AI 與科技新聞摘要 2026.06.28
這禮拜值得記的新聞,沒有一條是「某個模型又變強了」。真正在動的,是一批大家以為早就焊死了的優勢——晶片的壟斷、市佔的霸主、人才的金庫——在同一個禮拜裡,一起開始鬆動。 護城河這個詞,被講得好像是一條挖好了就永遠在那裡的溝。這禮拜的幾條新聞放在一起,提醒你一件相反的事:護城河是水做的,水會被引到別的地方去。 一、高通出價百億美元,想買下 NVIDIA 看不到的那塊死角第一條,是有人準備從 NVIDIA 的盲區切進去。據《The Information》與路透 6 月 15 日的報導,高通正在深度洽談,要以 80 到 100 億美元收購 Tenstorrent——晶片界傳奇架構師 Jim Keller 帶領的 RISC-V AI 晶片新創。到 6 月 24 日高通的投資人日,這筆交易仍未獲證實,但同一天高通透露,年底前就會開始向一家大型雲端業者出貨自研晶片。 值得停下來看的是價格。一年前,Tenstorrent 募資時的估值還是 32 億美元;現在開價衝到 100 億,一年跳了快三倍。這個數字撐起來的不是它的營收——它的營收還很小——撐起來的是「稀缺性」。在一個 NVIDIA 自研晶...
工程師久坐不是腰痠而已 — 身體在你坐著時偷偷關掉了什麼
先別管要不要去辦健身房。先問一個更基本的問題:你坐著寫 code 的那幾個小時,身體裡到底發生了什麼? 大部分人對久坐的理解停在「腰會痠、肩會硬」。那只是你感覺得到的部分。真正麻煩的東西,是你完全感覺不到、卻在背景默默累積的那些。把這台機器打開來看一遍,你會對「怎麼動才有用」這件事有完全不同的想法。 久坐的第一件事:身體進入待機降頻MacBook 偵測到你閒置,會自動降頻、調暗螢幕、把風扇轉慢。它不是壞了,是「以為你不需要那麼多火力」,主動把供能調低。 人體坐久了,幹的是一模一樣的事。長時間沒有肌肉收縮,血液循環會慢下來、變得濃稠,身體判斷「這傢伙現在不太需要能量」,於是進入一種節能模式:送到大腦的氧氣和血糖效率都降低。這就是為什麼你坐了兩三個小時之後,會開始頭昏腦脹、思緒卡關、盯著同一行 code 看半天看不進去。那不是你不夠專心,是你的硬體被降頻了。 對工程師來說這特別諷刺。我們靠腦袋吃飯,卻用一種會讓腦袋供能變差的姿勢,一坐就是一整天。 第二件事:你的身體偷偷對胰島素變遲鈍降頻只是當下的事,下面這件是會累積的。 身體細胞要把血糖收進去用,靠的是胰島素發信號。肌肉是吃血糖的大...









