系列精選
查看全部Claude Code Fork 完整教學 — 複製一份對話比開新分身更省錢的祕密
先別管 fork 能拿來幹嘛。 很多教學一上來就告訴你「fork 適合用在 XXX 場景」,然後你照做、有時有用、有時莫名其妙更貴,但你始終不知道為什麼。所以這篇反過來——我們先把 fork 收到任務後,第一件事在底層做了什麼拆開看。看懂那一步,它什麼時候該用、什麼時候比 subagent 便宜,你自己就推得出來,不用背。 那個底層的第一步,關鍵字只有一個:prompt cache。 先搞懂:模型每次回話,前面那一大段它怎麼處理你跟 Claude 對話時,每送出一則新訊息,模型實際收到的不是只有那一則。它收到的是「一整包」:最前面是固定的系統提示(system prompt)、接著是所有工具的定義(tool definitions),然後才是你們從頭到現在的完整對話歷史,最後接上你剛打的那句。 這一整包它每次都得重新讀一遍、算一遍,才能接話。問題是,這包的前半段——系統提示、工具定義、早期的對話——每一輪幾乎一模一樣。每次都重算,等於每次都把同一本書從第一頁朗讀到你問問題的那一頁,純粹浪費。 prompt cache 就是來解這個的。它把這包的「前綴」(prefix)算過的結果存...
AI 與科技新聞摘要 20260629
這禮拜值得記下來的新聞,沒有一條是「某個模型又變聰明了」。最強的模型發了,卻被政府攔在門口只放 20 家進場;另一個模型被指控遭人偷偷蒸餾了兩千多萬次;還有一個直接開源白送,順便把成本砍半。能力這條軸線好像突然不再是重點了,所有的張力都跑到了另一個地方。 一、GPT-5.6 Sol 發表,但你大概還用不到——它得先過政府那關OpenAI 在 6/26 發表了新一代模型家族 GPT-5.6,分成三個能力層:旗艦 Sol、平衡的 Terra、低成本的 Luna。命名規則也換了——數字代表世代,Sol/Terra/Luna 代表能力層級,各自能用不同節奏進化,等於把以前 mini、nano 那套混亂的命名收乾淨。Sol 在 Terminal-Bench 2.1 這種命令列工作流的測試上創了新高,還加了「max 推理強度」和會自己派子代理的 ultra 模式。定價 Sol 是每百萬 token 輸入 5 美元、輸出 30 美元。 聽起來是場標準的旗艦發表。真正的新聞在後半段:GPT-5.6 是限定預覽,初期只開放約 20 家公司,而且這些公司的參與資格是政府核准的。這要追到 6...
skills — 你的 AI 技能換一個 agent 就得重裝,有人把它做成了 npm
你在 Claude Code 裡寫了一個 skill,把團隊的 PR 規範、commit 慣例、release notes 格式全包進去。用得很順。隔天你開 Cursor 想做同一件事,發現它不在了——skill 躺在 .claude/skills/,Cursor 根本不看那個目錄。 於是你手動複製一份到 Cursor 的目錄。過兩天 Codex 也想用,再複製一份。然後 skill 改了一版,你得回頭把三個地方各更新一次,還很容易漏掉其中一個。再然後新同事加進來,問你「這個 skill 要怎麼裝」,你開始懷疑自己是不是該寫一份安裝說明。 這整條路我走過,每一步都不難,但加起來就是一堆瑣碎到讓人不想做的搬運工。問題的形狀其實很清楚:skill 本身是可攜的,可攜的東西卻沒有一個負責搬運的工具。 試過的兩條死路第一條是手動複製。能動,但你等於把自己變成人肉同步器。三個 agent、五個專案、十個 skill,排列組合一拉開,維護成本就爆了。而且 symlink、相對路徑、版本號這些細節,手動做遲早出錯。 第二條是「那我把 skill 寫進每個工具各自的設定」。聽起來乾淨,實際上更糟...
外送又要漲了 — 工程師三餐該外送、外食還是自煮的一套判準
你叫一份 180 塊的便當外送,那間店實際拿到手的,可能只剩 120。 中間那 60 塊去哪了?平台抽走了。台灣主流外送平台對店家的抽成,平均落在每單 30% 到 35%,這還沒算上架費、每月使用費、買曝光的廣告費。店家不是慈善機構,這些成本最後一定會反映在菜單價格上——所以你在外送 App 上看到的那份便當,本來就比你走進店裡點貴了一截。你以為外送費只是那筆「運費 39 元」,其實餐點本身早就被偷偷加了價。 而這筆帳,7 月之後還要更貴。 先搞懂這次到底漲什麼台灣的「外送專法」7 月正式上路。趕在新法之前,Uber Eats 先開了第一槍:7 月 21 日起調漲對商家的服務費,美食類漲 2.5 個百分點、生鮮雜貨漲 3 個百分點,設了個 35% 的上限。foodpanda 暫時按兵不動,說還在「審慎評估」——但業界普遍認為,這只是時間問題。 表面上漲的是「商家服務費」,跟你這個消費者好像沒關係。別天真。商家的成本一往上加,最後幾乎都會傳導到你點的那份餐上,差別只在多快、多明顯。 更有感的是另一件事:疊單。你可能沒注意過,平台把順路的訂單併在一起送(疊單),根據內政部統計,這個機...
FunASR — 中文語音辨識,以前要拼四個工具,現在一行 API 全包
想在自己的 Mac 上,把一段三小時的會議錄音變成一份能直接讀的逐字稿,過去你得先當一次系統整合商。 先抓 OpenAI 的 Whisper 來轉文字。轉完一看,中文的字錯率大概 5%,每隔幾句就要回去校一個同音字;而且它吐出來的是一坨沒有標點的長文,得再接一個標點恢復模型把句子斷開。逐字稿要標「誰在講話」,Whisper 不管這件事,你還得另外裝 pyannote 做說話人分離。錄音有三小時這麼長,丟整段進去會爆記憶體,所以前面還得先放一個 VAD 把沒人講話的空白段切掉。 四五個工具,四五種輸入輸出格式,你花在「把它們縫成一條線」的時間,比花在辨識本身還多。這才是中文語音辨識真正惱人的地方——不是哪個模型不夠強,是沒有人把這條線幫你接好。 pip install funasr。這一行,就是來把上面那整段流程收掉的。 一個容器,不是一個模型FunASR 是阿里巴巴達摩院開源的語音辨識工具包,GitHub 上 15K 顆星,程式碼走 MIT 授權。它最該先理解的一點是:它不是「又一個語音模型」,而是一個容器。 裡面裝了一整排各司其職的模型——Paraformer 負責辨識、Sen...
AI 與科技新聞摘要 2026.06.28
這禮拜值得記的新聞,沒有一條是「某個模型又變強了」。真正在動的,是一批大家以為早就焊死了的優勢——晶片的壟斷、市佔的霸主、人才的金庫——在同一個禮拜裡,一起開始鬆動。 護城河這個詞,被講得好像是一條挖好了就永遠在那裡的溝。這禮拜的幾條新聞放在一起,提醒你一件相反的事:護城河是水做的,水會被引到別的地方去。 一、高通出價百億美元,想買下 NVIDIA 看不到的那塊死角第一條,是有人準備從 NVIDIA 的盲區切進去。據《The Information》與路透 6 月 15 日的報導,高通正在深度洽談,要以 80 到 100 億美元收購 Tenstorrent——晶片界傳奇架構師 Jim Keller 帶領的 RISC-V AI 晶片新創。到 6 月 24 日高通的投資人日,這筆交易仍未獲證實,但同一天高通透露,年底前就會開始向一家大型雲端業者出貨自研晶片。 值得停下來看的是價格。一年前,Tenstorrent 募資時的估值還是 32 億美元;現在開價衝到 100 億,一年跳了快三倍。這個數字撐起來的不是它的營收——它的營收還很小——撐起來的是「稀缺性」。在一個 NVIDIA 自研晶...
工程師久坐不是腰痠而已 — 身體在你坐著時偷偷關掉了什麼
先別管要不要去辦健身房。先問一個更基本的問題:你坐著寫 code 的那幾個小時,身體裡到底發生了什麼? 大部分人對久坐的理解停在「腰會痠、肩會硬」。那只是你感覺得到的部分。真正麻煩的東西,是你完全感覺不到、卻在背景默默累積的那些。把這台機器打開來看一遍,你會對「怎麼動才有用」這件事有完全不同的想法。 久坐的第一件事:身體進入待機降頻MacBook 偵測到你閒置,會自動降頻、調暗螢幕、把風扇轉慢。它不是壞了,是「以為你不需要那麼多火力」,主動把供能調低。 人體坐久了,幹的是一模一樣的事。長時間沒有肌肉收縮,血液循環會慢下來、變得濃稠,身體判斷「這傢伙現在不太需要能量」,於是進入一種節能模式:送到大腦的氧氣和血糖效率都降低。這就是為什麼你坐了兩三個小時之後,會開始頭昏腦脹、思緒卡關、盯著同一行 code 看半天看不進去。那不是你不夠專心,是你的硬體被降頻了。 對工程師來說這特別諷刺。我們靠腦袋吃飯,卻用一種會讓腦袋供能變差的姿勢,一坐就是一整天。 第二件事:你的身體偷偷對胰島素變遲鈍降頻只是當下的事,下面這件是會累積的。 身體細胞要把血糖收進去用,靠的是胰島素發信號。肌肉是吃血糖的大...
AI 與科技新聞摘要 2026.06.27
如果「用掉多少 token」一度是團隊生產力的勳章,那當這個勳章開始變成財報上的麻煩,最先慌的會是誰? 這週值得記的新聞,沒有一條是「某個模型又變強了」。真正在動的,是大家對「該用多少 AI」這件事的信仰。 一、tokenmaxxing 退潮:燒最多 token 曾是榮譽,現在是失控過去一年有個詞悄悄流行,叫 tokenmaxxing——員工被鼓勵盡可能多用 AI,不管產出有沒有用,把 token 消耗量當成生產力的代名詞。Meta 和 Amazon 內部甚至有排行榜,比誰燒得多。Uber 的 COO 五月公開講了重話:token 用量的成長,跟產品真的變好之間,「那條線還不存在」。 數字開始打臉這套信仰。Uber 對部分 AI 工具設了每月 1,500 美元起跳的分級額度,因為它的 CTO 四月承認,整年的 AI 預算在四個月內就燒光了。企業數據平台 Entelligence.AI 彙整 2,444 家公司的資料,算出來每花 1 美元在 token 上,真正觸及終端使用者的價值只有 0.18 美元。 最戲劇性的是新創 Lindy。它的 CEO 這個月把公司 100% 的流量從 ...
Huashu Design — AI 設計醜得像複製貼上,問題從來不在模型不夠聰明
AI 設計做出來的東西很醜,但醜的原因不是它笨。 你大概看過這個畫面。叫 AI 設計一個 App,它回你紫色漸變的背景、幾個 emoji 當 icon、圓角卡片再配一條彩色的左邊框。乾淨、能看,但沒有一個真的品牌會把這種東西放上線。設計圈給它取了名字,叫 AI slop——AI 量產出來的視覺垃圾。 直覺的歸因是「模型品味差」。可是同一個模型,你叫它寫一段並發處理的程式碼,它能寫得有模有樣;你叫它幫你 debug 一個 race condition,它能講出個道理。寫程式的時候它一點都不笨,換到設計就崩。同一顆腦袋,差別到底在哪? 差別在於:寫程式有大量明文規則,設計沒有。 醜不是審美問題,是規則缺席問題一個資深設計師看到「紫漸變加 emoji 圖示」會皺眉,但你問他為什麼不行,他多半只會說「就是不對」「沒質感」。這就是麻煩的地方——設計師的判斷力大多是隱性知識,存在他的手感裡,沒有被寫成一條條可以照做的規則。模型學不到沒被寫下來的東西。它看過的訓練資料裡,紫漸變加 emoji 出現了一百萬次,那它當然覺得這就是「設計」。 把這件事想透,AI slop 就不是模型缺陷,是知識缺陷...
Claude Code Sandbox 完整教學 — 讓 AI 自己跑指令,又不用怕它 rm 到不該動的地方
Claude Code 用起來最磨人的那個瞬間,是它每跑一個 npm test、每 mkdir 一個資料夾,都要停下來問你一次 yes or no。一個任務跑下來,光是按 Enter 確認就按到手痠,那個「自己幫我把事情做完」的爽感,全被這些彈窗切碎了。 於是你一氣之下,開了 --dangerously-skip-permissions。世界瞬間清靜,它再也不問了,咻咻咻把事情做完。爽是爽,但你心裡有個聲音一直沒消失:它現在等於拿到了你整台電腦的全部權限。哪天它為了「清一下快取」,rm -rf 到一個你完全不想它碰的目錄,或者哪個被它裝下來的套件偷偷把你 ~/.ssh 裡的金鑰往外送,你連攔都沒得攔。 一邊是煩到不想用,一邊是怕到不敢放手。大部分人就在這兩個極端之間反覆橫跳。Claude Code 的 Sandbox(沙箱化 Bash 工具) 想給的,是中間那條一直缺的路。 先搞懂它跟「按 yes/no」根本不是同一回事要看懂 sandbox 為什麼能同時解掉「煩」跟「怕」,得先分清楚兩種完全不同的安全做法。 「每次問你 yes/no」這套,本質是事前審查:在...









