系列精選
查看全部Claude Code Sandbox 完整教學 — 讓 AI 自己跑指令,又不用怕它 rm 到不該動的地方
Claude Code 用起來最磨人的那個瞬間,是它每跑一個 npm test、每 mkdir 一個資料夾,都要停下來問你一次 yes or no。一個任務跑下來,光是按 Enter 確認就按到手痠,那個「自己幫我把事情做完」的爽感,全被這些彈窗切碎了。 於是你一氣之下,開了 --dangerously-skip-permissions。世界瞬間清靜,它再也不問了,咻咻咻把事情做完。爽是爽,但你心裡有個聲音一直沒消失:它現在等於拿到了你整台電腦的全部權限。哪天它為了「清一下快取」,rm -rf 到一個你完全不想它碰的目錄,或者哪個被它裝下來的套件偷偷把你 ~/.ssh 裡的金鑰往外送,你連攔都沒得攔。 一邊是煩到不想用,一邊是怕到不敢放手。大部分人就在這兩個極端之間反覆橫跳。Claude Code 的 Sandbox(沙箱化 Bash 工具) 想給的,是中間那條一直缺的路。 先搞懂它跟「按 yes/no」根本不是同一回事要看懂 sandbox 為什麼能同時解掉「煩」跟「怕」,得先分清楚兩種完全不同的安全做法。 「每次問你 yes/no」這套,本質是事前審查:在...
AI 與科技新聞摘要 20260626
6 月 18 號那天,有人在終端機裡敲了一行用了一年的 gemini 指令,回他的不是結果,是一句通知:這個 CLI 已經停止服務,請改用 Antigravity CLI。一個你天天靠它幹活的工具,沒有壞、沒有出 bug,就這樣被它自己的母公司收掉了。 把這禮拜的幾條新聞排開來看,會發現它們其實是同一個動作的不同版本——大的,正在把小的、把工具、把晶片、甚至把自己的命運,一個個收進更大的盤子裡。整併這件事報導起來總是很風光,講的是規模、是版圖、是誰又更強了。但站在使用者這一邊,每一次收編,抽走的都是你手上原本還有的一個選項。 一、Google 把自家的 Gemini CLI 退役,逼你搬到 Antigravity故事得從 5 月講起。Google 在 I/O 大會推出了 Antigravity 2.0,一套主打多代理協作的開發套件,裡頭有個用 Go 重寫的 Antigravity CLI。當時大家以為它是「多一個選擇」。結果到了 6 月 18 日,答案揭曉:Gemini CLI 直接停止服務,它的功能被 Antigravity CLI 整碗吸收進去,原本建在 Gemin...
video-use — 剪一支片,從在時間軸上拖三小時退化成講一句話
剪片這件事,工具換了一代又一代,可是你坐在電腦前要做的那個動作,二十年來幾乎沒變過:在一條時間軸上,把素材拖來拖去。 Premiere、Final Cut、DaVinci Resolve,介面一個比一個漂亮,軌道一個比一個多。但核心互動還是那一套——你用滑鼠,一刀一刀,在時間軸上對齊、裁切、疊加、調色。學會它要花多久?去問任何一個幫朋友剪過婚禮影片的人就知道,那個單位是「週」,不是「小時」。剪輯軟體真正的門檻,從來不是買不買得起,是那條時間軸本身就是一門要練的手藝。 第一次鬆動:把影片變成一篇可以刪字的稿子真正動搖這件事的,是 Descript。 它做了一件當年看起來有點怪的事:把你的影片先轉成逐字稿,然後讓你「編輯文字」。你在稿子裡刪掉一句講壞的話,對應的那段影片就跟著被剪掉了;你把兩段話的順序對調,畫面也跟著重排。剪片第一次不再是拖時間軸,而是改一篇 Word 文件。 這一步的聰明,在於它找對了影片裡「資訊密度最高」的那層東西。一段 talking head 影片,畫面其實沒什麼變化——一個人坐在那裡講話,背景、光線、構圖整段都差不多。真正承載「這支片在講什麼」的,是聲音轉出...
Claude for Foundation Models 完整教學 — 同一段 Swift,今天跑裝置端小模型,明天換 Claude 只改一行
先別急著問它能拿來做什麼。先看一件乍看不合理的事:Apple 自己的 AI 框架,居然能拿來跑 Anthropic 的 Claude。 兩家公司、兩套東西,照理說井水不犯河水。可是 WWDC 2026 之後,你在 iOS app 裡寫的那段呼叫 AI 的程式碼——本來是驅動 Apple 裝置上那顆小模型的——只要改一行,底層跑的就變成 Claude,而且 respond(to:)、streaming、工具呼叫,整套用法一個字都不用改。這怎麼可能? 搞懂這個「怎麼可能」,比記住怎麼裝套件有用一百倍。因為它背後那招,根本不是 iOS 專屬的魔法,是一個你寫任何系統都用得上的老智慧。 先看它收到一個請求之後,第一件事去問誰把框架打開,最核心的一個東西叫 LanguageModelSession。你跟 AI 講話,都是透過它: 123let session = LanguageModelSession(model: someModel)let response = try await session.respond(to: "幫我想一個送科幻迷的禮物")print(r...
AI 與科技新聞摘要 20260625
模型又快了幾趴、benchmark 又被誰刷新——這種新聞每週都有,看久了會麻痺。這禮拜真正值得停下來的,是另一條更安靜、也更難回頭的線:當所有人的模型能力都逼近天花板,戰場就不再是「誰更聰明」,而是「這份聰明到底歸誰」。能力可以被偷、算力可以被斷、組織的知識可以長在別人的伺服器裡。把這禮拜幾條排開來看,主角全是這件事。 一、Anthropic 直接點名阿里巴巴:史上最大規模的「偷能力」行動6 月 24 日這條新聞的份量,遠超過一般的公司互槓。Anthropic 寫了一封信給美國參議院銀行委員會,指控與阿里巴巴 Qwen 實驗室有關的操作者,在 4 月 22 日到 6 月 5 日之間,用大約 25,000 個假帳號,對 Claude 發動了 2,880 萬次的對話交換——目標很精準,全衝著 Claude 最值錢的兩項能力去:軟體工程跟 agentic 推理。 這在業界叫「蒸餾」(distillation):你不用自己訓練一個頂級模型,只要不停餵問題給對手的模型、把它的回答收集起來,拿這些回答去訓練一個便宜很多的山寨版,就能逼近原版的能力。Anthropic 今年 2 月才抓過 D...
Hermes Agent — 你要的是一塊 AI 積木,還是一個會學習的常駐助理
先問你一個問題,答案會決定下面這篇你要不要看完:你想要的,到底是一套可以自己拼出 agent 的零件,還是一個開機就能用、而且會記住你的助理? 這兩個聽起來很像,其實差了一整個層級。大部分人卡住的點不是「哪個工具比較強」,是根本沒分清楚自己要的是哪一種,於是抱著 LangChain 的文件啃了三天,才發現自己想要的東西它本來就不打算給你。 Hermes Agent 就是站在另一邊那個答案。Nous Research 在 2025 年底開源它,口號是「The agent that grows with you」,七週內衝破 11 萬顆 GitHub 星,成長曲線比當年的 LangChain、AutoGen 都陡。但星星數不是重點,重點是它選了一條跟那些框架完全相反的路。 積木和電器的差別你用過 LangChain 或 AutoGen 的話,會知道那是一種「嵌進你 Python 程式裡的函式庫」。你得自己寫 code 把 agent 串起來,每跑一次都從零開始,沒有記憶、不會學習,想接到 Telegram 或 Discord 還得自己刻整合層。它給你的是積木,怎麼拼、拼成什麼,全是你...
Claude Code 你的 command 其實已經變成 skill 了 — 統一指令模型完整教學
以前你想在 Claude Code 裡自訂一個 /指令,做法很單純:在 .claude/commands/ 底下丟一個 markdown 檔,寫好你要它做的事,存檔,下次打 /那個檔名 就會跑。很多人——包括我——的 .claude/commands/ 裡都躺著一疊這種小抄:/commit、/review、/standup,各自包一段你懶得每次重打的 prompt。 現在你打開官方文件想找 commands 那一頁,會發現它不見了。不是被砍掉,是被併進了另一個東西——Skill。官方很明確地講了這句話:commands 跟 skills 現在是同一個東西了。你舊有的那些自訂指令,沒有消失,它們全都「變成」skill 了。 這個合併乍看只是改名換湯,但搞懂它為什麼要合併,比記住新語法有用得多。 先用一個比方說清楚差在哪把 Claude 的工作空間想成你的辦公桌。 舊的 command,像是你貼在螢幕邊框上的便利貼。它有個好處:隨時看得到,伸手就用。但壞處是——不管你今天用不用得到,它都一直黏在那裡佔著視線。十張便利貼貼上去,螢幕邊框就被塞滿了,每一張都在分掉你(其實是分掉 Clau...
AI 與科技新聞摘要 20260624
過去這幾天,幾家 AI 工具不約而同動了同一個地方——不是功能,是帳單。 能力線還是照常往上爬,誰家又快了幾趴、benchmark 又刷新了,這種新聞每週都有。但真正值得停下來看的,是另一條更安靜的線:你用這些工具到底要付多少錢、錢怎麼算、以及這些錢一路往上游流,最後押在了誰身上。把這禮拜的幾條排開來,主角全是「錢」。而錢的事,往往比功能的事更早決定你明年還用不用得起手上這套工具。 一、GitHub Copilot 改成用量計費,用戶在吵「幾個 prompt 就燒光了」從 6 月 1 日起,GitHub Copilot 全面轉成用量計費(usage-based billing)。每個付費方案改成附一筆月度的 AI Credit 額度——Pro 方案 10 美元、Pro+ 39 美元——超過就按各模型的 token 費率往下扣,連 Copilot 幫你 review code 都要額外吃掉 GitHub Actions 的分鐘數。同時官方準備收掉年費方案,社群討論區一片哀號,不少人反映那點月額度「跑幾個比較重的 prompt 就見底了」。 數字上 Copilot 還是巨無霸——超過...
nuwa-skill — 別叫 AI 扮演高手,讓它學會高手是怎麼想的
想讓 AI 給你高手等級的建議,最沒效的一招,就是叫它「扮演一個高手」。 你大概都試過。在 system prompt 裡塞一句「你是查理·蒙格,請用他的智慧回答」,然後問它一筆投資該不該做。它回你一段四平八穩的話,提到護城河、提到能力圈、引了兩句聽起來很蒙格的格言。讀起來很像那麼回事,但你再追問一句「那如果這家公司的護城河正在被 AI 侵蝕呢」,它就露餡了——它只會把剛剛那幾個詞換個順序再講一遍。它記得這個人講過什麼,但完全不知道這個人遇到新問題時會怎麼想。 這就是模仿語氣跟移植思考的差別。而 nuwa-skill(女媧.skill)這個 Claude Code Skill,整個設計就是衝著後者去的。 它提取的不是金句,是「決策的骨架」先把這件事講清楚,因為它是整個工具的地基。 一般的角色扮演,提取的是表層:語氣、口頭禪、招牌名言。這些東西在網路上一抓一大把,AI 學起來毫不費力,但也毫無用處——因為名言是結論,不是推導過程。你拿到結論卻拿不到那條導向結論的路,下次換個題目,你就接不上了。 女媧提取的是推導過程本身。同樣問「蒙格怎麼看這個投資」,它不會直接吐護城河三個字,而是先...
教 Claude 守規矩的七種方法 — 把指令放對地方,比寫得漂亮更重要
你寫了一條規矩想叫 Claude 遵守——比方說「改完程式碼一定要跑 lint」。問題來了:這句話到底該寫在哪? 寫進 CLAUDE.md?做成一個 skill?還是設一個 hook?大部分人卡住的地方不是「指令寫得好不好」,是根本沒意識到「放哪裡」本身就是一個決定,而且這個決定常常比措辭重要得多。同一句話,放對地方它每次都生效,放錯地方它可能整場對話都沒被讀到一次。 6 月 18 日 Anthropic 出了一篇官方文章,把引導 Claude 行為的方法整理成七種:CLAUDE.md、rules、skills、subagents、hooks、output styles,還有直接改系統提示。乍看像七個功能等你挑,其實不是——它們是七個抽屜,每個抽屜裝的東西、開的時機都不一樣。搞懂該往哪個抽屜放,這篇就值了。 先用一個比方把七個抽屜串起來想像你開了一家公司,今天進來一個新員工,你要讓他照規矩做事。你會怎麼傳達? 最基本的,你給他一本員工手冊,放在桌上,每天上班都看得到——公司在幾樓、用什麼打卡系統、程式碼風格長怎樣。這就是 CLAUDE.md:它在每次對話一開始就載入,整場都待在那...









