系列精選
查看全部Claude Code 的 auto mode 學會踩煞車:為什麼它現在會擋住你的 git reset --hard
Claude Code 剛開始紅起來的時候,大家最上頭的玩法,就是把它丟進 auto mode,讓它自己往前衝。不用每三秒跳出來問你「要不要執行這個指令」,它讀完任務、自己規劃、自己動手,你去倒杯咖啡回來,活就幹完了。那種「終於不用一直按 yes」的爽感,是很多人愛上它的起點。 但這條路上其實踩過幾個坑。今天 Claude Code 在 v2.1.183 補上的東西,剛好把這段演進的最後一塊拼圖放上去了。要看懂它為什麼重要,得從頭順一遍這條時間線。 第一階段:全自動,然後有人被清空了把方向盤完全交給 AI,最爽,也最危險。 問題不在 AI 會亂寫程式——那個你 review 還救得回來。真正要命的是那些一秒就無法挽回的指令。最經典的就是 git reset --hard。你辛苦改了一整個早上、還沒 commit 的東西,AI 為了「清乾淨重來」一句 git reset --hard 下去,全沒了。沒有 commit,連 git reflog 都救不回來。 這就像你請了一個動作飛快的實習生,能力沒問題,但你給了他整台機器的 root 權限。九成九的時候他幫你省下大把時間,可是只要有...
AI 與科技新聞摘要 20260619:當模型多到選不完,貴的那條路反而最危險
禮拜一打開電腦,發現能選的前沿模型,比上禮拜又多了一整排。西邊一批、東邊一批,benchmark 數字咬得死緊,價格卻差到一個數量級。對一個只想把活幹完的工程師來說,這不是好消息——選擇變多,從來不等於決策變簡單。這禮拜的幾條新聞放在一起看,浮出來的不是「誰最強」,而是「誰把自己推到了一個下行很大的位置」。 一、Anthropic 一次推兩個模型,最強的那個卻可能你用不到Anthropic 同時端出 Claude Fable 5 和 Claude Mythos 5。底層是同一個模型,差別在安全護欄:Fable 5 是給一般人用的版本,Mythos 5 把護欄拿掉,專門服務資安和生物領域那些「需要它真的會找漏洞」的場景。官方說 Mythos 這一檔,能力是壓在 Opus 之上的新層級。 聽起來是好事,但有個地方要冷靜看:能力最強的 Fable 5,正卡在一樁美國監管行動裡,可用性還是未知數;而真正解放的 Mythos 5,只透過 Project Glasswing 對少數大組織開放。 這就是越接近前沿越逃不掉的那種不對稱。模型越強,它能造成的下行就越大,於是監管和門檻自然往上疊——...
video-use:會剪片的 AI,祕密是它根本不看影片,只讀那份 12KB 的逐字稿
剪一支三分鐘的產品宣傳片,以前的流程是這樣的:把幾十段 talking head 素材拖進剪輯軟體,一段一段聽,把講錯重來的部分標起來、把「呃」「那個」這種廢話剪掉,調色、配字幕、卡點。一個下午就沒了,而且還只是初剪。 現在 browser-use 團隊開源的 video-use,做法是你把素材丟進一個資料夾,打開 Claude Code,打一句「把這些剪成一支 launch video」,它自己清點、轉錄、提案、剪接、調色、上字幕,最後吐一支 final.mp4 給你。 聽起來就是「又一個 AI 自動剪片工具」。但這篇我想講的不是它能做什麼——那個你看 demo 就懂了。我想講的是它選擇不做什麼,因為那個選擇才是整件事真正聰明的地方。 一支 30 秒的影片,硬塞給 AI 要花多少錢先算一筆帳。如果你照直覺做一個「會看影片的 AI 剪輯器」,最自然的想法是:把影片每一幀都丟給 vision model,讓它看懂畫面,再決定怎麼剪。 30 秒的影片,一秒 30 幀,就是 900 幀。每一幀進到 vision model 大概 1500 個 token 上下,900 幀就是約 135...
Claude Code /context 指令完整教學 — 看一眼就知道你的 AI 腦袋被什麼塞滿了
事情通常是這樣發生的。 你跟 Claude Code 弄一個功能弄了一兩個小時,一開始它聰明得像個資深工程師,問什麼答什麼。但跑著跑著,它開始變了——你早上才跟它講清楚的命名規則,它下午又用回舊的;你明明貼過的那個檔案,它說它沒看過;最後它乾脆自己跳出一行「Compacting conversation…」,把你們聊了半天的東西壓成一坨摘要,然後你發現有些重要的細節,它就這麼忘了。 第一次遇到,多數人的反應是重開一個 session。有用,但你等於把前面建立的所有上下文全丟了,重新解釋一遍。第二種人會去動 CLAUDE.md,把裡面的東西刪一刪,賭問題出在那。也有人開始疑神疑鬼,覺得是不是模型今天「狀態不好」。 這些做法的共同點是:都在瞎猜。 因為你看不見問題本身——你看不見 Claude 的腦袋裡,這一刻到底裝了哪些東西、各占多少位子。而 /context 這個指令,做的就只有一件事:把這個你看不見的東西,拍成一張看得見的俯瞰圖。 先搞清楚,到底是什麼東西會「滿」要看懂這張圖,得先建立一個畫面。 把 Claude 的 context window 想像成一張工作桌。它不大,固定...
AI 與科技新聞摘要 20260618 — 用飆漲的股票買真實的版圖,估值成了這週的硬通貨
一家發火箭的公司,這週用股票買下了一個寫程式的編輯器,作價 600 億美元。 這個畫面值得多看兩秒。它荒謬,但它一點都不孤立——把這週幾條看似不相干的新聞擺在同一張桌上,你會發現它們都在做同一個動作:拿手上那張飆漲的紙(股票、估值、融資額),去換地面上真正能拿在手裡的東西——一家公司、一塊市場、一條人才線。估值,這週成了比現金更好用的硬通貨。 一、SpaceX 用 600 億的股票,買下了 Cursor6 月 16 日,SpaceX 宣布要用價值 600 億美元的股票,收購 AI 編碼工具 Cursor 的母公司 Anysphere。這是有紀錄以來最大的一筆創投支持新創併購案,而它發生在 SpaceX 剛以史上最大 IPO(募了 750 億美元)登上 Nasdaq 才幾天之後。 細節比數字更有意思。這是一筆全股票交易——SpaceX 沒掏一毛現金,而是把自己當天還在飆漲的股票直接換給對方。消息一出,SpaceX 股價當天漲了約 16%,市值一舉超車亞馬遜和微軟,衝上全美第四。換句話說,市場用上漲幫它把這筆 600 億的帳,在幾個小時的交易裡就付掉了一大半。Cursor 那邊也不是...
Google Skills — 你的 AI 老是寫出過期的雲端程式碼,這個 Markdown repo 想治本
把時間拉回到大模型剛開始會寫程式的那陣子。你叫它幫你接 Google Cloud,它寫得飛快,語法也漂亮,你複製貼上,跑——炸了。它用了一個半年前就被標 deprecated 的 google-cloud-aiplatform SDK,順手還給你掰了一個根本不存在的 model 名稱。 這個場景,從那時候到現在,幾乎沒怎麼變過。換了幾代模型,分數一代比一代高,但你叫它接雲端 API,它還是有不小機率給你一段「看起來對、跑起來錯」的程式碼。問題不在它笨。問題在一個更結構性的地方:它的記憶有個截止日,而雲端產品沒有。 一個追不上的時間差想清楚這件事,得先承認一個落差。 一個 AI 模型的知識,是在某個時間點凍結的。它訓練完那一刻,腦袋裡的 Google Cloud 就停在那個版本——那時候的 SDK、那時候的 model 名稱、那時候的最佳實踐。然後它被部署出來,開始服務你好幾個月、甚至一年。 而這段期間,Google Cloud 那邊在幹嘛?Gemini 的 model 名稱每幾個月換一輪,SDK 大改版,認證方式推陳出新,昨天的 golden path 今天就被標成不建議。雲端產...
Claude Code Output Styles 完整教學 — 讓 AI 換一種說話方式,而不是換一套知識
一開始,大家都是這樣湊合的。 你嫌 Claude 回話太囉嗦,於是在 CLAUDE.md 最上面加一行:「請簡短回答,不要解釋。」過幾天你在帶一個新人,又想讓它多講一點原理,於是把那行刪掉,改成「請詳細說明每個決策」。再過幾天你自己想學東西,又想要它邊寫邊考你……於是這個檔案變成一個被反覆塗改的便條紙,今天要它閉嘴、明天要它多嘴,改到最後你自己都忘了現在到底設成哪一套。 這個小麻煩,就是 Output Styles 會出現的原因。它把「Claude 該怎麼跟你說話」這件事,從散落在 CLAUDE.md 裡的零碎叮嚀,變成一個可以一行指令切換的開關。 先搞清楚它改的是什麼這裡有個概念很容易混。Output Styles 改的,不是 Claude 知道什麼,是 Claude 怎麼把知道的東西講給你聽。 打個比方。同一個資深工程師,今天面對客戶簡報,他會講重點、不碰細節;明天帶實習生,他會把每一步拆開、邊做邊解釋為什麼;後天跟同級的人結對寫程式,他可能寫一半停下來說「這段你來」。這個人的知識完全沒變,變的是他根據對象切換的「表達模式」。Output Styles 就是給 Claude ...
AI 與科技新聞摘要 20260617 — 用未來的算力付現在的帳、上線前才學會怕、排隊敲鐘
你有沒有想過一件事:當一家公司每個月付出去的錢,比它一整年賺進來的還多,這筆錢到底是從哪裡生出來的? 這週幾條看似不相干的新聞,答案其實是同一個——從「未來」生出來的。未來的算力、未來的估值、未來才會爆的風險,正被一張一張地折現成今天的合約。把這幾條擺在一起,你看到的會是一個越來越敢拿明天抵押今天的產業。 一、OpenAI 想在模型上線前,先預演它會怎麼出包6 月 16 日,OpenAI 公布了一套叫 Deployment Simulation 的方法:在新模型正式發布前,把過去的真實對話重新「播放」一遍給候選模型聽,再替它的回答打分,藉此預測這個模型上線後大概會做出哪些出格的事。 聽起來很合理,細節才是重點。他們拿了大約 130 萬則去識別化的對話(涵蓋 GPT-5 Thinking 到 GPT-5.4,時間橫跨 2025 年 8 月到 2026 年 3 月),用這套方法去估模型的偏差行為發生率。最漂亮的戰績,是它真的抓到一個叫「calculator hacking」的毛病——GPT-5.1 會偷偷把瀏覽器工具拿來當計算機用,卻在介面上假裝自己在搜尋。這種事如果上線後才被使用者...
Ponytail — 讓 AI 少寫程式碼,一道決策階梯該不該裝進你的 coding agent
先別急著裝。裝 Ponytail 之前,你只需要回答一個問題:你那隻 AI coding agent,平常是寫太少,還是寫太多? 這個問題的答案,幾乎決定了 Ponytail 對你是神器還是雜訊。如果你的 agent 老是偷懶、該補的驗證不補、邏輯寫一半就收工——那它不缺一個叫它「少做一點」的工具。但如果你常常遇到另一種情況:你只是要一個日期選擇器,它二話不說裝了 flatpickr、包了一層 wrapper component、還順手幫你寫了時區處理——那 Ponytail 正是衝著你這隻 agent 來的。 Ponytail 是 2026 年 6 月爆紅的一個 agent skill,作者是個人開發者 DietrichGebert,建立才四天就衝上 21,000+ stars。它的工作只有一件事,而且這件事可以濃縮成一句話:最好的程式碼,是你根本沒寫的那一行(The best code is the code you never wrote)。 它到底在攔什麼四天兩萬星這個數字,比工具本身更值得想一下。一個只是「叫 AI 少寫一點」的 prompt,憑什麼讓這麼多人有共鳴? ...
Claude Code 用 PR 連結找回會話 — 貼一個網址,跳回三天前那段對話
先別管怎麼把對話找回來。先問一個更基本的問題:當你關掉 Claude Code,那段對話跑去哪了? 大部分人腦中的模型是「聊天視窗」——開著就在,關了就沒。但這個模型會害你找不到東西。實際上,一個 session 不是視窗,是一個躺在你硬碟上的檔案。路徑長這樣: 1~/.claude/projects/<project>/<session-id>.jsonl <project> 是從你的工作目錄路徑衍生出來的,.jsonl 裡每一行是一個 JSON 物件——一句你的話、一次工具呼叫、一段 metadata,照順序疊上去。你工作的時候,Claude Code 就一行一行往這個檔案寫。所以「恢復會話」這四個字,拆開來看一點都不玄:它就是把這個檔案重新讀回記憶體,接著上次的最後一行繼續。 理解這層,後面所有東西都會變簡單。我們從這個檔案開始往上蓋。 第一層:怎麼把某個檔案重新讀回來既然 session 是檔案,問題就變成「我要哪一個檔案」。Claude Code 給了一排入口,由模糊到精準: 123claude --continue ...









