系列精選
查看全部Claude Code 接管瀏覽器完整教學 — 讓 AI 自己開分頁,去看它剛寫好的頁面到底長怎樣
先講一個你八成很熟的畫面。 你請 Claude Code 幫你刻一個頁面,它劈哩啪啦改了五六個檔案,最後回你一句「完成了,頁面已經照你的需求調整好」。然後呢?然後你就得自己 alt-tab 切到瀏覽器,重新整理,瞇著眼睛看版有沒有跑掉、按鈕會不會點、F12 打開看 console 有沒有紅字。有紅字的話,你還得把那串錯誤複製起來,切回終端機,貼給它:「欸你這邊噴 error 了」。它再改,你再切過去看。改一次、看一次、貼一次。 這個迴圈跑個幾輪,你就會發現一件很微妙的事:真正在「測試」的人是你,不是它。 Claude 負責寫,你負責看。它像一個手很快但眼睛蒙著布的工人,你則是全程站在它旁邊當那雙眼睛,一邊看一邊回報「往左一點、這裡歪了、那顆按鈕死掉了」。 卡住的到底是哪一步我們把這個卡點拆開看,會清楚很多。 一個 coding agent 要能「自己把事情做完」,最少要能做三件事:寫(build)、跑(test)、確認結果對不對(verify)。Claude Code 在「寫」這件事上已經很猛了,它讀得到你的檔案、跑得動終端機指令、npm test 這種純文字的驗證它也接得住——...
AI 與科技新聞摘要 20260703 — 能力狂降價的同一週,帳單也悄悄寄到了
有個規律,看久了就會信:一個產業最危險的時刻,往往不是它出事的時候,而是它「能力」跑得比「責任」快太多的時候。這禮拜的 AI 新聞放在一起,就是這個落差在拉大——一邊是最強的模型變便宜、變成你打開就用的預設值,一邊是政府、國安單位、甚至同業,全都在同一週伸手進來想踩一腳煞車。能力這條線衝得飛快,管住它的那條線才剛要起步。落差有多大,風險就藏得有多深。 一、Claude Code 把預設模型換成 Sonnet 5,還順手把它變便宜了Anthropic 把 Claude Code 的預設模型換成了新的 Claude Sonnet 5,帶原生 100 萬 token 的脈絡視窗,還開了促銷價——每百萬 token 輸入 2 美元、輸出 10 美元,一路優惠到 8 月底。官方的說法是:這是目前最能「自己動手」的 Sonnet,會做規劃、會用瀏覽器和終端機、能自主跑一段任務,表現逼近更貴的 Opus 4.8。 值得停一秒的不是它變強,是它變強又同時變便宜。幾個月前,這種等級的自主能力還得付旗艦模型的價;現在它變成中階款的預設值,價錢還打折。 這件事的下行風險,恰恰藏在它的方便裡。當「能自己...
CosyVoice 完整教學 — 中文語音複製,從「請配音員進錄音室」變成「給它 30 秒錄音」
先把場景擺出來。你要讓「某一個特定的聲音」念一段文字——可能是公司品牌的旁白、一集有聲書、一段客服提示音、一支短影音的口白。這件事聽起來很日常,但直到不久之前,你能走的路只有兩條,而且兩條都不太好走。 第一條,請真人配音。找配音員、喬檔期、進錄音室。聲音是好聽,但貴、慢,最要命的是——腳本改一個字,就得把人再約回來重錄一段。第二條,用系統內建的 TTS。快、免費,但你一聽就知道那是機器在講話:斷句怪、重音錯、多音字亂念,中文更慘,方言根本不存在。 這篇要講的 CosyVoice,是阿里巴巴通義實驗室開源的中文語音合成模型。它有意思的地方,不在於「又一個 TTS」,而在於它把上面那件事的做法,整個換了一種姿勢。所以我不打算照功能表一條條念給你聽,我想沿著同一個動作——讓指定的聲音念指定的文字——把「以前怎麼做」和「現在怎麼做」擺在一起看。差別擺出來,你自己就會看到那條線移到哪去了。 舊做法:要一個聲音,先得餵飽它過去要讓 AI 用「某個特定的人」的聲音講話,路徑大致是這樣:你得先蒐集這個人大量的錄音,幾十分鐘、甚至幾小時的乾淨語料,然後拿這批資料去訓練(或微調)一個專屬於這個聲音的...
限流的四種演算法 — 固定視窗、滑動視窗、漏桶、令牌桶,差別全藏在時間怎麼切
先別管限流能擋掉多少惡意流量、能不能防雪崩。先看一件事:一個限流器收到請求之後,第一步到底在幹嘛。 答案短到有點掃興——它在數數。數某一段時間裡進來了幾個請求,超過門檻就擋。就這樣。 聽起來三行 code 就寫得完,對吧?if (counter++ > limit) reject()。問題是,這行 code 藏了一個你沒注意到的假設:「某一段時間」到底是哪一段?時間怎麼切,決定了你的限流器是穩如泰山還是形同虛設。市面上四種主流演算法,差別幾乎全在這一刀切在哪裡。我們就從最笨的那一種切法開始,一路把它逼到極限,看它在哪裡崩掉、下一種演算法又是怎麼補上來的。 第一刀:固定視窗,最直覺也最好騙最容易想到的切法:把時間切成固定的格子。每分鐘一格,格子裡放一個計數器,來一個請求加一,到 60 就擋,整分鐘一到,計數器歸零重來。 12345678910111213141516// 最樸素的固定視窗計數器(單機、非執行緒安全版,只為說明機制)class FixedWindowLimiter { private long windowStart = System.curre...
AI 與科技新聞摘要 20260702
這禮拜的 AI 新聞,你隨便挑一條,問它一個問題:這件事的決定權,到底握在幾個人手上?答案會安靜得有點嚇人。旗艦模型能不能上線,一個政府說了算;近九成的錢,流進同一個國家的同兩家公司;連做晶片這種重資本的生意,新玩家的入場券今年直接發完了。每一條單獨看都是好消息或中性新聞,但把「決定權在誰手上」這條線拉出來,你會看到一個系統正在快速收攏它的節點——而節點越少的系統,看起來越強,摔起來越狠。 一、一紙命令讓旗艦模型下架三週,然後又上架Anthropic 在 7 月 1 日重新部署了它的 Mythos 級旗艦 Claude Fable 5。這條新聞的重點不在模型本身,在它為什麼消失、又為什麼回來:6 月 12 日美國政府一道出口管制令,讓這顆模型直接下線將近三週;管制一解除,它才重新上架。 值得停下來想一秒的是這個因果的乾淨程度。不是技術故障、不是資安事件、不是商業決策——是一道行政命令,就能讓一家市值近兆美元公司的旗艦產品說沒就沒。這在傳統軟體業幾乎沒有對應物:沒人能一句話讓一套已經部署的資料庫從全世界消失。AI 模型變成了一種主權可以直接開關的資產,而你如果把產品的核心能力綁在單...
Claude Code dataviz 技能完整教學 — 幫 AI 加上畫圖表的能力,它做的第一件事是給你一份拒絕清單
Claude Code 在 7 月初的更新裡多了一個內建技能,叫 /dataviz,官方一句話帶過:提供圖表與儀表板的設計指引,附一支可以實際執行的色板驗證器。 大部分人看到「幫 AI 加畫圖表的能力」,直覺會以為 Anthropic 是在教模型畫得更漂亮、更花俏。但你只要請 Claude 畫過幾張圖就知道——它從來不缺畫的能力。你叫它畫長條圖,它畫得出來;叫它做儀表板,它也拼得出來。真正的問題不在會不會畫,在畫出來的東西為什麼總有一股說不上來的塑膠味。所以這個技能真正有意思的地方在於它補的東西:與其說是繪圖能力,不如說是判斷力。它教 Claude 的第一課,是認得出「哪些畫法直接別碰」。 先搞懂:AI 畫的圖表為什麼會醜想像一個什麼都學過、但完全沒被人帶過品味的實習生。你叫他做一張圖,他會怎麼做?他會把學過的東西全部用上——調色盤裡有幾十種顏色,那就多用幾種;能加漸層就加漸層;圓餅圖看起來很豐富,那就切它十塊;軸從哪開始無所謂,反正線拉得越陡看起來越有戲。他不是不努力,恰恰相反,他太努力了,努力到把每一個「我會」都塞進同一張圖裡。 AI 畫圖表醜,就是這麼來的。它的毛病不是懶,...
Claude Code 找回舊對話的四條路 — --continue、--resume、PR 連結、記憶系統該用哪個
先問你自己一個問題:終端機不小心關了,或電腦重開,那段跟 AI 弄到一半的對話——你想怎麼把它接回來? 大部分人卡住的地方,不是「不知道有沒有辦法接回來」,而是「辦法太多,不知道該用哪個」。Claude Code 至少有四條路可以帶你回到過去的對話,而它們解決的其實是不同的問題。搞混了,你會用挖地道的力氣去開一扇本來就開著的門。 所以這篇不從「怎麼操作」開始,從「你到底想接回什麼」開始。把這件事想清楚,該走哪條路自己就浮出來了。 先搞懂一件事:對話是被存下來的在挑路之前,先拆開一個很多人沒意識到的機制:你跟 Claude Code 的每一段對話,都被完整存在硬碟上。 它存在 ~/.claude/projects/ 底下,用你當前目錄的雜湊分資料夾,一段對話一個 .jsonl 檔,檔案裡一行是一個事件——一則訊息、一次工具呼叫、一個結果。另外還有一份全域索引在 ~/.claude/history.jsonl,記著每段對話的 session id 和它是從哪個專案開出來的。 打個比方,這就像你講過的每通電話都被自動錄音存檔了。所以「找回對話」這件事,本質上不是「把消失的東西變回來」,...
AI 與科技新聞摘要 20260701
打開編輯器,寫幾行 code,npm install 拉幾個套件,右上角選一個模型,送出。這一連串動作,是每個工程師再平常不過的一天。 問題是,這條動作鏈上的每一環——你用的工具、你裝的套件、你選的模型、模型跑的晶片——這個月都發生了大事。而且你完全沒感覺。編輯器照樣打得開,套件照樣裝得起來,模型照樣會回話。表面一切正常,底下的板塊卻在整片移動。 這禮拜就把這幾塊移動中的板塊擺在一起看。 一、你天天在用的 Cursor,換老闆了——而且你的 code 成了訓練別人的料先講所有權這一層。SpaceX 敲定以 600 億美元全股票收購 Cursor 的母公司 Anysphere,交易預計第三季完成。這是史上最大的創投支持新創收購案,發生在 SpaceX 那場 750 億美元、史上最大 IPO 之後短短四天。 單看金額只是新聞,真正該讓工程師停下來的是後面這句:SpaceX 早在二月就把 xAI(Grok 的母公司)併了進來,所以買下 Cursor 的不只是火箭公司,是一家火箭加 AI 的集團。而 Cursor 每天累積的、超過一百萬名開發者的真實工作流資料,正是拿來訓練 Grok 的...
上班第一件事不是工作,而是拼湊今天要做什麼 — 我把它換成一封自動寄來的信
打開電腦,第一件事不是工作。是打開四個分頁,拼湊出「今天到底要做什麼」。 行事曆看一遍,哪幾個會議、幾點、跟誰。信箱掃一遍,昨晚有沒有人丟東西進來、哪封是急的。專案看板點開,我手上那幾張卡現在卡在哪。然後在腦袋裡把這三份東西疊起來,排出一個順序。等這套動作做完,通常已經過了十分鐘,而我一行 code 都還沒寫。 這十分鐘每天都在發生。它不難,但它很煩——煩的地方在於它是純搬運:把散在三個地方的資訊集中到一個地方,再做一次判斷。搬運這件事,本來就不該由你來做。 舊做法:你是那個把資料撈出來的人先看清楚舊做法到底在做什麼,才知道哪裡可以換掉。 早上這十分鐘,你其實同時在扮演兩個角色。一個是「資料撈取員」——去日曆、信箱、看板各撈一份出來。另一個是「判斷者」——把三份資料合起來,決定今天先做哪個、哪個有風險、哪個可以晚點。 問題是,這兩個角色的價值天差地遠。撈資料是機械動作,換誰做結果都一樣;判斷才是只有你能做的事,因為只有你知道這週的重點、哪個客戶不能拖、哪個會議其實可以掛著聽。 舊做法把你 90% 的時間花在那個換誰做都一樣的角色上。你不是在早上做決策,你是在早上做資料庫查詢,查完...
Claude Code 背景子代理完整教學 — 開一個 subagent 不再卡死整個對話
你叫 Claude 開一個 subagent 去跑整套測試,心想趁這空檔先去改另一個檔案——結果游標卡住了。你打字沒反應,整個對話凍在那裡,畫面上就一行「subagent running…」。測試跑三分鐘,你就盯著螢幕乾等三分鐘。 這個情境每個重度用 subagent 的人都遇過。而它有解,解法叫「背景執行」。這篇就從這個卡死的現場講起,把它怎麼解、解到什麼程度、又得付出什麼代價,一次說完。 先搞懂:為什麼開一個 subagent 會把你整個卡住要解這個問題,得先知道它為什麼會發生。 預設情況下,Claude Code 開出來的 subagent 是「前景」執行的。前景的意思是——它佔住了你跟主對話之間那條唯一的通道。subagent 在忙的時候,主對話被擋住,你送不了新訊息,因為那條線正被它佔線。 打個比方。你是辦公室主管,手下有個實習生。你叫他去檔案室找一份三年前的合約,然後你做了一件有點蠢的事:你跟著走到檔案室門口,站在那裡,什麼都不做,等他翻箱倒櫃找出來。他找十分鐘,你就在門口站十分鐘。這就是前景 subagent——你明明可以回座位繼續做自己的事,卻選擇站在門口等。 問...









