系列精選
查看全部工程師為什麼特別難睡 — 拆解那個被你怪錯的元兇
凌晨一點,你終於闔上筆電躺上床。身體很累,累到骨頭裡。但眼睛一閉,腦袋自己就跑了起來——剛才那個 bug 的修法到底對不對、那段 function 是不是還有 edge case 沒處理、明天 standup 要怎麼講。你越想叫它停,它跑得越起勁。 你不是沒試過解這個問題。你查過資料,知道「藍光害睡眠」,於是你配了防藍光眼鏡、把手機開了夜覽模式、螢幕調成暖黃色。結果呢?該睡不著還是睡不著。你又試了早點躺,十一點就上床,結果只是換成在床上多清醒一個小時,盯著天花板。 兩招都試了,兩招都沒用。那問題到底出在哪? 先抓對病因:藍光大概是被你冤枉的這裡要講一個會顛覆你直覺的事。你花錢花力氣對付的藍光,可能從頭到尾就不是主嫌。 最新的研究結果其實蠻打臉的:螢幕光線最多只會讓你的入睡時間延後大約 9 分鐘,而且手機、筆電、平板釋放的藍光量,遠遠低於白天的太陽光——你大白天在太陽底下走半小時都沒事,晚上對著一個亮度低幾百倍的螢幕,光本身能造成的傷害其實有限。 那為什麼大家都在罵藍光?因為它好懂、好怪、好賣東西。「藍光」是個聽起來很科學的詞,配一副眼鏡就能解決,多療癒。但這就掉進一個典型的陷阱:...
AI 與科技新聞摘要 2026/05/31 — 一邊往中心擠,一邊往邊緣逃
問你一個問題:AI 這場局,到底是會收斂到少數幾家手裡,還是會散開到每個人桌上?這週的新聞很有意思,因為它同時給了你兩個方向相反的答案。一邊有人在把權力、資本、算力往中心擠;另一邊有人在用更小、更省、更本地的東西,把同樣的能力往邊緣推。把這幾條擺在一起看,會比單看任何一條都清楚。 一、SubQ 用非 Transformer 架構,把 context 撐到 1,200 萬 token新創公司 Subquadratic 推出了 SubQ 1M-Preview,這是 Transformer 架構這幾年第一個像樣的商業挑戰者。它繞開了標準注意力機制那個要命的「平方級成本」——序列越長,計算量是平方倍往上飆——改用稀疏注意力,原生支援 1,200 萬 token 的 context,在大規模長文本場景下注意力快上 52 倍,成本大約只要現有頂尖模型的五分之一。 技術細節先放一邊,值得停下來想的是它戳到的那個點。過去這幾年,整個產業幾乎把全部賭注押在同一個架構上——Transformer 好用,所有人就一起往那個方向堆資源、堆參數、堆算力。但越多人押在同一個東西上,那個東西一旦撞到天花板,連...
n8n-workflows — 4,343 個範本背後,真正值錢的是被重寫的那套搜尋引擎
先講這個專案最早是怎麼做的,因為那個「之前的版本」才是重點。 作者想做的事很單純:把網路上能找到的 n8n 自動化範本全蒐集起來,配個介面讓人搜尋、瀏覽、下載。第一版的做法非常工程師——一堆 workflow 的 JSON 檔丟進一個資料夾,再用 Python 內建的 http.server 隨手搭一個原始的 HTML 索引頁,能看就好。檔案三五十個的時候,這樣完全沒問題,跑起來還挺爽的。 然後範本越收越多,收到四千多個。整套就垮了。 舊做法:每次都把整座圖書館翻一遍垮在哪?垮在它的瀏覽方式,是每次有人打開頁面,就把資料夾裡所有 JSON 掃過一輪、現場解析、現場組頁面。三十個檔案掃一輪你沒感覺,四千三百個檔案掃一輪,頁面就卡在那裡轉圈圈,記憶體被吃光,而且這種「現掃現組」的架構,根本做不出真正的全文搜尋——你沒辦法一邊掃檔案一邊還要比對關鍵字、排相關性。 打個比方你就懂了。這就像你每次想在圖書館找一本書,館員不是去翻目錄,而是從第一個書架開始,一本一本抽出來看書名,看是不是你要的。書少的小書房這樣找沒事,真正的圖書館要是這樣運作,你會等到天荒地老。 問題的根,不在程式碼寫得好不...
在家自己沖咖啡到底划不划算 — 一個工程師的器材投資判準
先回答一個你可能從來沒算過的數字:一年,你在咖啡上花掉多少錢? 一天一杯超商中杯,抓 45 塊,乘上 250 個工作天,是一萬一千多。要是你習慣喝外帶手沖、一杯破百,或一天兩杯,數字直接翻到兩三萬。這還只是咖啡本身,沒算你為了買那杯咖啡走出去、排隊、回來的那十五分鐘——對一個時間被切成番茄鐘的工程師來說,那十五分鐘有時比那 45 塊還貴。 所以「要不要自己在家沖」這個問題,值得認真算一次。但在你手滑下單一台咖啡機之前,先回答我一個問題——這個問題的答案,決定了下面的內容你該不該往下讀。 你一天到底喝幾杯?這是唯一真正重要的判準。不是哪台機器評價高,不是哪種豆子潮,是你的「頻率」。 如果你一週只喝個兩三杯,而且還很看心情,那我直接講結論:別買器材,繼續外帶。原因等一下說。如果你是那種每天至少一杯、雷打不動,週末在家還會想再來一杯的人——好,這篇剩下的內容是寫給你的。 為什麼頻率是分水嶺?因為所有器材都是一筆「先付出去、之後慢慢攤回來」的投資。你今天花 999 買一支摩卡壺,這 999 要靠「每一杯比外面省下來的差價」一杯一杯還回來。一天喝一杯的人,可能兩三個月就回本,之後天天賺;一...
AI 與科技新聞摘要 2026/05/30 — 同一隻手,一邊造矛一邊鑄盾
這個產業正在用同一隻手,一邊磨利矛,一邊趕著鑄盾。把這週的幾條新聞排在一起,你會發現它們其實是同一件事的正反兩面:模型的攻擊能力被推得越快,整個生態就越急著補那道還沒蓋好的防線。 一、Claude Opus 4.8 上線,Mythos 帶著「會自己串漏洞」的能力逼近Anthropic 這週把旗艦模型升到 Claude Opus 4.8,官方說它在代理式編碼、財務分析、電腦操作這幾項 benchmark 上壓過 GPT-5.5 跟 Gemini 3.1 Pro,而且更「誠實」——會主動標出自己不確定的地方,少編沒根據的東西。一個模型把「願意承認不知道」當賣點來講,本身就說明了過去這一年大家被幻覺坑得有多慘。 真正讓人坐直的是後面那句:Mythos 級的模型「未來幾週」就會對所有客戶開放。Mythos 的特點是它的編碼與資安能力強到一個程度——能在現有軟體裡找出漏洞,還能把這些漏洞串起來,組成一套像樣的攻擊鏈。 這就是下行很大、上行有限的那種東西。一個能自己找漏洞、自己串攻擊鏈的模型,放對手裡跟放自己手裡,威力是對稱的,但傷害不是。防守方要顧好每一個洞,攻擊方只要找到一個。能力對稱、...
GBrain — 不丟連結給你、直接合成答案的開源 AI 第二大腦
先別管它能拿來做什麼。先看你丟一段筆記進去的那一刻,它背地裡做了哪件事。 你寫了一行字進去:「Alice 在 Acme 當 CTO,這家是 Sequoia 投的。」一般的筆記工具到這裡就結束了——它存下這串文字,等你哪天搜尋「Alice」再把這行吐回來。GBrain 不一樣。在你按下儲存的同一瞬間,它把這句話拆成三個節點(Alice、Acme、Sequoia)跟兩條有型別的關係線(Alice works_at Acme、Sequoia invested_in Acme),接到它腦袋裡那張一直在長大的網上。下次你問「Alice 背後有哪些投資人」,它不用再去翻那行字——它沿著線走兩步就到了。 關鍵在這裡:這一步抽節點、連關係,完全沒呼叫任何大模型。 純 regex 加一組啟發式規則做掉的。零 token、零成本、零延遲。 你以為讓檢索變強的是模型,其實不是這就是整顆大腦最反直覺的地方,也是我覺得最值得抄走的設計判斷。 2026 年的反射動作是這樣的:檢索不夠準?換更大的 embedding。答案不夠好?接更貴的模型。什麼問題都先想「丟給 LLM」。GBrain 的 benchmar...
Claude Code Dynamic Workflows 完整教學 — 讓 AI 自己寫腳本,在背景指揮上百個分身
把時間倒回去看,會比較容易看懂這次的改變到底大在哪。 一年多前,你想讓 AI 同時幫你做好幾件事,唯一的辦法是當人肉排程器。開三個終端機視窗,第一個叫它改 API、第二個叫它寫測試、第三個讓它跑 lint,然後你的眼睛在三個視窗之間跳來跳去,誰卡住了你補一句、誰跑完了你接著派下一個。AI 在做事,但調度它的是你,而且你一次只能盯住有限的幾個。 後來 subagent 出現,往前走了一步。Claude 開始能自己派分身去處理子任務,你不用再手動開視窗了。但這裡藏了一個很多人沒注意到的代價:每一個 subagent 做完事,它的中間結果都會回流到 Claude 主對話的 context window 裡。十個分身回來十份半成品,全堆在同一張桌子上,你寶貴的 context 就這樣被一堆「過程」吃掉,留給「真正在想的事」的空間越來越小。而且決定下一個該派誰,還是 Claude 在對話裡一輪一輪臨場判斷——它本質上還是個工頭,只是工頭從你變成了它。 到了四月的 Agent Teams,規模又上一個量級——16 個 Claude 實例真的同時開工,誇張到能合力寫出一個編譯 Linux ke...
AI 與科技新聞摘要 20260529:MCP 官方 SDK 爆系統性漏洞、OpenAI 把安全寫成合規、Google Antigravity 2.0 對打 Claude Code
這個產業最近同時在做兩件事:一邊用盡全力把 AI 工具推得更快、更會自己跑;一邊手忙腳亂地補那些跑太快留下來的洞。這週的新聞,剛好把這兩條線攤得清清楚楚。 一、OpenAI 發布 Frontier Governance Framework:把安全做成一份合規文件OpenAI 在 5/29 公布了「Frontier Governance Framework」,把原本對內的 Preparedness Framework 抽出一部分,整理成一份對外的公開治理文件。明說的目的是對齊法規——加州的 Transparency in Frontier AI Act、歐盟 AI Act 底下的通用模型行為準則。內容涵蓋網路攻擊、CBRN(生化核輻)、有害操弄、失控等風險的評估與緩解,外加模型回報、資安管理、事件應變、外部專家審查的流程。 值得停下來看的,是這份文件的「形態」。安全本來是個工程問題——你怎麼讓模型不做壞事。現在它正在變成一個合規問題——你怎麼證明給監理機關看你有在防。這兩者不一樣。前者要的是真的安全,後者要的是可被稽核的文件。當一家公司開始把安全寫成對齊法條的治理框架,代...
whisper-guard — 砍掉 87% Whisper 幻覺的不是大模型,是一個 400 行的規則引擎
Whisper 最會騙你的時刻,是它最心虛的時刻。 用過 Whisper 的人大概都撞過這個牆:一段明明安靜無聲的停頓,轉錄結果卻憑空冒出「謝謝觀看」、「記得訂閱」,或者同一句話像跳針一樣重複十幾遍。這不是 bug,是模型的天性——它在沒有有效輸入的時候,還是會硬擠出一點東西來。你可以想成一個被訓練到「必須開口」的人,被丟進一個沒人講話的房間,他不會閉嘴,他會開始編。Whisper 訓練資料裡塞了海量的 YouTube 字幕,所以它編出來的,往往就是那幾句最常出現的片尾台詞。 碰到這種狀況,工程師的直覺反應幾乎是反射性的:那就再串一個 LLM 在後面,讓它讀一遍轉錄結果,把不通順、明顯亂入的句子清掉。畢竟 2026 年了,什麼問題不是丟給大模型解決的? 這個直覺是錯的。而且錯得很乾脆。 一個 benchmark,把直覺打回原形whisper-guard 這個專案的作者跑了一組對照實驗,數字攤開來看,很難不被嚇到。 同一份音檔,原始 Whisper 跑出來有 16 次幻覺,耗時 47.7 秒。接著試「只加 LLM 後處理」這條多數人會選的路:幻覺數字是多少?16 次。一次都沒少。減...
Claude Code /usage 完整教學 — 看你的額度花在哪個 Skill、Subagent、Plugin、MCP server
打開 Claude Code 還沒輸入任何指令,光是 boot 起來這層 context window 就已經吃掉了——多少? 預設安裝一個 CLAUDE.md、五個 MCP server、幾個 skills,根據 Claude Code 官方文件的估算,起跳就要五萬個 token。其中光 GitHub MCP 一個就佔了一半以上。 這還是「什麼都還沒做」的數字。 5 月的 /usage 升級之後,這層消耗變得可見了——指令會把 skills、subagents、plugins、每個 MCP server 各自吃掉多少額度列成一張表。本來這層是黑盒子,現在打開了。 這篇拆解三件事:/usage 報表怎麼看、看到之後該怎麼動手減重、為什麼這個指令的設計值得抄到自己的工作流。 /usage 跟 /cost 跟 /stats 不是同一件事先把容易混淆的三個指令分開: 指令 看什麼 適用對象 /usage Pro / Max 訂閱的額度還剩多少、各 category 吃掉多少 訂閱戶 /cost 這個 session 跑下來花了多少美金 用 API key 的...









