AI 與科技新聞摘要 - 2026/04/11
AWS 在 IDE 工具上持續砸錢,微軟把 agent 框架搞成 production-ready,WordPress 官方終於出 MCP Server,而 PraisonAI 又爆出第二個高危漏洞,GitHub Copilot 則推出公開預覽版 SDK。這禮拜 agent 生態真的在加速,但安全議題也跟著浮出檯面。 Kiro CLI v1.0.23:新增 agent 模式快速啟動AWS 的 Kiro IDE 最近釋出了新的 CLI 版本,重點是加入了 --autopilot、--mode 和 --plan 這三個參數,讓使用者可以直接跳到特定的 agent 模式工作,不用每次都從零開始。以前的 /agent generate 流程現在也整合進 /agent create,預設就會開啟 AI 輔助模式。 Kiro 的策略很清楚:先寫 spec,再生成程式碼。跟 Cursor、Windsurf 這些編輯器比起來,Kiro 更強調規格驅動,這對團隊協作來說還滿實用的,尤其是當你需要在代碼生成之前確認需求的時候。新的 CLI 改動看起來不大,但減少了使用者的操作步數,這種 fricti...
Hermes HUD Web UI - AI Agent 的即時意識監控面板
你有沒有想過,你的 AI Agent 在幹什麼?它現在在想什麼?記得了哪些東西?花了多少錢? Hermes Agent 跑在背景裡,靜靜地執行各種工作。但它的大腦到底存了什麼資料、記憶怎麼組織、成本怎麼算,這些都藏在 ~/.hermes/ 這個資料夾的各種檔案裡——SQLite、Markdown、YAML、JSON 一堆。要看懂這些原始資料,真香的辦法就是一個視覺化的監控面板。這就是 Hermes HUD Web UI 登場的時刻。 瀏覽器裡的 Agent 意識監控Hermes HUD Web UI 是 Hermes HUD 的網頁版本。TUI 版本給你命令列的純粹感,Web 版本就更直覺、更適合長期監看。它用圖表、卡片、即時更新,把 Agent 的內部世界呈現出來。 這個面板不是簡單的可視化工具。設計上採用了 讀寫分離 的思路——你只能看,不能改。這聽起來像是限制,其實是保護。Agent 執行中如果面板能隨意修改狀態,那踩坑的機會太多了。只讀設計確保你的監控動作絕不會搞亂 Agent 的運作。 10 個監控面板包括:Dashboard(總覽)、Memory(記憶體系)、Skil...
工程師不要死在椅子上 - 久坐職業病自救指南 2026
連續 sprint 三個禮拜,站起來的時候腰發出了一聲脆響。不是那種「咔」一聲很爽的感覺,是真的有點痛。那時我才發現,自己對著螢幕坐了十四個小時,中間只離開過一次,還是去廁所。 這個問題有多嚴重?某次 slack 裡同事分享了一篇研究,久坐超過 9 小時,死亡風險增加 22%。如果每天坐滿 10 小時以上,心血管死亡風險更直接升到 34%。我看著自己的工時紀錄,有點破防。 竹科現在已經不流行「爆肝」了。台積電蓋了兩座運動館、十六面球場,聯發科還有職籃等級的籃球場。這不是公司在做善事,是他們發現工程師坐死了比坐出 bug 更划不來。看看大廠都在轉型健身,我們這些每天和 code 黏在一起的人該認真了。 為什麼坐著會這麼糟有夠誇張的是,久坐不只是單純的腰痛。血液循環變差、肌肉萎縮、代謝下降,整個身體系統都在罷工。最絕的是,再怎麼健身房練習也補不回來。根據 Applied Ergonomics 2021 的研究,他們比較了全坐、全站、交替三個方案: 全坐:認知測試最差,大概就是一邊 debug 一邊變笨 全站:腿會廢掉,員工投訴聲不絕於耳 交替模式:工作記憶、執行功能、創意思考全面勝...
Claude Managed Agents 完整教學 - 從零打造雲端 AI Agent
自己搭 AI agent 的基礎設施有多痛?沙箱要做、狀態要管、retry 要寫、工具執行要安全隔離、觀測性要加、容器要維護。光這些就能吃掉幾週的開發時間,而且你真正想解決的業務問題一行 code 都還沒寫。 4/8 Anthropic 推出 Claude Managed Agents,把上面這些全包了。你只要定義「agent 要做什麼」,基礎設施的部分 Anthropic 幫你扛。目前是公開測試版,所有 API 帳號都能用。 四個核心概念在動手之前,先搞清楚四個東西的關係: 概念 是什麼 類比 Agent 模型 + system prompt + 工具 + MCP servers 職位說明書 Environment 容器設定(套件、網路規則、檔案掛載) 辦公室環境 Session 一個正在跑的 agent 實例 一次工作任務 Events 你跟 agent 之間的訊息交換 對話和指令 Agent 定義一次,可以跨多個 Session 重複使用。Environment 也是——配好一個環境,所有 Session 都能引用。Session 是實...
AI 與科技新聞摘要 - 2026/04/10
Anthropic 把 AI agent 的基礎設施直接打包成代管服務、OpenAI 推出 $100 中間價位搶 Claude 的客群、GitHub Copilot 在 VS Code 加入全自主 Autopilot 模式、又一個 AI 框架被打穿 CVSS 9.9,然後 Cowork 終於從 research preview 畢業了。 Claude Managed Agents:Anthropic 幫你跑 AI Agent 的代管服務4/8 Anthropic 推出 Claude Managed Agents 公開測試版。核心概念:你定義 agent 要做什麼(system prompt、工具、模型),Anthropic 負責跑起來——沙箱執行、狀態管理、agent loop、工具呼叫全部代管。 用法分四步:建立 Agent 定義 → 設定 Environment(預裝套件、網路規則、掛載檔案)→ 啟動 Session → 透過 SSE 串流互動。內建工具包含 bash、檔案操作、網頁搜尋、程式碼執行。整個流程可以用 Claude Console 操作,也可以用新推出...
MarkItDown - 微軟出品的「任何檔案轉 Markdown」工具
PDF 丟進 LLM 前要先做什麼?轉文字。Word 呢?也是轉文字。PowerPoint?一樣。問題來了:轉成純文字會丟掉所有結構——標題層級沒了、表格扁平化了、清單變成一坨散文。LLM 拿到這種東西,理解力直接打折。 微軟的 MarkItDown 就是為了解決這個前處理痛點而生的。一行指令,把幾乎任何格式的檔案轉成 Markdown,保留標題、表格、清單的結構。97K+ stars,MIT 授權,三行 code 就能用。 為什麼是 Markdown 而不是純文字主流 LLM 的訓練資料裡大量包含 Markdown。對模型來說,收到一份有 ## 標題和 | 表格的 Markdown,比收到一坨沒結構的純文字好懂太多,token 數也不會明顯增加。 MarkItDown 的定位很明確:不做高保真的文件格式互轉(那是 Pandoc 的事),專門為 LLM 管線設計的前處理工具。犧牲排版的視覺還原度,換取語意結構的完整保留。 支援哪些格式覆蓋面有夠廣: 文件類:PDF、Word(.docx)、PowerPoint(.pptx)、Excel(.xlsx / .xls) 網頁...
AI 與科技新聞摘要 - 2026/04/09
Stripe 的 AI agent 一週吐出 1,300 個 PR、Anthropic 推出免費的 Claude Code Analytics API 讓企業追蹤 AI 開發者生產力、Google Gemini 正式拿到 MCP 和 Computer Use、Eclipse Ventures 砸 13 億美金押注 AI 基礎設施,然後中國的 Spirit AI 在 30 天內連拿兩輪共 4.2 億美金。 Stripe Minions:一週 1,300 個 PR 的自主 Coding AgentStripe 的工程團隊把內部的 AI coding agent 系統 Minions 正式搬上檯面。數字很嚇人:每週自動產出超過 1,300 個 pull request,所有程式碼都經過人類 review。 跟 Copilot 或 Cursor 不同,Minions 不是互動式的程式碼補全工具。它走的是 one-shot 模式——從 Slack thread、bug report 或 feature request 接收任務描述,自己從頭把程式碼、測試、文件全部生出來。背後用的是 Blu...
Claude Code Git Worktrees 完整教學 - 讓 AI 同時幫你做五件事
一個 Claude Code session 修 auth bug,另一個在寫新的 API endpoint,第三個在跑測試然後修 failing cases。三件事同時進行,互不干擾。 這不是什麼未來願景,是 Claude Code 的 --worktree flag 已經能做到的事。Boris Cherny(Claude Code 的創造者)自己的工作流是同時跑 10-15 個 session,每個 session 各自推進不同任務。聽起來很瘋狂?其實設定比你想的簡單得多。 為什麼需要 Worktrees先講問題。你在一個 repo 裡開了 Claude Code session A 修 bug,修到一半想讓另一個 session B 同時去加新功能。結果 B 改了你正在 debug 的檔案,A 的 git status 瞬間爆炸——unstaged changes、merge conflicts、整個 context 亂掉。 Git worktree 解決這個問題。一個 worktree 就是同一個 repo 的一個獨立工作目錄,有自己的 branch、自己的檔案,但共享同...
OpenSoul - 以大腦神經結構為靈感的認知 AI 框架
每次開新的 ChatGPT 對話,它都不記得你昨天講了什麼。用 Claude Code 開新 session,前一輪的 debug 心得全部歸零。LLM 的記憶,基本上跟金魚差不多。 OpenSoul 試圖改變這件事。它在 LLM 之上疊了一層認知架構,靈感來自人腦的神經結構——海馬迴管情節記憶、新皮質管語意記憶、基底核管程序記憶,甚至還有多巴胺和血清素的虛擬版本來調控 AI 的「情緒」。聽起來很科幻?確實,但它的設計文件讀起來比大多數「AI 認知」專案都嚴謹得多。 三層記憶圖譜OpenSoul 把記憶存在 FalkorDB(基於 Redis 的圖資料庫)裡,分成三層: 情節記憶(Episodic Memory)對應海馬迴,記錄具體的對話片段。「你上次說你喜歡喝咖啡」——就是這一層在運作。 語意記憶(Semantic Memory)對應新皮質,儲存從對話中提煉出來的通用知識。「Python 是程式語言」這種事實性資訊住在這裡。 程序記憶(Procedural Memory)對應基底核,記住「這個使用者常犯的錯」之類的行為模式。 每次對話時,系統用 EcphoryRAG 做聯想檢索...
Claude Code /powerup 互動式教學與 April 2026 重點更新完整指南
打開 Claude Code 輸入 /powerup,終端機裡跑出一段互動式動畫教學。不用開瀏覽器、不用翻文件,在你寫程式的地方直接學怎麼用這個工具。這是 v2.1.89 加進來的新功能,搭配同一時期的 MCP 500K 上限、headless defer 機制和 /cost 增強,四月的第一週就塞了四個版本更新。 /powerup:終端機裡的互動教學/powerup 的設計哲學很明確——新手不需要離開終端機就能學會 Claude Code 的核心功能。每個 lesson 都有動畫示範,不是只給你看文字說明,而是實際在終端機裡播放操作過程。 12345# 啟動 Claude Code 後直接打/powerup# 會看到課程選單,選你想學的功能# 每個課程有互動式的 step-by-step 引導 跟一般文件的差別在哪?文件告訴你「你可以用 /loop 設定排程」,/powerup 則是在終端機裡示範整個設定流程,讓你跟著操作。學習曲線直接壓平一截。 對比一下其他 AI coding 工具的新手引導:Cursor 靠的是 GUI 裡的 to...









