淡江大橋通車了 — 一個軟體工程師的建築工程巡禮
124.9 億新台幣。七度流標。從最初的構想到通車,整整超過三十年。 淡江大橋在這週一(5/12)正式通車。 如果你是那種「橋就是從 A 到 B 的通道」的人,這篇可以跳過。但如果你寫過的程式有超過三年生命週期的話,你大概能理解一件事花三十年完成是什麼感覺。 一座橋的體檢報告主橋段 920 公尺。橋塔高 211 公尺。主跨距 450 公尺,背跨距 175 公尺。橋面最寬處約 70 公尺。 這些數字放在一起代表一件事:全球跨度最大的單塔不對稱斜張橋。不是台灣最大,是世界最大。CNN 在 2025 年初把它評選為年度全球重要建築,跟倫敦、巴黎、紐約的地標排在一起。 設計者是 Zaha Hadid——建築界少數拿過普立茲克獎的女性建築師。她在 2016 年驟逝,享年 65 歲。淡江大橋是她的遺作之一,由 Zaha Hadid Architects 團隊繼續完成。那個 211 公尺高的弧形橋塔,靈感來自雲門舞者跳躍向上的姿態——雙手合十,向天伸展。 你平常走的橋不會讓你抬頭看。這座會。 七度流標是什麼概念這才是有意思的部分。 淡江大橋的構想最早可以追溯到 1990 年代。規...
AI 與科技新聞摘要 - 2026/05/10
1,200 萬 tokens。 這是一個只有四個人的邁阿密新創宣稱可以在單次對話中處理的上下文長度。目前最大的公開模型——Gemini 3.1 Ultra——是 200 萬。1,200 萬是它的六倍。如果這個數字是真的,目前所有 LLM 的注意力機制都在浪費大量算力。如果是假的,那就是 2026 年最大膽的技術行銷。 同一週,OpenAI 做出了第一個能邊聽邊想的語音模型。Cursor 把 IDE 的輸出從純文字變成互動式 React 介面。全球最大銀行把 AI 從實驗預算搬進基礎設施預算。AWS 的 MCP Server 從 beta 進入正式 GA。 一個共同的訊號:AI 正在從「能做什麼」轉向「怎麼嵌進既有系統裡」。前者是技術問題,後者是組織問題。而組織問題,向來比技術問題難解得多。 Subquadratic:四個人、$2,900 萬、1,200 萬 token 的豪賭五月五日,邁阿密新創 Subquadratic 公開亮相。$2,900 萬種子輪,$5 億估值,團隊只有四個人。CTO 是前 Meta 生成式 AI 負責人 Alex Whedon。 他們發布的東西叫 Su...
claude-receipts — 把 Claude Code 的花費印成一張收據
你不知道你每天在 AI 上花多少錢。 這句話聽起來很誇張,但仔細想一下:你每天開幾次 Claude Code session?每次對話大概用多少 token?Opus 和 Sonnet 的價差有多大?cache hit 率怎麼樣?如果你回答不出其中任何一個問題,你其實是矇著眼睛在燒錢。 不是因為你不在意花費。是因為花費對你來說是不可見的。 超商收據哲學claude-receipts 做的事情很簡單:每次你結束一個 Claude Code session,它自動幫你印一張「收據」。 不是比喻。是真的收據——長得跟超商結帳的那張長長的紙一模一樣。上面列著你用了哪些模型、吃了多少 input / output / cache tokens、每個模型花了多少錢、session 總花費。你可以在瀏覽器看 HTML 版、在終端看 ASCII art 版,或者接上一台 Epson TM-T88V 熱感應印表機,真的把它印出來貼在牆上。 為什麼選收據這個形式?因為收據是人類已經建立了數十年的「消費認知介面」。你在超商看到收據上寫 $87,你立刻知道這代表什麼。但你看到「Op...
中部包棟民宿實戰指南 — 一個工程師的出遊選房攻略
36 間民宿。Google 評分 5.0 的有 6 間。最便宜的一晚 $4,980,最貴的 $36,050。價差 7.2 倍。 這不是業配,是我花了一整個週末,把苗栗、台中、南投三個地區的包棟民宿全部拉出來比較之後的結論。因為上個月公司部門旅遊,我被指派當「訂房組長」——工程師就是這樣,誰會寫 spreadsheet 誰就負責。 工程師為什麼需要包棟先講結論:包棟的 CP 值計算方式跟飯店完全不同。 飯店是「一間房 × 人數」,包棟是「一棟 ÷ 人數」。一棟 $21,000 的民宿,10 個人去,每人 $2,100。這個價格你在台中市區連商旅都訂不到。 但真正讓我覺得包棟香的原因不是價格。 是自由度。你可以凌晨三點在客廳開 code review(對,我們真的幹過這種事)。可以在烤肉的時候順便討論系統架構。可以讓不想社交的人安靜躲在房間,不用被迫參加大廳的團康活動。 對 remote worker 來說,包棟根本是 workation 的最佳解。一群工程師帶著筆電進去,白天各自在不同角落寫 code,傍晚一起烤肉,晚上打麻將或唱 KTV。工作與放鬆的邊界自己劃。 好,進入正題。 ...
AI 與科技新聞摘要 - 2026/05/09
三個月前值 $380B 的公司,現在有人出價 $900B。 不是股票市場的瘋狂——股票至少有流動性和公開揭露的義務。這是私募市場。一間還沒上市的公司,三個月翻了 2.4 倍。投資者的配額截止只給 48 小時,你連做 due diligence 的時間都沒有。在一個理性的世界裡,這叫做泡沫。在 2026 年,這叫做 AI 融資。 同一週,OpenAI 把預設模型換成幻覺減半的 GPT-5.5 Instant。聽起來是好消息?翻過來看:之前那個模型的幻覺率高到需要「減少 52.5%」才算夠好。而在前線,AI 寫的程式碼正在以每月六倍的速度製造新的 CVE。AI 平台自己也在被打穿。更深層的位移是——AI 正在改變漏洞發現的經濟學,攻擊者五年後可能找到超過一半的零日漏洞。 加速和破口,不是平行線。它們是同一條線的兩面。 Anthropic $900B 估值:當 ARR 從 $9B 跳到 $30B,估值公式還成立嗎?$50B 的融資輪。$850B 到 $900B 的估值。如果成案,Anthropic 將超越 OpenAI 在今年初的 $852B 估值,成為全球最高估值的 AI 公司。 ...
Project AIRI — 開源 AI VTuber 與虛擬角色平台
ChatGPT 能跟你聊天,但它沒有臉。它沒有聲音,不會在 Minecraft 裡幫你砍樹,更不可能幫你開冷氣。大部分人對「AI 虛擬角色」的認知停留在一個會動嘴的 Live2D 模型配上 TTS 念稿——那不是虛擬角色,那是投影片加語音朗讀。 Project AIRI 做的事不太一樣。37,000 顆星,全開源,讓你從零組裝出一個有腦、有耳、有嘴、有身體的數位生命。 不是聊天機器人,是「數位生命基礎建設」這個比喻可能有點大,但架構撐得起來。AIRI 把一個 AI 角色拆成幾個器官: 腦是 LLM,負責理解和生成語言。耳是語音辨識模組,即時聽你說話。嘴是 TTS 語音合成,把文字變成聲音回覆。身體則是 Live2D 或 3D 模型,讓角色有表情、有動作。 關鍵在「全套」。市面上多數方案讓你自己東拼西湊——這邊接一個 Whisper,那邊串一個 ElevenLabs,Live2D 另外搞——結果 latency 疊上去,對話體驗跟打國際電話一樣。AIRI 把這些全包進一個事件驅動的 WebSocket Hub,所有模組透過 server-sdk 連到中央的 server-runti...
Claude API Tool Use 完整教學 — 讓 AI 自己呼叫你的函式
一行 JSON,讓 Claude 從「只會聊天」變成「會查資料庫、打 API、寄信」。 這就是 Tool Use 在做的事。你寫好函式,告訴 Claude 這些函式叫什麼、吃什麼參數、幹什麼用——然後 Claude 自己決定什麼時候該呼叫哪個函式。你不用寫 if-else 判斷使用者意圖,不用做 NLP 解析。AI 自己看得懂。 聽起來很玄?其實整個機制就像你去一間餐廳。 餐廳類比:Tool Use 的運作邏輯你坐下來,服務生(Claude)遞給你菜單。菜單上每道菜都有名字、食材說明、價格(這是你定義的 tools)。你跟服務生說「我今天想吃清爽一點的」(這是 user message)。 服務生不會把所有菜都端出來。他會根據你的需求,選一道適合的菜,寫在點菜單上交給廚房(這是 tool_use 回應)。廚房做完之後把菜端回來(這是 tool_result)。服務生看到菜來了,跟你說「這是您的凱薩沙拉,搭配的是今天的特選醬汁」(這是最終回答)。 整個流程就四步: 你給菜單(定義 tools) 服務生點菜(Claude 回傳 tool_use) 廚房出菜(你執行函式,回傳 to...
AI 與科技新聞摘要 - 2026/05/08
五個國家。 美國 NSA 和 CISA、英國 NCSC、澳洲 ASD、加拿大 CCCS、紐西蘭 NCSC——五眼聯盟的資安機關上週聯合發了一份文件,標題叫「Careful Adoption of Agentic AI Services」。翻成白話:你們企業裡面那些 AI agent,已經拿到太多權限了,而且大部分人根本不知道它們在幹嘛。 這不是研究報告,是安全指南。五個國家的情報機關聯手告訴你一件事——AI agent 已經在你的關鍵基礎設施裡面跑了,而你的防禦體系還沒跟上。 同一週,Cloudflare 在重新發明 LLM 怎麼跑、Cognizant 在賣 agent 的安全管理服務、Google 讓 Gemini 的 RAG 升級到多模態、Apache 的 HTTP/2 被挖出一個可以遠端執行程式碼的洞。加速跟破口,照例同步進行。 Five Eyes 聯合 Agentic AI 安全指南:你的 Agent 拿了多少權限?五月一日發布,但真正被業界認真讀的是這幾天。 這份指南不是在講理論風險,是在描述現況。五眼聯盟的資安機構明確指出:基於大型語言模型的 AI age...
OpenScreen — 免費開源的 Screen Studio 替代品
螢幕錄製工具不缺。OBS 免費、Loom 方便、QuickTime 內建。但你錄出來的東西,跟 Product Hunt 上那些產品 Demo 影片比起來,差距在哪? 不是畫質。不是幀率。是美化。 那些漂亮的 Demo 影片有自動 zoom 跟隨你的游標、有漸層背景把視窗框起來、有 motion blur 讓鏡頭移動看起來更滑順。這些後製效果以前只有兩條路:自己開 After Effects 慢慢磨,或者每月花 $29 美金訂 Screen Studio。 OpenScreen 走了第三條路。MIT 授權、無浮水印、可商用。上線不到半年,GitHub 上累積超過 17,000 顆星。 錄影跟錄影,差在哪OBS 錄出來的是原始素材——你螢幕上發生什麼,它就忠實記錄什麼。OpenScreen 錄出來的是成品。 差別在於中間那一層「即時後製」。你點擊某個按鈕,畫面自動 zoom in 到那個區域,觀眾不用瞇眼找你在操作什麼。你的視窗背後不是桌面上一堆雜亂的圖示,而是乾淨的漸層色背景。畫面平移的時候帶著一點動態模糊,視覺上更流暢。 這些東西聽起來是細節,但細節決定了你的影片看起來像「工...
AI 與科技新聞摘要 - 2026/05/07
220,000 顆 GPU。 Anthropic 昨天簽下 SpaceX Colossus 1 資料中心的全部算力——300 百萬瓦、超過 22 萬顆 GPU,一個月內全面上線。同一天的開發者大會上,他們讓 AI agent 學會「做夢」:回顧過去的失敗,自己修正自己。 這兩件事要放在一起看。 算力是油門,自我修正是方向盤。光踩油門會撞牆,光有方向盤走不快。但兩個同時到位——你得認真想一下這台車會開到哪裡去。同一時間,企業防火牆被打穿、Copilot 開始限縮用戶、OpenAI 終於認真做帳號安全。加速和失控,永遠是一體兩面。 Anthropic Code w/ Claude 2026 SF — AI Agent 學會做夢「做夢」這個詞不是行銷話術,是功能名稱。 Anthropic 在 5 月 6 日舊金山開發者大會上發表了 Managed Agents 的三個新能力:Dreaming、Outcomes、Multi-agent orchestration。其中 Dreaming 最值得仔細看。 運作方式是這樣的:agent 跑完任務之後,不是直接歸零。一個排程背景程序...









