系列精選
查看全部外送又要漲了 — 工程師三餐該外送、外食還是自煮的一套判準
你叫一份 180 塊的便當外送,那間店實際拿到手的,可能只剩 120。 中間那 60 塊去哪了?平台抽走了。台灣主流外送平台對店家的抽成,平均落在每單 30% 到 35%,這還沒算上架費、每月使用費、買曝光的廣告費。店家不是慈善機構,這些成本最後一定會反映在菜單價格上——所以你在外送 App 上看到的那份便當,本來就比你走進店裡點貴了一截。你以為外送費只是那筆「運費 39 元」,其實餐點本身早就被偷偷加了價。 而這筆帳,7 月之後還要更貴。 先搞懂這次到底漲什麼台灣的「外送專法」7 月正式上路。趕在新法之前,Uber Eats 先開了第一槍:7 月 21 日起調漲對商家的服務費,美食類漲 2.5 個百分點、生鮮雜貨漲 3 個百分點,設了個 35% 的上限。foodpanda 暫時按兵不動,說還在「審慎評估」——但業界普遍認為,這只是時間問題。 表面上漲的是「商家服務費」,跟你這個消費者好像沒關係。別天真。商家的成本一往上加,最後幾乎都會傳導到你點的那份餐上,差別只在多快、多明顯。 更有感的是另一件事:疊單。你可能沒注意過,平台把順路的訂單併在一起送(疊單),根據內政部統計,這個機...
FunASR — 中文語音辨識,以前要拼四個工具,現在一行 API 全包
想在自己的 Mac 上,把一段三小時的會議錄音變成一份能直接讀的逐字稿,過去你得先當一次系統整合商。 先抓 OpenAI 的 Whisper 來轉文字。轉完一看,中文的字錯率大概 5%,每隔幾句就要回去校一個同音字;而且它吐出來的是一坨沒有標點的長文,得再接一個標點恢復模型把句子斷開。逐字稿要標「誰在講話」,Whisper 不管這件事,你還得另外裝 pyannote 做說話人分離。錄音有三小時這麼長,丟整段進去會爆記憶體,所以前面還得先放一個 VAD 把沒人講話的空白段切掉。 四五個工具,四五種輸入輸出格式,你花在「把它們縫成一條線」的時間,比花在辨識本身還多。這才是中文語音辨識真正惱人的地方——不是哪個模型不夠強,是沒有人把這條線幫你接好。 pip install funasr。這一行,就是來把上面那整段流程收掉的。 一個容器,不是一個模型FunASR 是阿里巴巴達摩院開源的語音辨識工具包,GitHub 上 15K 顆星,程式碼走 MIT 授權。它最該先理解的一點是:它不是「又一個語音模型」,而是一個容器。 裡面裝了一整排各司其職的模型——Paraformer 負責辨識、Sen...
AI 與科技新聞摘要 2026.06.28
這禮拜值得記的新聞,沒有一條是「某個模型又變強了」。真正在動的,是一批大家以為早就焊死了的優勢——晶片的壟斷、市佔的霸主、人才的金庫——在同一個禮拜裡,一起開始鬆動。 護城河這個詞,被講得好像是一條挖好了就永遠在那裡的溝。這禮拜的幾條新聞放在一起,提醒你一件相反的事:護城河是水做的,水會被引到別的地方去。 一、高通出價百億美元,想買下 NVIDIA 看不到的那塊死角第一條,是有人準備從 NVIDIA 的盲區切進去。據《The Information》與路透 6 月 15 日的報導,高通正在深度洽談,要以 80 到 100 億美元收購 Tenstorrent——晶片界傳奇架構師 Jim Keller 帶領的 RISC-V AI 晶片新創。到 6 月 24 日高通的投資人日,這筆交易仍未獲證實,但同一天高通透露,年底前就會開始向一家大型雲端業者出貨自研晶片。 值得停下來看的是價格。一年前,Tenstorrent 募資時的估值還是 32 億美元;現在開價衝到 100 億,一年跳了快三倍。這個數字撐起來的不是它的營收——它的營收還很小——撐起來的是「稀缺性」。在一個 NVIDIA 自研晶...
工程師久坐不是腰痠而已 — 身體在你坐著時偷偷關掉了什麼
先別管要不要去辦健身房。先問一個更基本的問題:你坐著寫 code 的那幾個小時,身體裡到底發生了什麼? 大部分人對久坐的理解停在「腰會痠、肩會硬」。那只是你感覺得到的部分。真正麻煩的東西,是你完全感覺不到、卻在背景默默累積的那些。把這台機器打開來看一遍,你會對「怎麼動才有用」這件事有完全不同的想法。 久坐的第一件事:身體進入待機降頻MacBook 偵測到你閒置,會自動降頻、調暗螢幕、把風扇轉慢。它不是壞了,是「以為你不需要那麼多火力」,主動把供能調低。 人體坐久了,幹的是一模一樣的事。長時間沒有肌肉收縮,血液循環會慢下來、變得濃稠,身體判斷「這傢伙現在不太需要能量」,於是進入一種節能模式:送到大腦的氧氣和血糖效率都降低。這就是為什麼你坐了兩三個小時之後,會開始頭昏腦脹、思緒卡關、盯著同一行 code 看半天看不進去。那不是你不夠專心,是你的硬體被降頻了。 對工程師來說這特別諷刺。我們靠腦袋吃飯,卻用一種會讓腦袋供能變差的姿勢,一坐就是一整天。 第二件事:你的身體偷偷對胰島素變遲鈍降頻只是當下的事,下面這件是會累積的。 身體細胞要把血糖收進去用,靠的是胰島素發信號。肌肉是吃血糖的大...
AI 與科技新聞摘要 2026.06.27
如果「用掉多少 token」一度是團隊生產力的勳章,那當這個勳章開始變成財報上的麻煩,最先慌的會是誰? 這週值得記的新聞,沒有一條是「某個模型又變強了」。真正在動的,是大家對「該用多少 AI」這件事的信仰。 一、tokenmaxxing 退潮:燒最多 token 曾是榮譽,現在是失控過去一年有個詞悄悄流行,叫 tokenmaxxing——員工被鼓勵盡可能多用 AI,不管產出有沒有用,把 token 消耗量當成生產力的代名詞。Meta 和 Amazon 內部甚至有排行榜,比誰燒得多。Uber 的 COO 五月公開講了重話:token 用量的成長,跟產品真的變好之間,「那條線還不存在」。 數字開始打臉這套信仰。Uber 對部分 AI 工具設了每月 1,500 美元起跳的分級額度,因為它的 CTO 四月承認,整年的 AI 預算在四個月內就燒光了。企業數據平台 Entelligence.AI 彙整 2,444 家公司的資料,算出來每花 1 美元在 token 上,真正觸及終端使用者的價值只有 0.18 美元。 最戲劇性的是新創 Lindy。它的 CEO 這個月把公司 100% 的流量從 ...
Huashu Design — AI 設計醜得像複製貼上,問題從來不在模型不夠聰明
AI 設計做出來的東西很醜,但醜的原因不是它笨。 你大概看過這個畫面。叫 AI 設計一個 App,它回你紫色漸變的背景、幾個 emoji 當 icon、圓角卡片再配一條彩色的左邊框。乾淨、能看,但沒有一個真的品牌會把這種東西放上線。設計圈給它取了名字,叫 AI slop——AI 量產出來的視覺垃圾。 直覺的歸因是「模型品味差」。可是同一個模型,你叫它寫一段並發處理的程式碼,它能寫得有模有樣;你叫它幫你 debug 一個 race condition,它能講出個道理。寫程式的時候它一點都不笨,換到設計就崩。同一顆腦袋,差別到底在哪? 差別在於:寫程式有大量明文規則,設計沒有。 醜不是審美問題,是規則缺席問題一個資深設計師看到「紫漸變加 emoji 圖示」會皺眉,但你問他為什麼不行,他多半只會說「就是不對」「沒質感」。這就是麻煩的地方——設計師的判斷力大多是隱性知識,存在他的手感裡,沒有被寫成一條條可以照做的規則。模型學不到沒被寫下來的東西。它看過的訓練資料裡,紫漸變加 emoji 出現了一百萬次,那它當然覺得這就是「設計」。 把這件事想透,AI slop 就不是模型缺陷,是知識缺陷...
Claude Code Sandbox 完整教學 — 讓 AI 自己跑指令,又不用怕它 rm 到不該動的地方
Claude Code 用起來最磨人的那個瞬間,是它每跑一個 npm test、每 mkdir 一個資料夾,都要停下來問你一次 yes or no。一個任務跑下來,光是按 Enter 確認就按到手痠,那個「自己幫我把事情做完」的爽感,全被這些彈窗切碎了。 於是你一氣之下,開了 --dangerously-skip-permissions。世界瞬間清靜,它再也不問了,咻咻咻把事情做完。爽是爽,但你心裡有個聲音一直沒消失:它現在等於拿到了你整台電腦的全部權限。哪天它為了「清一下快取」,rm -rf 到一個你完全不想它碰的目錄,或者哪個被它裝下來的套件偷偷把你 ~/.ssh 裡的金鑰往外送,你連攔都沒得攔。 一邊是煩到不想用,一邊是怕到不敢放手。大部分人就在這兩個極端之間反覆橫跳。Claude Code 的 Sandbox(沙箱化 Bash 工具) 想給的,是中間那條一直缺的路。 先搞懂它跟「按 yes/no」根本不是同一回事要看懂 sandbox 為什麼能同時解掉「煩」跟「怕」,得先分清楚兩種完全不同的安全做法。 「每次問你 yes/no」這套,本質是事前審查:在...
AI 與科技新聞摘要 20260626
6 月 18 號那天,有人在終端機裡敲了一行用了一年的 gemini 指令,回他的不是結果,是一句通知:這個 CLI 已經停止服務,請改用 Antigravity CLI。一個你天天靠它幹活的工具,沒有壞、沒有出 bug,就這樣被它自己的母公司收掉了。 把這禮拜的幾條新聞排開來看,會發現它們其實是同一個動作的不同版本——大的,正在把小的、把工具、把晶片、甚至把自己的命運,一個個收進更大的盤子裡。整併這件事報導起來總是很風光,講的是規模、是版圖、是誰又更強了。但站在使用者這一邊,每一次收編,抽走的都是你手上原本還有的一個選項。 一、Google 把自家的 Gemini CLI 退役,逼你搬到 Antigravity故事得從 5 月講起。Google 在 I/O 大會推出了 Antigravity 2.0,一套主打多代理協作的開發套件,裡頭有個用 Go 重寫的 Antigravity CLI。當時大家以為它是「多一個選擇」。結果到了 6 月 18 日,答案揭曉:Gemini CLI 直接停止服務,它的功能被 Antigravity CLI 整碗吸收進去,原本建在 Gemin...
video-use — 剪一支片,從在時間軸上拖三小時退化成講一句話
剪片這件事,工具換了一代又一代,可是你坐在電腦前要做的那個動作,二十年來幾乎沒變過:在一條時間軸上,把素材拖來拖去。 Premiere、Final Cut、DaVinci Resolve,介面一個比一個漂亮,軌道一個比一個多。但核心互動還是那一套——你用滑鼠,一刀一刀,在時間軸上對齊、裁切、疊加、調色。學會它要花多久?去問任何一個幫朋友剪過婚禮影片的人就知道,那個單位是「週」,不是「小時」。剪輯軟體真正的門檻,從來不是買不買得起,是那條時間軸本身就是一門要練的手藝。 第一次鬆動:把影片變成一篇可以刪字的稿子真正動搖這件事的,是 Descript。 它做了一件當年看起來有點怪的事:把你的影片先轉成逐字稿,然後讓你「編輯文字」。你在稿子裡刪掉一句講壞的話,對應的那段影片就跟著被剪掉了;你把兩段話的順序對調,畫面也跟著重排。剪片第一次不再是拖時間軸,而是改一篇 Word 文件。 這一步的聰明,在於它找對了影片裡「資訊密度最高」的那層東西。一段 talking head 影片,畫面其實沒什麼變化——一個人坐在那裡講話,背景、光線、構圖整段都差不多。真正承載「這支片在講什麼」的,是聲音轉出...
Claude for Foundation Models 完整教學 — 同一段 Swift,今天跑裝置端小模型,明天換 Claude 只改一行
先別急著問它能拿來做什麼。先看一件乍看不合理的事:Apple 自己的 AI 框架,居然能拿來跑 Anthropic 的 Claude。 兩家公司、兩套東西,照理說井水不犯河水。可是 WWDC 2026 之後,你在 iOS app 裡寫的那段呼叫 AI 的程式碼——本來是驅動 Apple 裝置上那顆小模型的——只要改一行,底層跑的就變成 Claude,而且 respond(to:)、streaming、工具呼叫,整套用法一個字都不用改。這怎麼可能? 搞懂這個「怎麼可能」,比記住怎麼裝套件有用一百倍。因為它背後那招,根本不是 iOS 專屬的魔法,是一個你寫任何系統都用得上的老智慧。 先看它收到一個請求之後,第一件事去問誰把框架打開,最核心的一個東西叫 LanguageModelSession。你跟 AI 講話,都是透過它: 123let session = LanguageModelSession(model: someModel)let response = try await session.respond(to: "幫我想一個送科幻迷的禮物")print(r...









