系列精選
查看全部Claude for Foundation Models 完整教學 — 同一段 Swift,今天跑裝置端小模型,明天換 Claude 只改一行
先別急著問它能拿來做什麼。先看一件乍看不合理的事:Apple 自己的 AI 框架,居然能拿來跑 Anthropic 的 Claude。 兩家公司、兩套東西,照理說井水不犯河水。可是 WWDC 2026 之後,你在 iOS app 裡寫的那段呼叫 AI 的程式碼——本來是驅動 Apple 裝置上那顆小模型的——只要改一行,底層跑的就變成 Claude,而且 respond(to:)、streaming、工具呼叫,整套用法一個字都不用改。這怎麼可能? 搞懂這個「怎麼可能」,比記住怎麼裝套件有用一百倍。因為它背後那招,根本不是 iOS 專屬的魔法,是一個你寫任何系統都用得上的老智慧。 先看它收到一個請求之後,第一件事去問誰把框架打開,最核心的一個東西叫 LanguageModelSession。你跟 AI 講話,都是透過它: 123let session = LanguageModelSession(model: someModel)let response = try await session.respond(to: "幫我想一個送科幻迷的禮物")print(r...
AI 與科技新聞摘要 20260625
模型又快了幾趴、benchmark 又被誰刷新——這種新聞每週都有,看久了會麻痺。這禮拜真正值得停下來的,是另一條更安靜、也更難回頭的線:當所有人的模型能力都逼近天花板,戰場就不再是「誰更聰明」,而是「這份聰明到底歸誰」。能力可以被偷、算力可以被斷、組織的知識可以長在別人的伺服器裡。把這禮拜幾條排開來看,主角全是這件事。 一、Anthropic 直接點名阿里巴巴:史上最大規模的「偷能力」行動6 月 24 日這條新聞的份量,遠超過一般的公司互槓。Anthropic 寫了一封信給美國參議院銀行委員會,指控與阿里巴巴 Qwen 實驗室有關的操作者,在 4 月 22 日到 6 月 5 日之間,用大約 25,000 個假帳號,對 Claude 發動了 2,880 萬次的對話交換——目標很精準,全衝著 Claude 最值錢的兩項能力去:軟體工程跟 agentic 推理。 這在業界叫「蒸餾」(distillation):你不用自己訓練一個頂級模型,只要不停餵問題給對手的模型、把它的回答收集起來,拿這些回答去訓練一個便宜很多的山寨版,就能逼近原版的能力。Anthropic 今年 2 月才抓過 D...
Hermes Agent — 你要的是一塊 AI 積木,還是一個會學習的常駐助理
先問你一個問題,答案會決定下面這篇你要不要看完:你想要的,到底是一套可以自己拼出 agent 的零件,還是一個開機就能用、而且會記住你的助理? 這兩個聽起來很像,其實差了一整個層級。大部分人卡住的點不是「哪個工具比較強」,是根本沒分清楚自己要的是哪一種,於是抱著 LangChain 的文件啃了三天,才發現自己想要的東西它本來就不打算給你。 Hermes Agent 就是站在另一邊那個答案。Nous Research 在 2025 年底開源它,口號是「The agent that grows with you」,七週內衝破 11 萬顆 GitHub 星,成長曲線比當年的 LangChain、AutoGen 都陡。但星星數不是重點,重點是它選了一條跟那些框架完全相反的路。 積木和電器的差別你用過 LangChain 或 AutoGen 的話,會知道那是一種「嵌進你 Python 程式裡的函式庫」。你得自己寫 code 把 agent 串起來,每跑一次都從零開始,沒有記憶、不會學習,想接到 Telegram 或 Discord 還得自己刻整合層。它給你的是積木,怎麼拼、拼成什麼,全是你...
Claude Code 你的 command 其實已經變成 skill 了 — 統一指令模型完整教學
以前你想在 Claude Code 裡自訂一個 /指令,做法很單純:在 .claude/commands/ 底下丟一個 markdown 檔,寫好你要它做的事,存檔,下次打 /那個檔名 就會跑。很多人——包括我——的 .claude/commands/ 裡都躺著一疊這種小抄:/commit、/review、/standup,各自包一段你懶得每次重打的 prompt。 現在你打開官方文件想找 commands 那一頁,會發現它不見了。不是被砍掉,是被併進了另一個東西——Skill。官方很明確地講了這句話:commands 跟 skills 現在是同一個東西了。你舊有的那些自訂指令,沒有消失,它們全都「變成」skill 了。 這個合併乍看只是改名換湯,但搞懂它為什麼要合併,比記住新語法有用得多。 先用一個比方說清楚差在哪把 Claude 的工作空間想成你的辦公桌。 舊的 command,像是你貼在螢幕邊框上的便利貼。它有個好處:隨時看得到,伸手就用。但壞處是——不管你今天用不用得到,它都一直黏在那裡佔著視線。十張便利貼貼上去,螢幕邊框就被塞滿了,每一張都在分掉你(其實是分掉 Clau...
AI 與科技新聞摘要 20260624
過去這幾天,幾家 AI 工具不約而同動了同一個地方——不是功能,是帳單。 能力線還是照常往上爬,誰家又快了幾趴、benchmark 又刷新了,這種新聞每週都有。但真正值得停下來看的,是另一條更安靜的線:你用這些工具到底要付多少錢、錢怎麼算、以及這些錢一路往上游流,最後押在了誰身上。把這禮拜的幾條排開來,主角全是「錢」。而錢的事,往往比功能的事更早決定你明年還用不用得起手上這套工具。 一、GitHub Copilot 改成用量計費,用戶在吵「幾個 prompt 就燒光了」從 6 月 1 日起,GitHub Copilot 全面轉成用量計費(usage-based billing)。每個付費方案改成附一筆月度的 AI Credit 額度——Pro 方案 10 美元、Pro+ 39 美元——超過就按各模型的 token 費率往下扣,連 Copilot 幫你 review code 都要額外吃掉 GitHub Actions 的分鐘數。同時官方準備收掉年費方案,社群討論區一片哀號,不少人反映那點月額度「跑幾個比較重的 prompt 就見底了」。 數字上 Copilot 還是巨無霸——超過...
nuwa-skill — 別叫 AI 扮演高手,讓它學會高手是怎麼想的
想讓 AI 給你高手等級的建議,最沒效的一招,就是叫它「扮演一個高手」。 你大概都試過。在 system prompt 裡塞一句「你是查理·蒙格,請用他的智慧回答」,然後問它一筆投資該不該做。它回你一段四平八穩的話,提到護城河、提到能力圈、引了兩句聽起來很蒙格的格言。讀起來很像那麼回事,但你再追問一句「那如果這家公司的護城河正在被 AI 侵蝕呢」,它就露餡了——它只會把剛剛那幾個詞換個順序再講一遍。它記得這個人講過什麼,但完全不知道這個人遇到新問題時會怎麼想。 這就是模仿語氣跟移植思考的差別。而 nuwa-skill(女媧.skill)這個 Claude Code Skill,整個設計就是衝著後者去的。 它提取的不是金句,是「決策的骨架」先把這件事講清楚,因為它是整個工具的地基。 一般的角色扮演,提取的是表層:語氣、口頭禪、招牌名言。這些東西在網路上一抓一大把,AI 學起來毫不費力,但也毫無用處——因為名言是結論,不是推導過程。你拿到結論卻拿不到那條導向結論的路,下次換個題目,你就接不上了。 女媧提取的是推導過程本身。同樣問「蒙格怎麼看這個投資」,它不會直接吐護城河三個字,而是先...
教 Claude 守規矩的七種方法 — 把指令放對地方,比寫得漂亮更重要
你寫了一條規矩想叫 Claude 遵守——比方說「改完程式碼一定要跑 lint」。問題來了:這句話到底該寫在哪? 寫進 CLAUDE.md?做成一個 skill?還是設一個 hook?大部分人卡住的地方不是「指令寫得好不好」,是根本沒意識到「放哪裡」本身就是一個決定,而且這個決定常常比措辭重要得多。同一句話,放對地方它每次都生效,放錯地方它可能整場對話都沒被讀到一次。 6 月 18 日 Anthropic 出了一篇官方文章,把引導 Claude 行為的方法整理成七種:CLAUDE.md、rules、skills、subagents、hooks、output styles,還有直接改系統提示。乍看像七個功能等你挑,其實不是——它們是七個抽屜,每個抽屜裝的東西、開的時機都不一樣。搞懂該往哪個抽屜放,這篇就值了。 先用一個比方把七個抽屜串起來想像你開了一家公司,今天進來一個新員工,你要讓他照規矩做事。你會怎麼傳達? 最基本的,你給他一本員工手冊,放在桌上,每天上班都看得到——公司在幾樓、用什麼打卡系統、程式碼風格長怎樣。這就是 CLAUDE.md:它在每次對話一開始就載入,整場都待在那...
AI 與科技新聞摘要 20260623
你有沒有想過,當一個工具強到可以「自己跑下去不用你盯」的時候,出事的責任算誰的? 這禮拜的幾條新聞排開來,主角不是哪個模型又刷新了哪個分數。能力線一如往常往上爬,真正在動的,是「讓 AI 自己動手、自己跑久一點、自己決定下一步」這件事——而且是各家一起往這個方向推。問題在於,油門踩得越深,那個「萬一它跑歪了誰來踩煞車」的位子,反而越來越空。 一、OpenAI 讓 Codex 自己跑到目標達成才停6 月 22 日,OpenAI 一口氣給 Codex 加了幾個讓它「更會自己跑」的功能。Goal mode 全面開放——你給它一個結果跟成功條件,它就一輪一輪做下去,不用你每一步都下指令,直到它自己判斷達標。同時上的還有 macOS 的 Appshots:一個快捷鍵就能把某個 app 視窗連同截圖跟可讀文字塞進 Codex 的對話,讓它直接「看到」你在看什麼,省掉一長串描述。再加上專為長時間任務優化的 Codex-Maxxing,整套更新的方向只有一個——把人從迴圈裡拿掉得越多越好。 這跟 Claude Code 早就在做的事是同一條路。值得記下來的不是「誰抄誰」,而是這個產業已經悄悄達成...
一動就扣分的線上自習室 — StudyClassRoom 用遊戲規則逼你乖乖坐好
「有人在旁邊一起讀,你就比較坐得住」這件事,比任何一款專注 app 都老。 考前去圖書館佔位、跟同學約咖啡廳寫報告、甚至只是把書攤在客廳讓家人看得到——你做這些,理由其實一樣:你知道自己一個人關在房間,十分鐘就會摸到手機。旁邊有個人在認真,你會莫名其妙也跟著認真起來。心理學給這個現象取了個名字,叫 body doubling,但名字不重要,重要的是它真的有效,而且每個準備過考試的人都親身驗證過。 問題是,這幾年大家越來越多時間是一個人待在家裡的。圖書館遠、咖啡廳吵、同學各自在不同城市。於是有人想把「旁邊有人」這件事搬到線上——最直接的做法是開視訊,像 Focusmate 那樣,跟一個陌生人對著鏡頭各讀各的五十分鐘。能用,但總覺得哪裡怪:你得一直開著鏡頭,怕自己看起來在發呆,那份壓力跟「專注」其實是兩回事。 StudyClassRoom 是另一種切法。它沒有用視訊,而是用一個遊戲引擎。 把自習室做成一款 2D 遊戲它是用 Godot 4.4 做的——對,就是那個做獨立遊戲的引擎。你跟朋友連進同一個 2D 虛擬教室,每個人在裡面有個角色,設定好自己要專注的時間(1 到 180 分鐘,...
Claude Code Artifacts 完整教學 — 把一次 debug 過程變成同事點開就懂的網頁
事情是這樣的。你花了一個下午用 Claude Code 追一個詭異的 bug,查了五六個檔案、比對了 git log、最後定位到某個 race condition。事情解掉了,但同事問你「怎麼查到的」,麻煩來了。 你試了三種方式。第一種是截圖貼 Slack——terminal 的輸出又長又黑,截出來一張比一張醜,貼了五張之後對方已經滑過去了。第二種是把 terminal 內容複製貼上——一坨純文字,沒有重點、沒有顏色、沒人想讀。第三種是認命開一頁 Notion,手動把調查過程重打一遍、貼上關鍵 diff——花的時間比 debug 本身還久,而且你隔天就不想維護它了。 問題的本質是:你手上有一堆「看比讀快」的東西(標註過的 diff、一張錯誤次數的圖、幾個方案的對照),但你只有「純文字」跟「截圖」兩種爛掉的容器可以裝它們。Claude Code 在 6 月 18 日加進來的 Artifacts,補的就是這個洞——它讓 Claude 把這次 session 的成果,直接發布成一頁可以分享的網頁。 先弄懂一件事:它是「快照」,不是「應用程式」在學怎麼用之前,得先把一個觀念擺正,不然你會...









