nuwa-skill — 別叫 AI 扮演高手,讓它學會高手是怎麼想的
想讓 AI 給你高手等級的建議,最沒效的一招,就是叫它「扮演一個高手」。
你大概都試過。在 system prompt 裡塞一句「你是查理·蒙格,請用他的智慧回答」,然後問它一筆投資該不該做。它回你一段四平八穩的話,提到護城河、提到能力圈、引了兩句聽起來很蒙格的格言。讀起來很像那麼回事,但你再追問一句「那如果這家公司的護城河正在被 AI 侵蝕呢」,它就露餡了——它只會把剛剛那幾個詞換個順序再講一遍。它記得這個人講過什麼,但完全不知道這個人遇到新問題時會怎麼想。
這就是模仿語氣跟移植思考的差別。而 nuwa-skill(女媧.skill)這個 Claude Code Skill,整個設計就是衝著後者去的。
它提取的不是金句,是「決策的骨架」
先把這件事講清楚,因為它是整個工具的地基。
一般的角色扮演,提取的是表層:語氣、口頭禪、招牌名言。這些東西在網路上一抓一大把,AI 學起來毫不費力,但也毫無用處——因為名言是結論,不是推導過程。你拿到結論卻拿不到那條導向結論的路,下次換個題目,你就接不上了。
女媧提取的是推導過程本身。同樣問「蒙格怎麼看這個投資」,它不會直接吐護城河三個字,而是先跑一遍逆向思考——「怎樣做這筆投資一定會賠錢」,把失敗路徑列出來,再從心理學、經濟學、生物學幾個角度交叉驗證,最後才收斂出判斷。你看到的不是一個答案,是一套你可以自己複用的思考流程。換成一個它從沒被問過的題目,這套流程照樣跑得動。費曼有句話放在這裡剛好:如果你教不了它,你就不懂它。女媧賭的就是——把一個人「怎麼想」教給 AI,比把他「說過什麼」餵給 AI 有用得多。
怎麼確保學到的是洞見,不是雞湯
這裡有個很現實的問題。網路上關於這些名人的內容,八成是雞湯——被轉了一萬遍、誰都能講、放諸四海皆準的正確廢話。如果蒸餾的時候照單全收,最後你得到的不是蒙格的腦袋,是一鍋心靈雞湯。
女媧的解法分三道工序,每一道都在過濾。
第一道是採集。它不是隨手 Google 一下,而是同時派出六個 Agent,各自負責一個方向:本人著作、播客訪談、社群發言、他人的批評、實際做過的決策、人物時間線。六份結果合併交叉比對才往下走。而且來源有分級——本人著作權重最高,二手轉述最低,知乎、百度百科那種地方直接排除在外。光這一步就把大半雜訊擋掉了。
第二道是驗證。一個觀點想被收錄成「心智模型」,得同時通過三關:在兩個以上不同領域都出現過(跨域復現)、能拿來推斷這個人對新問題的立場(生成力)、而且不是「所有聰明人都這樣想」的通用道理(排他性)。只過一兩關的,降級成普通的決策參考;一關都沒過的,丟掉。
第三關那個「排他性」是整套設計最關鍵的一刀。它直接問:這條觀點,是這個人獨有的,還是隨便哪個成功人士都會講的?如果答案是後者,那它就是雞湯,再漂亮也留不下來。雞湯跟洞見的差別,從來不在於對不對,而在於有沒有區辨力——能套在任何人身上的話,等於沒說。
五層往下挖
通過驗證的材料,會被拆進五個層次來描述一個人。表達 DNA(語氣節奏用詞)、心智模型(認知框架,每人三到七個)、決策啟發式(if-then 規則,五到十條,像「不能持有十年就別持有十分鐘」這種)、反模式(什麼事打死不做)、誠實邊界(明確標出他做不到什麼,例如巴菲特不碰科技股)。
最後那一層特別值得停一下。大部分人介紹一個高手,只講他擅長什麼;女媧硬是要你標出他「不碰什麼」。這其實是更深的理解——知道一個人的能力圈邊界在哪,比知道他圈內有多強更難,也更有用。一個只會告訴你「什麼都能分析」的 AI 顧問,跟一個會說「這題超出他的能力圈,他不會給意見」的 AI 顧問,後者才像真的學到了那個人。
裝起來大概長這樣
安裝很直接,一行指令的事:
1 | # 裝女媧本體(之後可以自己蒸餾新人物) |
裝完之後,在 Claude Code 裡用自然語言就能呼叫。「用蒙格的視角幫我分析這個投資決策」、「費曼會怎麼解釋 Raft 共識演算法,假設我只懂基本網路概念」、「切換到 Naval,我在猶豫三件事的優先順序」。它甚至吃得下模糊需求——你只說「我想提升決策品質」,它會反過來建議你該蒸餾哪個人物來裝。
想蒸餾一個現成清單裡沒有的人?也是一句話的事:「幫我做一個張小龍的視角 Skill」。它就會跑那套六路採集加三重驗證的流程,自己長出一個新的人格 Skill 放進 .claude/skills/。目前官方蒸餾好、可以直接裝的有十三個人物——Paul Graham、Karpathy、Ilya Sutskever、MrBeast、賈伯斯、馬斯克、蒙格、費曼、Naval、塔勒布等等。每個都附完整的調研文件,你可以一路追到每個心智模型背後的證據來源。
說個我自己的用法。這個部落格的寫作流程,背後就掛著一張「文章類型對應思想家」的對照表——技術工具文走 Paul Graham 的簡潔視角,新聞分析走塔勒布的風險眼,理財文走蒙格的多元思維。那張表的底子,正是從女媧蒸餾出來的八個人物來的。我不是讓文章去「模仿」誰講話(那反而會很假),而是借他們的認知鏡頭來決定一篇文章該從哪裡切入、該怎麼推進。用下來最大的體會是:換鏡頭比改措辭有用太多了。
它學不到的那一塊,也老實標了出來
工具講到這份上,最容易讓人過度樂觀,所以得把醜話說在前面——而且難得的是,這些醜話官方自己就標了。
蒸餾不了直覺。框架可以提取,靈光一閃不行。Skill 學得到一個人「怎麼一步步推理」,學不到他「為什麼突然就想到了」。公開不等於真實——所有材料都來自公開管道,一個人私下真正怎麼想,可能跟他公開講的完全是兩回事。冷門人物效果差,公開資訊少於十條的,心智模型會縮到剩兩三個,而且會老實標成「基於有限資訊推測」。還有最實際的一條:六個 Agent 並行加多輪驗證,一次完整蒸餾頗吃 token 跟時間,不是按一下就有。
原文來源:alchaincyf/nuwa-skill(MIT 授權,啟發自 colleague-skill)
把這些限制擺在一起看,反而更能看清這工具真正的位置。它不是要給你一個「數位版的蒙格」隨時待命幫你做決定——那種承諾本身就該打個問號。它做的事樸實得多:把一個人公開展示過的思考方式整理成一套你能反覆套用的流程。
而這恰好點出一件容易被忽略的事。當 AI 讓「模仿任何人講話」變得幾乎免費,模仿的價值就趨近於零了——誰都能讓 ChatGPT 假裝成蒙格講兩句。真正搬不動、也最稀缺的,是面對一個誰都沒見過的新問題時,那套「該先問什麼、再排除什麼、最後憑什麼下判斷」的流程。名言會過期,金句會被講爛,但一套好的提問順序不會。值得你費勁去複製的,從來不是高手的答案,是他們走向答案的那條路。









