$60 美金和 8 週的時間。

這是 VirtualMe 宣稱「複製你」的全部成本。市面上那些「打造你的 AI 分身」課程要價 $3,000 到 $5,000,本質上就做三件事:填一份人格問卷、串一個 LLM API、加上同儕壓力讓你不要中途放棄。VirtualMe 把這三件事拆開重組,然後做了一個根本性的改動——把問卷換成訪談。

這個改動不是包裝差異。它改變了萃取出來的東西。

填問卷的問題

你填過那種「你是什麼類型的人」問卷嗎?每次填,你其實是在寫「你覺得自己應該是什麼樣的人」。這叫表演式人格——你不自覺地寫出理想中的自己,不是真實的自己。

Stanford 的 Joon Park 等人在 2024 年做了一個實驗(arXiv:2411.10109)。他們用 2 小時訪談搭配 LLM,達到了 85% 的人格重現準確度。關鍵在於:訪談會追問。你說「我重視效率」,訪談者會問「上次你為了效率犧牲什麼?」,你閃躲,它會從另一個角度再問。問卷不會追你,訪談會。

VirtualMe 把訪談拉到 4 到 6 小時,分散在 8 週裡面(每週 30 分鐘),遠遠超過那個研究的門檻。

R1 到 R5:五層追問

VirtualMe 的訪談不是隨便聊天。它有一套叫 R1 到 R5 的追問決策樹:

R1 問事實——你做了什麼。R2 找模式——你常這樣做嗎。R3 挖原則——為什麼這樣做。R4 找反例——什麼時候你不會這樣。R5 是三角校驗——同一個原則必須在三個以上不同問題裡都浮現,才算數。

每個回答會被 Claude Haiku 即時分類:META 是跳脫話題,EVASION 是迴避,THIN 是太淺,SUFFICIENT 才是夠深。只有通過三角校驗的錨點才會寫入你的人格檔案。

這個設計解決了一個很真實的問題:你某天心情好說的話,不代表你真的是那樣的人。三角校驗逼出來的才是穩定的行為模式。

8 個 Markdown 檔案,就是你

萃取結果存成 8 個 .md 檔案。這是你的「數位人格資產」:

SOUL.md 放核心價值觀與信念。VOICE.md 記錄說話風格和用詞習慣。SKILL.md 存領域專業知識。PEOPLE.md 描述你的人際關係模式。HISTORY.md 是人生重要經歷。JOURNAL.md 記近期狀態。BOUNDARIES.md 標注不該碰的話題。STATE.md 是當前心理狀態。

這裡有一個設計哲學值得注意:它選了 markdown 而不是向量資料庫。

向量資料庫把你變成一堆浮點數,你看不懂、改不了、搬不走。Markdown 是明文——你可以用任何編輯器打開、修改、刪除。你的人格檔案是你自己的 .md 檔,不是平台黑箱裡的 embedding。這個選擇犧牲了一些語意搜尋的精確度,但換來了完全的可見性和控制權。

三層模型路由

VirtualMe 不是全程燒最貴的模型。它根據任務分配不同等級:

Claude Opus 4.7 只用在面對使用者的訪談回覆——這是品質不能妥協的地方。Claude Sonnet 4.6 處理錨點萃取和追問生成,中間地帶,夠聰明也夠便宜。Claude Haiku 4.5 跑大量的深度分類和初步判斷。

這就像蓋房子:你不會用花崗岩鋪地基,但客廳地板你捨得花錢。每一層用最適合的材料,而不是最貴的。

整個 8 週跑下來,API 成本約 $50 到 $60。

PPA:讓回覆更像你

VirtualMe 實作了一個叫 PPA(Post Persona Alignment)的三階段回覆管線。它基於 EMNLP 2025 的論文:

第一步,用 Haiku 先生成一個通用回覆。第二步,拿這個回覆去比對你的 persona triples,找出最相關的人格片段。第三步,用 Sonnet 結合人格片段重新精煉回覆。

加上 Persona Reinjection——每隔 N 輪自動重新注入身份錨點——盡可能延緩長對話中的人格漂移。注意是「延緩」,不是「解決」。長對話中人格會慢慢退化成模型的預設行為,這是 prompt-layer 方案的結構性天花板。

盲測:50% 就能出貨

第 5 週和第 8 週各有一輪盲評。系統產出幾個情境回覆,混入真人和 AI 的版本,讓你猜哪個是 AI 寫的。

出貨門檻是 50% 到 60% 準確度——接近亂猜。如果你分不出哪個是 AI 哪個是你自己,表示萃取成功。

1
2
3
4
5
# 準備第 5 週盲測材料
python -m virtualme.blind_test.prepare \
--db sqlite:///./data/virtualme.db \
--interviewee yourself \
--week 5 --out ./exports/blind-test

快速上手

系統需求是 Python 3.11+ 和一把 Anthropic API key。

1
2
3
4
5
6
git clone https://github.com/MakiDevelop/VirtualMe.git
cd VirtualMe
pip install -e ".[dev]"
cp .env.example .env
# 編輯 .env,填入 ANTHROPIC_API_KEY
python scripts/init_db.py --path ./data/virtualme.db

CLI 模式不需要 LINE,直接在終端機跑訪談:

1
python -m virtualme.cli --interviewee yourself

目前只支援從 source 安裝,還沒上 PyPI(v0.1.0 alpha)。這代表它還很早期。

誰適合用

技術人員自我萃取:Fork repo、自己跑 8 週,產出的 agent 幫你草擬 LinkedIn 貼文、回覆 DM、篩選 incoming 訊息。

幫非技術朋友建 agent:你當 Operator,受訪者只需要每週在 LINE 上聊 30 分鐘。

個人知識備份:就算不拿來跑 agent,光是那 8 個 markdown 檔案本身就有價值——一份結構化的「你是誰」檔案。

該知道的限制

第一,它是 prompt-layer 方案,不是 fine-tune。對抗性輸入和超長對話的一致性有結構性天花板。

第二,8 週承諾不輕鬆。每週一到兩次、每次 30 分鐘、連續 8 週。這是很大的使用者留存風險,中途放棄前功盡棄。

第三,所有 outgoing 訊息都是 draft,必須經過人類審核才能發送。這是刻意的設計——AI 代言你的風險太高,不能讓它自己決定要不要發出去。

第四,資料不出你的機器。無後台、無 cloud sync,hard delete 是真的 hard delete。

背後的兩條線

VirtualMe 在做的事情,背後就是兩條線在交叉。

第一條是 AI 個人化的商品化。$60 做到以前要 $5,000 的事情,而且是開源的。這意味著個人 AI 代理不再是有錢人的玩具。

第二條是數位人格的所有權問題。你的人格資料存在自己的 .md 檔裡,不是某個平台的向量資料庫。這聽起來理所當然,但看看市面上的競品——Simile MiniMe 拿了 $100M 融資,走的是 10 分鐘快照 + 雲端託管路線。你的人格資料在他們的伺服器上。

VirtualMe 選了相反的方向:慢(8 週 vs 10 分鐘)、窮($60 vs 訂閱制)、但你擁有一切。這不一定是更好的選擇,但它是一個值得存在的選擇。

原始資料來源:VirtualMe GitHub Repo
參考研究:Stanford 訪談研究(arXiv:2411.10109)