gstack — 用 Claude Code 打造虛擬 20 人工程團隊
一個人寫一萬行生產級程式碼,聽起來像在吹牛。但 Y Combinator CEO Garry Tan 把他的工作流打包成開源工具,名字叫 gstack,MIT 授權,30 秒裝完。
它到底是什麼
gstack 把 Claude Code 變成一支虛擬工程團隊。不是那種「幫你補全一行 code」的等級——是從構想、規劃、實作、Code Review、QA、安全審計、部署到監控,整條 Sprint 流程都有對應的 Skill 角色。
技術棧是 TypeScript + Bun + Playwright。核心是一個持久化的 Chromium daemon,首次啟動約三秒,之後每個指令 100-200ms。不是每次冷開瀏覽器那種等到天荒地老的體驗。
GitHub 在這:github.com/garrytan/gstack
安裝:真的 30 秒
1 | git clone --single-branch --depth 1 https://github.com/garrytan/gstack.git ~/.claude/skills/gstack |
跑完之後在專案的 CLAUDE.md 加一段宣告就能用。團隊要共用的話,把整個資料夾複製到專案的 .claude/skills/gstack 底下。
Cursor、OpenAI Codex 也支援:
1 | ./setup --host cursor # Cursor |
Sprint 工作流:每個 Skill 都是一個角色
這是整套流程最有趣的設計——每個指令背後對應一個專業角色:
| 階段 | 指令 | 扮演角色 | 幹嘛的 |
|---|---|---|---|
| 構想 | /office-hours |
YC 導師 | 六個逼問式問題 + 三種實作方案 |
| 審視 | /plan-ceo-review |
CEO | 重新思考範圍,該砍就砍 |
| 架構 | /plan-eng-review |
工程經理 | 鎖定架構、ASCII 圖表、邊界案例 |
| 設計 | /plan-design-review |
資深設計師 | UI/UX 完整度審計 |
| 審查 | /review |
Staff Engineer | PR Review,自動修明顯 bug |
| QA | /qa |
QA Lead | 真實瀏覽器測試 + 回歸測試 |
| 安全 | /cso |
資安長 | OWASP Top 10 + STRIDE 審計 |
| 出貨 | /ship |
Release Engineer | 同步 main → 測試 → 推 PR |
| 部署 | /land-and-deploy |
Release Engineer | 合併 → CI → 部署 → 健康檢查 |
| 監控 | /canary |
SRE | 部署後監控 console 錯誤 |
一個完整的工作流跑起來大概這樣:
1 | /office-hours # 釐清定位 |
從想法到上線,一個人搞定。
/browse:內建的瀏覽器指令系統
gstack 不是只會跑 terminal 指令。它內建了一整套瀏覽器操作系統,50 幾個指令,用 $B 前綴呼叫。$B 是 shell 變數,指向 gstack 編譯好的 browse 執行檔路徑(約 58MB 的 Bun 單檔 binary),可以把它想成「Browser CLI」的縮寫:
1 | $B goto https://staging.example.com # 開網頁 |
ref 系統用的是無障礙樹的 @e1、@e2,不是 CSS selector。這代表不會被 CSP 擋,也不會因為 class name 改了就壞掉。
Boil the Lake 哲學
Garry Tan 的核心理念叫「煮沸整個湖」:AI 讓完整實作的邊際成本趨近零,所以永遠選完整方案。
他給了一組壓縮比數據:
| 任務 | 人類團隊 | AI 輔助 | 壓縮比 |
|---|---|---|---|
| Boilerplate | 2 天 | 15 分鐘 | ~100x |
| 測試撰寫 | 1 天 | 15 分鐘 | ~50x |
| 功能實作 | 1 週 | 30 分鐘 | ~30x |
| Bug 修復 | 4 小時 | 15 分鐘 | ~20x |
| 架構設計 | 2 天 | 4 小時 | ~5x |
數字可以打折看,但方向很明確:重複性越高的工作,AI 壓縮比越大。架構設計這種需要判斷力的,壓縮比最低。
搭配第二原則「Search Before Building」——先搜尋有沒有人解過,再決定要不要從零開始。最糟的結果是完整實作了一個已經有的一行解。
安全模型
HTTP server 只綁 localhost。每個 session 用隨機 UUID 做 Bearer token,檔案權限設為 0o600(Unix 八進位表示法,等同 chmod 600,意思是只有檔案擁有者可以讀寫,其他人完全不能碰)。Cookie 用 PBKDF2 + AES 加密,只在記憶體裡解密。Console 和 network 日誌裡不會出現 cookie 值。
/cso 安全審計涵蓋 OWASP Top 10 和 STRIDE 威脅建模,內建 17 個誤報過濾器。這不是隨便跑一下 linter 就算了的程度。
測試架構:三層式
| 層級 | 指令 | 成本 | 時間 |
|---|---|---|---|
| 靜態驗證 | bun test |
免費 | < 5 秒 |
| E2E 整合 | EVALS=1 bun run test:e2e |
~$3.85 | ~20 分鐘 |
| LLM 評審 | EVALS=1 bun run test:evals |
~$0.15 | ~30 秒 |
哲學是「免費捕捉 95% 問題,LLM 只用於判斷性決策」。靜態驗證不花錢、不花時間,先把能抓的都抓完,再用 E2E 和 LLM 處理需要判斷的部分。
要注意的限制
Cookie 解密目前只支援 macOS。編譯出來的 binary 是 arm64 Mach-O,不能跨平台。Windows 要額外裝 Node.js 因為 Bun 的 Playwright pipe transport 有 bug。
沒有 WebSocket 串流、沒有 MCP 協定支援、沒有多使用者。並行 Sprint 上限大約 10-15 個。
不過對獨立開發者或小團隊來說,這些限制大部分碰不到。
適合誰用
獨立開發者想快速出貨、上線前需要完整品質把關、接手陌生 codebase 要除錯、團隊想統一開發流程——這幾個場景都蠻適合。
YC CEO 自己在用的工具,開源出來讓大家撿便宜。MIT 授權,想改就改。裝不裝得起來就看你跟 Bun 有沒有緣了。
參考來源:gstack GitHub Repository
參考來源:Claude Code in Action - Anthropic Academy










