目录

gstack:Garry Tan 的 AI 原生开发环境,23 个专家级工具装进 Claude Code

gstack:Garry Tan 的 AI 原生开发环境,23 个专家级工具装进 Claude Code

项目概览

gstackgarrytan/gstack)是 Y Combinator CEO Garry Tan 开源的 AI 开发工具集,旨在将 Claude Code 从一个代码补全工具扩展为完整的虚拟工程团队。23 个专家角色(CEO、设计师、架构师、安全审查员、QA、发布工程师等),8 个 slash 命令,全部 MIT 协议。⭐ 96,207 | 更新时间:2026-05-13

背景:从「一个人像一支队伍」说起

Garry Tan 在 2026 年 3 月的 No Priors 播客中提到,自 2025 年 12 月以来他几乎没手动写过一行代码,却完成了「以前一个团队才能做到」的工作量。他分析了 2013 年(构建 Bookface/Y Combinator 内部社交网络)和 2026 年的代码产出对比——以标准化后的逻辑代码行计,2026 年的产出速率是 2013 年的约 810 倍。

支撑这个结果的,正是 gstack 这套工具链。

核心设计理念

gstack 的本质是角色扮演式的 AI 辅助开发框架。每个角色都有明确的职责边界和决策视角:

角色职责
CEO重新审视产品方向,挑战现有假设
Architect锁定架构决策,确保技术选型一致
Designer识别 AI 生成的「平庸设计」,提升体验质量
Eng Manager分解任务、评估进度、管理依赖
Security Officer运行 OWASP + STRIDE 安全审计
QA Lead启动真实浏览器进行端到端测试
Release Engineer审核 PR、把关发布流程
Doc Engineer撰写和维护文档

所有角色通过 Claude Code 的 slash 命令调用,无需切换工具或改变工作流。

工具链组成

8 个核心 slash 命令覆盖了开发全流程的关键节点:

  • /design — 接收产品意图,输出设计评审意见
  • /review — 代码审查,识别潜在 bug 和架构问题
  • /test — 生成端到端测试并执行
  • /security — 运行安全扫描
  • /ship — 发布审核,模拟 release engineer 把关 PR
  • /explain — 解释复杂代码段的技术含义
  • /refactor — 在不改变功能的前提下优化代码结构
  • /docs — 生成和维护项目文档

每个命令背后对应一套 prompt 模板和工具调用策略,目标是让 AI 在每个环节都以「该领域的专家」而非「通才」的方式介入。

性能数据

Garry Tan 在 README 中公开了完整的对比数据(附原始数据链接):

  • 2026 年前四个月:已完成 240 倍于 2013 年全年的逻辑代码产出
  • 60 天内:3 个生产服务,40+ 功能特性,半职状态,同时全职运营 YC
  • 指标:按逻辑代码行(而非 raw LOC——后者会因 AI 补全而被显著高估)标准化后测量

他特别指出,LOC 批评者没有错——raw 行数确实会被 AI 膨胀。但他认为批评者混淆了两件事:标准化后的生产效率。他明确承认并附上了完整方法论和复现脚本,欢迎任何人验证。

适用场景与局限

gstack 适合:

  • 希望将 AI 能力系统化、而非散点式使用个人开发者
  • 需要在保持代码质量可控的前提下加速产出的独立 maker
  • 想验证「AI 是否真的能提升工程效率」并希望获得可量化数据的团队

需要注意的边界:

  • gstack 的效果高度依赖 Claude Code 的能力上限——当模型能力更强时,工具链的效果同步提升
  • 23 个角色意味着较高的 prompt 工程复杂度,调优需要时间投入
  • 该工具链目前围绕 Claude Code 生态构建,不支持其他模型(但 prompt 模板可迁移)

总结

gstack 代表了一种正在浮现的开发范式:当 AI 模型能力足够强时,工作流的组织方式开始成为新的竞争力来源。Garry Tan 将这套方法论开源,而非敝帚自珍,对于有兴趣系统化 AI 开发流程的团队和个人而言,是一份值得研究的一手素材——毕竟,这套工具的背后是一个同时运营 YC、在 60 天内交付了 3 个生产服务的人的真实工作流。