Claude Code 에이전트 워크플로 완전 가이드 — Superpowers + gstack + GSD로 60만 줄을 충돌 없이 프로덕션에 적용하는 법
"주당 10,000 LOC, 60일 만에 600,000줄." Y Combinator CEO Garry Tan이 자신의 워크플로로 실제로 달성한 수치입니다(SitePoint 인터뷰 기준, 이 중 35%가 테스트 코드). 이 숫자가 가능했던 이유는 도구 수가 많아서가 아니라, 세 도구가 서로 다른 문제를 풀도록 역할이 명확히 분리되어 있었기 때문입니다. gstack이 생각하고, GSD가 안정시키며, Superpowers가 실행합니다. 이 역할 분리가 세 프레임워크 조합의 전부입니다.
Claude Code는 슬래시 커맨드와 스킬 시스템으로 확장 가능한 AI 코딩 에이전트입니다. 2026년 초 Claude Code의 스킬 시스템이 단일 통합 포맷으로 표준화되면서, 특정 문제에 집중한 Superpowers·gstack·GSD 같은 프레임워크들이 공식 생태계의 핵심으로 자리잡았습니다. 세 도구는 서로 다른 레이어의 문제를 다룹니다. 아무 전략 없이 함께 쓰면 슬래시 커맨드가 충돌하고, 어느 도구가 어떤 역할을 맡는지 모호해집니다.
이 글을 읽고 나면 gstack·GSD·Superpowers를 언제, 어떤 순서로 조합해야 프로덕션 품질의 코드를 안정적으로 뽑아낼 수 있는지 실전 패턴을 손에 넣게 됩니다. 도입부에서 제시한 "gstack이 생각하고, GSD가 안정시키며, Superpowers가 실행한다"는 프레이밍은 마치며 섹션에서 CLAUDE.md 선언 패턴과 함께 다시 확인할 수 있습니다.
핵심 개념
세 프레임워크가 해결하는 각자 다른 문제
세 도구는 모두 Claude Code를 기반으로 하지만, 각자 전혀 다른 레이어의 문제를 겨냥합니다.
| 프레임워크 | 제작자 | 핵심 문제 | 접근 방식 |
|---|---|---|---|
| Superpowers | Jesse Vincent | AI 코딩의 구조 부재 | 7단계 강제 워크플로 + TDD |
| gstack | Garry Tan (YC) | 단일 인지 모드의 한계 | 23인 가상 팀 / 역할 기반 인지 모드 전환 |
| GSD | TÂCHES 팀 | 컨텍스트 로트 | 스펙 주도 개발 + 컨텍스트 격리 |
컨텍스트 로트(Context Rot): 긴 대화가 이어질수록 AI 응답 품질이 점진적으로 저하되는 현상. 세션 초반 1시간과 3시간 후의 코드 품질 차이가 여기서 발생합니다.
Superpowers — TDD를 AI 사이클에 내재화하는 파이프라인
Superpowers는 Anthropic Claude 플러그인 마켓플레이스에 등재된 7단계 강제 워크플로 도구입니다. AI가 테스트 없이 구현 코드를 먼저 작성하면, "작동하는 것처럼 보이는 코드"는 만들어지지만 이후 리팩토링 시 회귀 여부를 확인할 수단이 없어집니다. Superpowers는 이 문제를 워크플로 강제로 해결합니다.
Brainstorm → Spec → Plan → TDD → Subagent Dev → Review → Finalize서브에이전트 분산 실행의 핵심은 TDD 단계에서 작성된 테스트를 기반으로 여러 구현 경로를 병렬로 탐색하고, 테스트를 가장 잘 통과하는 구현을 선택하는 방식에 있습니다. 단순한 병렬 처리가 아니라, 테스트가 품질 기준 역할을 하는 구조입니다.
gstack — 23인 가상 팀으로 Claude Code를 운영하는 역할 시스템
gstack은 슬래시 커맨드를 통해 Claude Code의 시스템 프롬프트를 해당 역할에 맞는 전문화된 컨텍스트로 교체하는 방식으로 작동합니다. /security-officer를 실행하면 위협 모델링과 취약점 식별에 집중하는 프롬프트로 전환되고, /staff-engineer로 전환하면 아키텍처 결정과 기술 부채 관점으로 같은 코드를 다시 검토합니다.
/product-manager # 제품 스코프와 우선순위 결정
/staff-engineer # 아키텍처 검토
/security-officer # 위협 모델링
/qa-lead # 실 브라우저(Playwright) 자동화 QA
/ship # GitHub Actions 연동 배포역할 기반 인지 모드: 동일한 코드베이스에 대해 역할별로 다른 시스템 프롬프트를 적용하는 방식. "이 코드가 작동하는가"와 "이 코드가 안전한가"는 다른 질문이며, gstack은 이 전환을 커맨드 하나로 자동화합니다.
GSD — 컨텍스트 로트를 구조로 막는 스펙 주도 시스템
GSD(Get Shit Done)는 각 페이즈를 독립된 새 세션으로 시작하는 방식으로 컨텍스트 로트를 원천 차단합니다. /gsd-execute-phase 실행 시 이전 대화 히스토리 없이 최대 200K 토큰의 신선한 컨텍스트 윈도우로 새 세션을 시작합니다. Amazon·Google·Shopify 엔지니어들이 실제 채택 중이며, GSD v2는 Claude Code 외에도 OpenCode, Gemini CLI, Cursor, Windsurf 등 12개 런타임을 지원합니다.
/gsd-new-project # 프로젝트 초기화 및 .planning/ 생성
/gsd-discuss-phase 1 # 스펙 논의 (컨텍스트 저장)
/gsd-plan-phase 1 # 실행 계획 수립
/gsd-execute-phase 1 # 구현 (새 세션에서 실행)실전 적용
이어지는 세 예시는 하나의 가상 SaaS 프로젝트(결제 기능이 포함된 구독 서비스)를 기준으로 작성되었습니다. Pre-build → Build → Post-build 흐름이 단계별로 이어집니다.
예시 1: 3단계 역할 분리 파이프라인 (Pre-build ~ Post-build)
세 프레임워크를 단계별로 명확히 분리해 적용하는 패턴입니다. 가장 충돌이 적고 검증된 조합입니다.
[Pre-build] gstack → [Build] GSD + Superpowers → [Post-build] gstack| 단계 | 프레임워크 | 주요 커맨드 | 역할 |
|---|---|---|---|
| Pre-build | gstack | /product-manager, /staff-engineer, /security-officer |
스코프 결정, 아키텍처 검토, 보안 위협 모델링 |
| Build | GSD + Superpowers | /gsd-execute-phase, Superpowers TDD 파이프라인 |
컨텍스트 격리된 구현 + 테스트 우선 개발 |
| Post-build | gstack | /qa-lead, /ship |
실 브라우저 QA, CI/CD 배포 |
이 경계를 CLAUDE.md에 선언해두면 슬래시 커맨드 네임스페이스 충돌을 방지할 수 있습니다.
# CLAUDE.md — 프레임워크 역할 경계 선언
## gstack
- 사용 범위: Pre-build 의사결정, Post-build QA/배포
- 활성 커맨드: /product-manager, /staff-engineer, /security-officer, /qa-lead, /ship
## GSD
- 사용 범위: Build 단계 컨텍스트 격리 및 상태 관리
- 상태 저장 위치: .planning/
## Superpowers
- 사용 범위: Build 단계 TDD 강제 파이프라인
- 주의: GSD 자율 실행 구간에서는 인터랙티브 단계 비활성화슬래시 커맨드 네임스페이스: Claude Code에서
/커맨드명형태로 호출하는 기능 단위. 여러 프레임워크가 같은 이름을 사용하면 어느 프레임워크의 커맨드인지 모호해집니다. CLAUDE.md가 이를 해소하는 선언 파일 역할을 합니다.
예시 2: 결제 모듈 구현에서 GSD 컨텍스트 격리 적용하기
동일한 SaaS 프로젝트에서, Pre-build 설계가 끝난 뒤 Build 단계에 진입합니다. 인증 모듈과 결제 모듈을 독립된 컨텍스트로 분리해 구현하는 방법입니다.
# Phase 1: 인증 모듈 구현
/gsd-discuss-phase 1 # 스펙 논의 → .planning/phase-1-spec.md 저장
/gsd-plan-phase 1 # 태스크 분해 → .planning/phase-1-plan.json 저장
/gsd-execute-phase 1 # 새 세션에서 실행 (인증 코드만 로드)
# Phase 2: 결제 모듈 구현 (Phase 1과 완전히 격리된 컨텍스트)
/gsd-discuss-phase 2
/gsd-plan-phase 2
/gsd-execute-phase 2 # 새 세션 시작 — 인증 대화 히스토리 없음/gsd-plan-phase 1 실행 후 생성되는 .planning/phase-1-plan.json의 구조 예시입니다.
{
"phase": 1,
"title": "인증 모듈",
"tasks": [
{
"id": "auth-1",
"description": "JWT 발급 및 검증 유틸리티",
"status": "pending",
"test_first": true
},
{
"id": "auth-2",
"description": "OAuth2 소셜 로그인 연동",
"status": "pending",
"test_first": true
}
],
"context_boundary": "phase-1-spec.md"
}각 페이즈가 독립된 세션에서 실행되므로, 인증 모듈의 긴 대화 히스토리가 결제 모듈 구현 품질에 영향을 주지 않습니다.
예시 3: Superpowers TDD와 GSD 자율 실행의 충돌 해소
동일한 SaaS 프로젝트의 Build 단계에서, Superpowers의 대화형 Q&A 프롬프트가 GSD의 자율 실행 흐름을 차단하는 것이 가장 흔한 충돌 패턴입니다. 실행 순서를 조정하는 것으로 해결할 수 있습니다.
# 권장 순서: GSD 계획 완료 → Superpowers TDD 실행 → GSD 실행
# Step 1: GSD로 스펙과 계획 확정 (대화형 단계)
/gsd-discuss-phase 2 # 결제 모듈 스펙 논의
/gsd-plan-phase 2 # 태스크 분해 완료
# Step 2: Superpowers Plan 단계부터 진입
# (Brainstorm/Spec은 GSD가 이미 처리 — Plan 단계부터 시작)
# 실행 출력 예시:
# ✓ Plan confirmed: 4 tasks identified
# ✓ TDD: 18 tests generated
# ✓ Subagent Dev: running 4 parallel agents...
# ✓ Review: all tests passing (18/18)
# Step 3: GSD 실행 (Superpowers 인터랙티브 단계 완료 후)
/gsd-execute-phase 2 # 새 세션에서 결제 모듈 구현장단점 분석
장점
| 항목 | 내용 |
|---|---|
| 역할 분리로 인지 부하 감소 | 각 단계에서 하나의 도구만 집중하면 되므로 "지금 뭘 써야 하지?" 고민이 사라집니다 |
| 컨텍스트 로트 원천 차단 | GSD의 페이즈 격리로 대형 프로젝트에서도 일관된 코드 품질을 유지할 수 있습니다 |
| 테스트 커버리지 자동 확보 | Superpowers의 의무 TDD로 회귀 버그가 눈에 띄게 감소합니다 |
| 보안·QA 관점 자동 포함 | gstack의 역할 전환으로 구현 전 보안 위협 모델링이 워크플로에 포함됩니다 |
| 런타임 유연성 | GSD v2가 12개 런타임을 지원해 Claude Code 의존도를 낮출 수 있습니다 |
단점 및 주의사항
| 항목 | 내용 | 대응 방안 |
|---|---|---|
| 슬래시 커맨드 충돌 | gstack 28개 커맨드와 다른 프레임워크 커맨드 이름이 겹칠 수 있습니다 | CLAUDE.md에 각 프레임워크의 담당 커맨드 범위를 명시합니다 |
| 소규모 태스크 오버헤드 | 간단한 버그 수정에 7단계 파이프라인은 과도합니다 | Superpowers는 복잡도 높은 태스크에만 적용하는 것을 권장합니다 |
| GSD v2 통합 복잡도 | TypeScript 앱 형태라 마크다운 기반 프레임워크와 통합 시 추가 설정이 필요합니다 | .planning/ 디렉토리 구조를 미리 합의하고 시작합니다 |
| 이중 의사결정 프로세스 | gstack이 플래닝을 담당하면 Superpowers의 Brainstorm/Spec 단계가 중복됩니다 | gstack Pre-build 이후에는 Superpowers를 Plan 단계부터 진입합니다 |
| 대화형 프롬프트 충돌 | GSD 자율 실행 구간에서 Superpowers의 인터랙티브 프롬프트가 입력 스트림을 차단합니다 | 예시 3의 순서(GSD 계획 → Superpowers 실행 → GSD 실행)를 따릅니다 |
실무에서 가장 흔한 실수
- 세 도구를 동시에 모든 태스크에 적용하는 것 — 소규모 태스크는 GSD 4커맨드 최소 워크플로만으로도 충분합니다. 프로젝트 복잡도에 맞게 도구를 선택적으로 적용하는 것을 권장합니다.
- CLAUDE.md 없이 조합을 시작하는 것 — 역할 경계를 선언하지 않으면 Claude Code가 어느 프레임워크의 컨텍스트를 따라야 할지 모호해집니다. 조합 전 CLAUDE.md 작성을 먼저 진행하는 것이 좋습니다.
- Superpowers 대화형 단계를 GSD 자율 실행 중에 끼워넣는 것 — 반드시 GSD의 계획 단계가 끝난 뒤 Superpowers를 실행하고, 그 이후에 GSD 실행 단계로 넘어가는 순서를 지키는 것을 권장합니다.
마치며
"gstack이 생각하고, GSD가 안정시키며, Superpowers가 실행한다"는 역할 분리가 세 프레임워크 조합의 핵심이며, 이 경계를 CLAUDE.md에 선언하는 것이 충돌 없는 프로덕션 적용의 시작점입니다.
지금 바로 시작해볼 수 있는 3단계:
- CLAUDE.md 복사 후 바로 시작 — 위 예시 CLAUDE.md를 프로젝트 루트에 붙여넣고, 팀 워크플로에 맞게
사용 범위만 수정합니다. - GSD 4커맨드 최소 워크플로 체험하기 — 현재 진행 중인 가장 작은 태스크 하나를
gsd-new-project → discuss → plan → execute흐름으로 처리해보시면 좋습니다. 컨텍스트 격리 효과를 바로 체감할 수 있습니다. - gstack의
/security-officer를 다음 PR에 한 번 적용해보기 — 기존 코드에 위협 모델링 관점을 추가하는 것만으로도 gstack의 역할 기반 인지 모드가 어떻게 동작하는지 경험할 수 있습니다.
다음 글: gstack의 28개 슬래시 커맨드를 팀 규모별(스타트업 vs. 엔터프라이즈)로 최적화하는 방법과 실전 CLAUDE.md 템플릿 공개
참고 자료
- A Claude Code Skills Stack: How to Combine Superpowers, gstack, and GSD Without the Chaos | DEV Community
- Superpowers, GSD, and gstack: What Each Claude Code Framework Actually Constrains | Medium (Ewan Mak)
- Superpowers, GSD, and GSTACK: Picking the Right Framework for Your Coding Agent | Pulumi Blog
- GStack vs Superpowers vs Hermes: Which Claude Code Framework Should You Use? | MindStudio
- GStack Guide: Garry Tan's Claude Code Skill Pack | Awesome Agents
- GitHub — obra/superpowers
- GitHub — garrytan/gstack
- GitHub — gsd-build/get-shit-done
- GSD 공식 사이트
- GStack 공식 사이트
- Superpowers — Anthropic Claude Plugin Marketplace
- Superpowers vs GStack: Which AI Coding Skill Pack Actually Works? | Particula Tech
- GStack Tutorial: Garry Tan's Claude Code Workflow for 10K LOC/Week | SitePoint
- GSD Framework: Spec-Driven Development for Claude Code | CC for Everyone