개인정보처리방침© 2026 DEV BAK - 기술블로그. All rights reserved.
DEV BAK - 기술블로그
AI

에이전틱 AI 설계 7대 패턴

Use + ReAct | KB, 티켓 DB 등 외부 시스템 반복 조회 | | 응답 작성 | 응대 에이전트 | Reflection | 발송 전 어조·정확도 자체 검토 | | 에스컬레이션 | 전체 파이프라인 | Human-in-the-Loop | 자동 해결 불가 시 담당자 연결 |


장단점 분석

장점

패턴 조합이 잘 맞아들어가면 이런 게 가능해집니다. 직접 써본 시스템 기준으로 정리하면:

항목 내용
자율적 태스크 처리 중간에 개입하지 않아도 다단계 워크플로우가 완료됩니다. 저희 팀이 수작업으로 2시간 걸리던 리포트 생성이 에이전트로 20분이 됐어요
전문성 분리 Multi-Agent로 역할을 나누면 각 도메인 품질이 올라갑니다
실세계 연동 Tool Use로 최신 정보, 데이터베이스, 외부 시스템을 활용할 수 있습니다
출력 품질 제어 Reflection으로 사용자에게 전달 전 오류를 내부에서 잡을 수 있습니다
안전성 확보 Human-in-the-Loop로 고위험 행동에 가드레일을 설치할 수 있습니다

단점 및 주의사항

솔직히 이 부분을 처음에 너무 낙관적으로 봤다가 꽤 고생했습니다:

항목 내용 대응 방안
비용 급증 Reflection은 토큰 2배 이상, Multi-Agent는 LLM 호출 수 배 증가 — 이거 처음에 우리 팀이 제일 많이 당한 부분입니다 필요한 단계에만 선택적 적용, 비용 임계치 알림 설정
응답 지연 루프가 길어질수록 레이턴시 누적 병렬 처리 가능한 단계 식별, 타임아웃 설정
오케스트레이션 복잡도 Multi-Agent 시스템은 에이전트 간 통신 실패 디버깅이 어려움 LangSmith 같은 관찰 가능성 도구 필수 도입
계획 오류 전파 Planning 단계에서 잘못된 계획은 이후 전체 실패로 이어짐 계획 검증 단계 추가, 계획 확인 후 실행
보안 노출 Tool Use 남용, Prompt Injection으로 의도치 않은 도구 호출 가능 도구 권한 최소화, 입력 검증, Guardian Agent 도입 고려

Prompt Injection: 악의적인 입력이 LLM의 시스템 프롬프트를 덮어쓰거나 의도치 않은 명령을 실행하게 만드는 공격 기법. 에이전트가 외부 데이터(웹 검색 결과, 사용자 입력)를 처리할 때 특히 주의가 필요합니다.

Guardian Agent: 다른 에이전트의 컴플라이언스 위반, 환각, 범위 이탈을 실시간으로 감시하는 전용 에이전트. 2025~2026년 에이전틱 AI 생태계에서 독립 카테고리로 빠르게 성장 중입니다.

실무에서 가장 흔한 실수

  1. 처음부터 Multi-Agent로 시작하기: 저도 첫 에이전트 프로젝트에서 researcher, writer, reviewer 에이전트 세 개를 동시에 설계하고 시작했는데, 각 에이전트 간 컨텍스트 전달 문제를 디버깅하는 데 단일 에이전트로 시작했을 때보다 훨씬 더 많은 시간을 썼습니다. 단순하게 시작하고, "이 역할이 병목이다"는 게 데이터로 확인될 때 분리하는 게 훨씬 효과적입니다.

  2. 관찰 가능성 없이 프로덕션 배포: 에이전트가 10번 루프를 도는 동안 어느 추론에서 잘못됐는지 로그 없이 재현하는 건 사실상 불가능합니다. 저희 팀도 프로덕션 배포 후에 LangSmith를 붙였는데, 초반에 잡았으면 금방 고쳤을 버그를 2주 동안 못 찾은 경험이 있어요. 개발 첫날부터 붙여두는 걸 권장합니다.

  3. Human-in-the-Loop를 나중에 추가하려고 미루기: "일단 자동화하고 나중에 검토 단계 추가하자"는 접근은 아키텍처를 처음부터 다시 짜게 만듭니다. LangGraph에서 interrupt_before는 그래프 컴파일 시점에 결정되기 때문에, 나중에 추가하려면 상태 설계와 그래프 구조를 함께 뜯어고쳐야 합니다. 돌이키기 어려운 행동 목록을 설계 초기에 정의하고 그 앞에 체크포인트를 넣어두는 것을 권장합니다.


마치며

7가지 패턴은 각각이 독립 솔루션이 아니라 상황에 맞게 조합하는 어휘입니다. 어떤 패턴을 쓸지보다, 왜 그 패턴이 이 문제에 맞는지를 설명할 수 있을 때 비로소 에이전트 설계가 시작됩니다.

지금 바로 시작해볼 수 있는 3단계:

  1. LangGraph로 ReAct 기본 루프를 직접 구현해볼 수 있습니다 — pip install langgraph langchain-openai 후 위 코드 예시를 그대로 실행해볼 수 있습니다. 루프가 어떻게 돌아가는지 눈으로 확인하는 게 개념 이해에 가장 빠른 지름길입니다.

  2. LangSmith를 연결해 에이전트 추론 과정을 시각화해볼 수 있습니다 — LANGCHAIN_TRACING_V2=true 환경 변수 하나만 추가하면 모든 LLM 호출과 도구 사용 내역이 대시보드에 기록됩니다. smith.langchain.com에서 무료 계정을 만들고 API 키를 발급받으면 바로 연결할 수 있습니다. 관찰 가능성이 생기면 패턴 조합 실험이 훨씬 수월해집니다.

  3. 팀에서 반복적으로 수작업하는 다단계 프로세스 하나를 골라 패턴을 매핑해볼 수 있습니다 — "이 단계는 Sequential이고, 여기서 외부 데이터가 필요하면 Tool Use, 결과 검증이 필요하면 Reflection"처럼 패턴 언어로 기존 워크플로우를 분석하는 것만으로도 에이전트 설계 감각이 빠르게 붙습니다.


참고 자료

  • 7 Practical Design Patterns for Agentic Systems | MongoDB
  • 7 Design Patterns for Agentic Systems You NEED to Know | MongoDB/Medium
  • 7 Must-Know Agentic AI Design Patterns | MachineLearningMastery.com
  • The 7 Agentic AI Design Patterns Every Developer Should Know | DEV Community
  • 7 Agentic AI Trends to Watch in 2026 | MachineLearningMastery.com
  • Top AI Agentic Workflow Patterns | ByteByteGo
  • Agentic AI Design Patterns: A System-Theoretic Framework | arXiv
  • AI Agent Frameworks Compared: LangGraph vs CrewAI vs AutoGen | PEC Collective
  • Agentic AI from First Principles: Reflection | Towards Data Science
  • The ReAct → Reflection → Planning Pipeline | Medium/System Design Mastery
#AgenticAI#LangGraph#ReAct#Multi-Agent#RAG#ToolUse#Reflection#Human-in-the-Loop#LLM#PromptInjection
공유하기

목차

장단점 분석장점단점 및 주의사항실무에서 가장 흔한 실수마치며참고 자료

추천 포스트

사내 REST API를 LLM이 직접 호출하게 만드는 법: TypeScript MCP 서버 구현과 Gateway 패턴
AI

사내 REST API를 LLM이 직접 호출하게 만드는 법: TypeScript MCP 서버 구현과 Gateway 패턴

팀에서 AI 에이전트를 도입하려다 "그래서 우리 내부 API는 어떻게 연결해?"라는 질문에 막혀본 적 있으신가요? 저도 처음엔 LLM에게 사내 API 문서를 통째로 붙여넣거나, 직접 fetch 코드를 프롬프트에 넣어주는 방식을 시도했습니다. 잘 됩니다—딱 한 번만요. 그 다음 요청부터는...

2026년 06월 07일읽는 데 19분
Pydantic AI로 LLM 응답을 타입 안전하게 검증하기
AI

Pydantic AI로 LLM 응답을 타입 안전하게 검증하기

LLM을 프로덕션에 붙여본 분이라면 이런 상황을 한 번쯤 겪어봤을 겁니다. GPT한테 JSON으로 응답하라고 시스템 프롬프트까지 꼼꼼히 썼는데, 정작 런타임에 가 터지는 상황. 아니면 가 어떤 날은 고 어떤 날은 인 상황. LLM 출력을 딕셔너리로 받아 쓰는 코드는 언제나 이런 시한폭탄...

2026년 06월 07일읽는 데 22분
Long-Horizon 에이전트 비용 60~90% 줄이기: 캐싱·압축·라우팅 전략
AI

Long-Horizon 에이전트 비용 60~90% 줄이기: 캐싱·압축·라우팅 전략

AI 에이전트를 프로덕션에 올리고 나서 처음 청구서를 받았을 때의 충격을 아직도 기억한다. 단순 챗봇이라면 예측 가능했을 텐데, 에이전트는 달랐다. 버그 하나 고치는 데 컨텍스트가 수만 토큰씩 쌓이고, 실패하면 그 비용 그대로 날리고 처음부터 다시. 단일 실행이 예상의 열 배를 넘어가는...

2026년 06월 07일읽는 데 24분
오픈웨이트 vs 클로즈드 AI 2026: 벤치마크 격차가 좁혀진 지금, 선택의 기준이 바뀌었다
AI

오픈웨이트 vs 클로즈드 AI 2026: 벤치마크 격차가 좁혀진 지금, 선택의 기준이 바뀌었다

솔직히 말하면, 1년 전까지만 해도 저는 클로즈드 모델이 한동안은 압도적 우위를 유지할 거라 생각했습니다. GPT-4급 성능을 내려면 OpenAI API 키를 꽂는 게 당연한 수순이었고, 오픈웨이트 진영은 "쓸 만은 하지만 아직..." 수준에 머물렀으니까요. 그런데 그 확신이 흔들리기 ...

2026년 06월 06일읽는 데 23분
Qwen3-Coder 로컬 실행: RTX 3090 한 장으로 SWE-bench 70% AI 코딩 에이전트 세팅하기
AI

Qwen3-Coder 로컬 실행: RTX 3090 한 장으로 SWE-bench 70% AI 코딩 에이전트 세팅하기

클라우드 AI 비용 청구서가 두 달 연속 두 배씩 오르는 걸 보면서 진지하게 대안을 찾기 시작했습니다. 솔직히 "오픈소스가 얼마나 하겠어"라는 편견보다, 이전에 몇 가지 오픈소스 코딩 모델을 써봤다가 실망했던 경험이 더 컸습니다. 특히 레거시 코드베이스에서 파일 여러 개를 넘나드는 리팩...

2026년 06월 06일읽는 데 22분
AI 에이전트 LLM 비용이 폭증하는 구조와 60~80% 절감 전략
AI

AI 에이전트 LLM 비용이 폭증하는 구조와 60~80% 절감 전략

에이전트형 AI 시스템을 프로덕션에 올려본 경험이 있다면, 한 번쯤은 청구서를 보고 멈칫했던 적이 있을 겁니다. "분명히 프롬프트 몇 번 날린 것뿐인데, 왜 이렇게 많이 나왔지?" 저도 처음에는 단순히 토큰 수를 줄이면 된다고 생각했는데, 실제로는 그게 아니었습니다. 문제의 핵심은...

2026년 06월 05일읽는 데 21분