Chapter 1 에이전트
1.1 AI 에이전트의 정의
에이전트란
- 자올 에이전트란 아래 특성을 지닌 지능형 시스템이다.
- 데이터를 스스로 분석하고 환경을 해석
- 컨텍스트에 기반한 자율적인 결정을 내리도록 설계됨
- 진정한 자율 에이전트란 의미 있는 의사결정을 내리며 컨텍스트에 기반해 추론해야 한다.
- 반면 에이전트라 불리지만 자율성이 없는 불리는 정해진 스크립트나 워크플로만 실행하는 시스템도 많다.
- 파운데이션 모델(foundation model)과 강화 학습(reinforcement learning)이 발전이 자율 에이전트의 빠른 진화를 이끌고 있다.
에이전틱 시스템
- 에이전트가 효과적으로 작동하도록 돕는 도구
- 메모리, 파운데이션 모델, 오케스트레이션, 기타 인프라 전체를 일컫는다.
에이전트의 협업
- 다양한 프로토콜의 등장으로 에이전트는 원격으로 다른 에이전트와 협업해 문제를 풀 수 있게 되었다.
- MCP (Model Context Protocol)
- Agent-to-Agent Protocol)
- 하지만 동시에 에이전트에는 복잡환 환경에서도 안전하게 작동하도록 신중하게 설계, 관리해야할 중대한 책임도 발생한다.
1.2 사전학습이 일으킨 혁명
- 예전엔 머신러닝 애플리케이션 개발을 위해선 머신러닝 엔지니어를 채용해 데이터를 모으고 모델을 배포해야했다.
- 데이터 수집과 정제에 많은 리소스가 들어갔기 때문
- 이제는 API 호출 한 번으로 대형 사전학습 모델을 활용할 수 있다.
- 대규모 언어모델(LLM)의 발전 (OpenAI, 클로드 등)
- 이러한 파운데이션 모델은 자연어 이해와 생성에 특화되어 에이전트를 강화한다.
- 컨텍스트 기반 해석과 의사결정: 사전 규정이 애매한 상황도 해결
- 도구 사용: 행동을 위해 다른 소프트웨어를 호출
- 적응적 계획: 복잡한 다단계 계획을 스스로 계획/실행
- 정보 요약
- 비정형 데이터 처리
- 코드 생성
- 반복 업무 자동화
- 멀티모달 통합: 이미지, 오디오, 비디오 데이터를 대규모로 정교하게 분석
1.3 에이전트 유형
- 비즈니스 업무 에이전트
- 사전 정의 워크플로를 자동화
- 특정 이벤트에 트리거되어 결정적 단계를 실행
- 컨텍스트에 대한 추론은 최소화
- ex) 재피어 통합
- 대화형 에이전트
- 자연어 인터페이스로 상호작용하는 챗봇
- ex) 고객 지원 플랫폼, 가상 비서 등
- 리서치 에이전트
- 정보 수집, 통합, 요약 수행
- ex) 퍼플렉시티 등
- 분석 에이전트
- 구조화 데이터 해석으로 인사이트, 대시보드, 리포트 생성
- 엔터프라이즈 데이터 웨어하우스와 통합
- ex) 파워BI, 코파일럿 등
- 개발 에이전트
- 코딩 보조 도구로 IDE 워크플로에 깊이 통합
- ex) 커서, 코파일럿 등
- 도메인 특화 에이전트
- 전문 영역에 맞게 튜닝되어 전문가 수준의 지원을 제공
- ex) Harvey(법률), Hippocratic AI (의료)
- 브라우저 활용 에이전트
- 웹사이트 탐색, 상호작용, 행동 등 인간 개입 없이 수행
- 언어 이해, 시각, 지각, 동적 계획을 결합해 상황에 맞게 브라우저를 사용
1.4 모델 선택
- 오늘날 다양하고 강력한 모델을 풍부하게 선택할 수 있다.
- 선택지가 많은 것은 좋지만 적절한 모델을 선택하는 것은 쉽지 않다.
- 미래에는 멀티모델 시스템이 표준이될 가능성이 크다.
- ex) 간단한 질의는 저렴한 소형 모델로, 복잡한 추론은 대형 모델로 라우팅
1.5 동기에서 비동기로의 전환
- 전톡적 소프트웨어와 달리 에이전틱 시스템은 비동기식을 전제로 설계된다.
- ex) 코드 구현과 테스트를 함께 진행 / 고객 지원 에이전트가 제안 응답과 추천 조치를 함께 전달
- 이는 에이전트의 속도를 단순히 높이는 것이 아니라 일하는 방식 자체를 변경한다.
- 인간은 작업 실행자에거 작업 관리자로
- 반복 작업 대신 고가치 의사결정에 집중
- 선제적인 방식의 업무
1.6 활용 사례
- 고객지원, 금융 서비스, 법률 문서 검토 등 다양한 분야에서 에이전트들이 사용된다.
- 조직은 에이전트를 통합해 효율을 높이고 서비스 품질을 향상시킨다.
1.7 워크플로와 에이전트
- 대다수의 문제를 풀 때 다음의 도구들 중 선택하게 된다.
- 간단한 스크립트, 결정적 워크플로, 챗봇, RAG, 완전 자율 에이전트
- 간단한 스크립트
- 모든 입력이 완전 예측 가능하고 모든 출력을 미리 기술 가능한 상황
- 몇 줄의 절차적 코드가 ai보다 빠르고 저렴하다
- ex) 정규식 파싱 등
- 결정적 또는 반자동 워크플로
- 모든 결정 분기를 미리 나열할 수 있고 각 분기를 엄격히 통제해야 되는 경우
- ex) 송장 수집 → 형식(CSV, JSON, PDF 중 하나)에 맞춰 파싱 및 라우팅 → 불일치 검사 → 문제 시 인간에게 전달
- 자율 에이전트와 달리 추가 행동을 스스로 결정하지 않는다.
- 이러한 시나리오는 LLM보다 워크플로 엔진(에어플로, AWS step function 등)이 복잡성과 비용 측면에서 낫다.
- 챗봇/RAG(Retrieval-AugmentedGeneration)
- 자연어를 이해해 검색과 리서치를 하지만, 자율적이고 다단계적인 계획 수립은 필요 없는 경우
- 자료 조사 및 정리에 적합
- 자율 에이전트
- 입력 변동성이 크고 상황에 따라 계획이 바뀌어 위의 도구들로 부족한 경우
- 입력이 일정하지 않기에 에이전트는 입력의 의도를 파악해 적절한 출력 또는 결과물을 제시한다.
- ex) 고객 상담 에이전트
- 또한 에이전트는 병렬 하위 작업이 많은 환경에서 탁월하다.
1.8 효과적인 에이전틱 시스템 구축 원칙
- 확장성
- 증가하는 부하를 견디기 위한 다양한 작업
- 분산 아키텍처, 클라우드 인프라, 병렬 처리 등
- 모듈성
- 명확한 인터페이스로 연결된 독립적이고 교환 가능한 구조로 설계
- 유지보수와 변경 적응성을 높임
- 지속 학습
- 학습, 경험 등에서 매커니즘을 구축하고 사용자 피드백을 통합
- 회복탄력성
- 오류, 보안, 타임아웃 등 예상치 못한 상황을 처리하는 아키텍처가 필요
- 재시도, 폴백, 엄격한 보안, 중복화 등으로 달성
- 미래 대비
- 개방형 표준과 확장 가능한 인프라를 중심으로 설계
1.9 에이전틱 시스템 구축을 위한 조직 전략
- 파운데이션 모델을 간단한 API로 부를 수 있게 되며 조직 곳곳에 에이전트 도입이 활발해지고 있다.
- 다만 급격한 변화로 조직 전반에 파편화(프로젝트 중복, 노력 낭비, 미완성(가 발생하기 쉽다.
- 에이전트 개발 초기엔 팀들이 다양한 아키텍처, 워크플로, 모델을 자유롭게 실험하도록 장려해야 한다.
- 성공 패턴이 명확해지면 전략적 조율이 중요해진다.
- 벤더 종속을 피하기 - 개방형 표준과 모듈형 시스템 설계를 채택해 유연성을 확보해야 한다.
- 효과적인 지식 공유 - 실패 사례에서 얻은 교훈을 전파해야 한다.
- 거버넌스 프레임워크는 가볍고 유연하게 - 팀의 자신감과 혁신성 그리고 조직의 목표와 정렬을 유지하게 한다.
1.10 에이전틱 프레임워크
- 랭그래프(LangGraph)
- 방향 그래프 기반 모듈식 오케스트레이션 프레임워크
- 강점
- 개별 로직 단위가 노드에 포함되어 복잡/순환 가능 엣지를 통해 데이터 워크플로를 관리
- 비동기 워크플로와 재시도를 기본 지원
- 트레이드오프
- 고급 계획가 메모리엔 맞춤 로직이 필요
- 멀티 에이전트 협업에 대한 내장 지원이 상대적으로 부족
- 적합 대상: 명시적/검증 가능한 흐름 제어가 필요한 견고한 단일 에이전트 또는 경량 멀티 에이전트 시스템
- 오토젠(Autogen)
- 강력한 멀티 에이전트 오케스트레이션
- 강점
- 동적 역할 할당
- 메시지 기반 에이전트 간 유연한 상호작용
- 트레이드오프
- 단순 사례에선 무겁거나 복잡
- 에이전트 상호작용 패턴에 대해선 고집스러운 편
- 적합 대상: 에이전트 간 대화가 핵심인 시스템
- 크루 AI(CrewAI)
- 강점
- 배우기 쉽고 편리
- 프로토타이핑을 위한 빠른 설정
- 트레이드오프
- 오케스트레이션 내부 세밀한 설정과 제어가 제한적
- 복잡한 워크플로에선 랭그래프, 오토젠보다 성숙도가 낮음
- 적합 대상: 어시스턴트 같은 실용적이고 인간 중심 에이전트를 구축할 때
- OpenAI 에이전트 SDK
- OpenAI 도구 생태계와 깊은 통합
- 강점
- 안전하고 사용하기 쉬운 함수 호출
- 메모리 프리미티브 도구 라우팅
- 트레이드오프
- OpenAI 인프라에 강결합이라 유연성이 떨어짐
- 적합 대상: 이미 OpenAI API를 사용중이며 최소한의 도구로 안전한 에이전트를 빠르게 구축하고 싶을 때