AI 에이전트

인지하고, 추론하고, 행동하는 자율 시스템.

Unlike standard AI models (like a chatbot that only replies when spoken to), AI Agents are goal-oriented and autonomous. They operate in loops: Observe -> Think -> Act. An agent can be given a high-level objective (e.g., 'Book a flight to London under $500'), and it will independently figure out the steps: checking dates, comparing prices, and navigating websites, adapting its plan if it encounters errors.

        graph LR
  Center["AI 에이전트"]:::main
  Pre_artificial_intelligence["artificial-intelligence"]:::pre --> Center
  click Pre_artificial_intelligence "/terms/artificial-intelligence"
  Pre_reinforcement_learning["reinforcement-learning"]:::pre --> Center
  click Pre_reinforcement_learning "/terms/reinforcement-learning"
  Pre_large_language_model["large-language-model"]:::pre --> Center
  click Pre_large_language_model "/terms/large-language-model"
  Rel_automation["automation"]:::related -.-> Center
  click Rel_automation "/terms/automation"
  Rel_agentic_ai["agentic-ai"]:::related -.-> Center
  click Rel_agentic_ai "/terms/agentic-ai"
  Rel_generative_ai_agents["generative-ai-agents"]:::related -.-> Center
  click Rel_generative_ai_agents "/terms/generative-ai-agents"
  classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
  classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
  classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
  classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
  linkStyle default stroke:#4b5563,stroke-width:2px;

      

🧒 5살도 이해할 수 있게 설명

🤖 AI 에이전트는 스스로 보고, 생각하고, 작업을 수행하여 일을 처리할 수 있는 초지능적인 조수와 같습니다.

🤓 Expert Deep Dive

## "AI 에이전트"에 대한 기술 분석

AI 에이전트는 자율 운영을 위해 설계된 정교한 계산 시스템을 나타냅니다. 핵심적으로 이들은 인식, 추론, 행동이라는 세 가지 중요한 하위 시스템을 통합합니다.

인식 하위 시스템은 환경 감지 및 해석을 담당합니다. 이 하위 시스템은 카메라, LiDAR, 마이크와 같은 다양한 센서와 API 및 데이터베이스와 같은 디지털 인터페이스를 활용합니다. 데이터 양식은 이미지, 오디오, 텍스트 및 구조화된 형식을 포괄합니다. 원시 센서 데이터는 딥러닝 임베딩, 객체 감지, 음성-텍스트 변환과 같은 기술을 사용하여 엄격한 전처리 및 특징 추출을 거쳐 강력한 내부 상태 표현을 생성합니다. 이 표현은 기호적, 준기호적 또는 확률적일 수 있으며, 동적 환경에서 작동하는 에이전트의 경우 동시 위치 확인 및 지도 작성(SLAM)과 같은 고급 개념을 통합하여 환경 모델링 및 상태 추정을 가능하게 합니다.

추론 하위 시스템은 에이전트의 인지 엔진을 형성하며, 인식 입력, 내부 지식 및 정의된 목표를 처리하여 최적의 행동을 결정합니다. 이는 규칙 기반 시스템 및 유한 상태 기계부터 마르코프 결정 과정(MDP) 및 부분 관찰 가능 마르코프 결정 과정(POMDP)과 같은 고급 확률 모델에 이르기까지 정교한 의사 결정 프레임워크를 포함합니다. A* 및 몬테카를로 트리 검색(MCTS)과 같은 계획 알고리즘이 자주 사용되며, 최적 행동 학습을 위한 다양한 강화 학습(RL) 패러다임(가치 기반, 정책 기반, 모델 기반)도 함께 사용됩니다. 지식 표현 및 추론(KRR) 기술, 즉 지식 그래프 및 온톨로지를 포함하여 구조화된 지식 액세스 및 논리적 추론을 용이하게 합니다.

행동 하위 시스템은 추론된 결정을 실질적인 환경 상호 작용으로 변환합니다. 이는 로봇 조작기와 같은 물리적 메커니즘과 API 호출 및 GUI 자동화와 같은 디지털 수단을 포함하는 다양한 작동기 및 인터페이스를 통해 달성됩니다. 행동 공간은 이산적이거나 연속적일 수 있으며, 정교한 행동 시퀀싱 및 물리적 에이전트의 경우 궤적 생성이 필요합니다. 피드백 루프와 오류 감지/복구 프로토콜을 활용하는 폐쇄 루프 제어 메커니즘은 실시간 환경 변화에 적응하여 행동의 정확하고 강력한 실행을 보장합니다.

에이전트 아키텍처는 구성 요소 전문화를 허용하는 모듈식 설계부터 엔드투엔드 시스템까지 다양할 수 있습니다. 자율성, 견고성 및 설명 가능성의 수준은 핵심 설계 고려 사항이며, 조정, 통신 및 협상을 위한 프로토콜을 필요로 하는 다중 에이전트 시스템(MAS) 내에서의 잠재적 상호 작용도 마찬가지입니다.

🔗 관련 용어

📚 출처