단순한 터미널 에이전트, 복잡한 기업용 AI 압도
HuggingFace
2026년 4월 3일 (금)
- •ServiceNow 리서치에 따르면, 터미널 기반 에이전트가 기업 업무에서 복잡한 도구 증강 시스템과 대등하거나 더 나은 성능을 보였다.
- •그래픽 기반의 웹 에이전트와 달리, 명령줄 인터페이스와 API만 사용하는 코딩 에이전트는 운영 오버헤드를 크게 줄여준다.
- •강력한 파운데이션 모델과 단순한 프로그래밍 인터페이스의 조합만으로도 충분히 자율적인 비즈니스 자동화 구현이 가능하다는 분석이다.
ServiceNow AI의 최신 연구가 비즈니스용 복잡한 AI 에이전트를 구축하려는 현재의 트렌드에 의문을 제기했다. 많은 개발자가 인간 사용자처럼 그래픽 인터페이스를 탐색하는 '웹 에이전트'에 집중하고 있지만, 이번 연구는 오히려 단순한 접근 방식이 더 우수할 수 있다고 주장한다. 실제로 연구진은 코딩 에이전트에게 터미널과 파일 시스템, 직접적인 API 접근 권한만 부여함으로써 기업 워크플로를 더 높은 효율성과 낮은 비용으로 자동화하는 데 성공했다.
이러한 결과의 핵심은 프로그래밍 인터페이스에 있다. 시각적 화면을 해석하는 과정에서 오류가 발생하기 쉽고 처리 요구량도 많은 기존 방식과 달리, '터미널 에이전트'는 가공되지 않은 코드와 명령줄 지침을 통해 시스템과 직접 상호작용한다. 이러한 직접적인 통신 방식 덕분에 파운데이션 모델은 그래픽 사용자 인터페이스(GUI)라는 '노이즈'에 방해받지 않고 복잡한 논리를 정확하게 실행할 수 있게 된다.
다양한 시스템에서 에이전트 성능을 평가한 결과, 저수준의 터미널 에이전트는 Model Context Protocol (MCP)을 활용하는 정교한 아키텍처와 대등하거나 오히려 이를 능가하는 성과를 거두었다. 특히 단순한 텍스트 기반 인터페이스와 강력한 모델의 조합은 실질적인 비즈니스 자동화 환경에서 충분한 성능을 발휘할 뿐만 아니라, 안정적인 결과물을 얻기 위해 더 선호되는 방식임을 시사한다.