HoloTab, 웹 브라우저를 자율형 AI 에이전트로 전환하다
- •HCompany가 웹 인터페이스를 탐색하고 작업을 자율적으로 수행하는 크롬 확장 프로그램 'HoloTab'을 출시했다.
- •사용자가 화면 기록을 통해 반복적인 업무 흐름을 자동화할 수 있는 '루틴(Routines)' 기능을 도입했다.
- •HoloTab은 고도화된 비전 및 행동 계획 모델을 활용하여 별도의 코딩 없이도 브라우저 요소를 직접 제어한다.
오늘날 인터넷은 현대인의 일상에서 가장 중요한 운영체제와 다름없지만, 우리는 여전히 복잡한 클릭과 수동 조작에 많은 시간을 허비하고 있다. 탭 사이를 이동하며 데이터를 옮기거나, 구인 게시판을 일일이 확인하고, 정보를 엑셀 시트로 옮기는 단순 작업은 매우 소모적이다. 이러한 비효율을 해결하기 위해 HCompany는 새로운 브라우저 확장 프로그램인 HoloTab을 선보였다. 이 도구는 브라우저를 자율형 AI 에이전트로 변화시켜, 인간이 하는 방식 그대로 웹을 탐색하고 업무를 처리하게 돕는다.
단순히 텍스트를 생성하는 수준을 넘어, 이 시스템은 필드 입력, 버튼 클릭, 복잡한 의사결정 등 웹 브라우저 안에서 직접 행동을 수행한다. 이러한 능력은 멀티모달 모델에 기반을 두고 있다. 멀티모달 모델은 웹 인터페이스의 시각적 정보와 사용자의 텍스트 명령을 동시에 처리하고 해석하는 능력을 갖췄다. 따라서 페이지 레이아웃이 어떻게 구성되어 있든 상관없이 제출 버튼이나 가격 정보 같은 요소를 정확히 식별해낸다.
학생과 직장인에게 가장 실용적인 기능은 바로 '루틴'이다. 매일 반복되는 경쟁사 가격 조사나 데이터 업데이트 같은 지루한 작업들을 HoloTab이 대신 처리해 줄 수 있다. 사용자가 직접 작업을 한 번 수행하며 기록하면, 시스템은 그 맥락을 파악하고 학습하여 이후 동일한 프로세스를 클릭 한 번으로 자동 실행한다. 30분짜리 단순 반복 업무가 단 한 번의 클릭으로 완성되는 셈이다.
이번 제품의 핵심은 컴퓨터 소프트웨어 인터페이스와 상호작용하도록 모델을 훈련하는 Computer-use AI 기술을 사용자 친화적으로 구현했다는 점이다. 기존에는 이러한 자동화를 구현하려면 고도의 프로그래밍 지식이나 복잡한 API 연동이 필수적이었다. 하지만 HCompany는 기술적 장벽을 제거하고 누구나 쉽게 사용할 수 있도록 복잡성을 브라우저 확장 프로그램 이면으로 숨겼다.
AI 에이전트의 신뢰도가 높아짐에 따라 '컴퓨터 작업'의 정의는 점차 좁아질 전망이다. 이제 인간은 디지털 세상의 반복적이고 수동적인 노동을 소프트웨어에 위임할 수 있게 되었다. 이러한 변화는 이미 우리 브라우저 탭 안에서 현실로 나타나고 있다.