공공 오픈소스 AI 에이전트의 안전한 확장 전략
- •OpenClaw, 1,300건 이상의 보안 리포트 처리 및 87%의 위협 리포트 무효화
- •플러그인 기반 구조로 핵심 코드 공격 표면 축소 및 시스템 안정성 강화
- •엔터프라이즈 환경 대응을 위한 엄격한 CI 기반 릴리스 및 가시성 메트릭 도입
AI 에이전트는 컴퓨터 도구를 자율적으로 조작하는 강력한 소프트웨어이다. 그러나 이를 오픈소스로 구축하는 과정에서 보안은 흔히 오픈소스의 정신과 충돌한다고 여겨지곤 한다. 오픈소스 AI 에이전트 플랫폼 OpenClaw의 리드 개발자인 피터 스타인버거(Peter Steinberger)는 이 프로젝트가 실험적인 맥(Mac) 유틸리티에서 엔터프라이즈급 생산 환경 플랫폼으로 진화해 온 과정을 공유했다. 핵심 난관은 오픈소스는 본질적으로 불안전하다는 오해였다. 피터 스타인버거는 투명성이야말로 소프트웨어 견고함을 확보하는 가장 빠른 길이며, 대중의 검증은 폐쇄형 시스템이 모방할 수 없는 강력한 보안 감사를 제공한다고 강조한다.
OpenClaw는 올해 1월부터 1,300건이 넘는 방대한 보안 리포트를 접수했다. 흥미로운 점은 ‘심각한’ 보안 위협이라고 주장하는 리포트일수록 오탐지일 확률이 높았다는 사실이다. 많은 연구자가 플러그인 실행이나 도구 사용 기능처럼 에이전트의 정상적인 작동 방식을 취약점으로 오인했다. 이른바 ‘천 번의 서투름으로 인한 죽음(death by a thousand slops)’ 현상이 발생한 것인데, 이는 큐얼(curl) 프로젝트에서 처음 알려진 용어이다. 이에 따라 팀은 SECURITY.md 파일을 통해 엄격한 심사 기준을 마련하고, 정상 작동과 실제 보안 위협을 구분하는 시스템을 구축했다.
기술적으로는 에이전트의 핵심 코어를 최소화하고 기능을 모듈형 플러그인으로 분리하는 큰 변화를 시도했다. 이는 공격자가 데이터에 접근하거나 탈취할 수 있는 지점인 ‘공격 표면’을 줄이고 의존성 트리를 더욱 명확하게 관리하기 위함이다. 또한 로그와 프롬프트에 민감한 정보가 노출되지 않도록 레퍼런스 기반의 정보 처리 방식을 도입하고, 모든 코드 제출마다 엔드투엔드 테스트를 자동으로 실행하여 프로젝트를 실무적인 엔터프라이즈 도구로 격상시켰다.
이러한 보안 강화 과정의 핵심은 협력이었다. 엔비디아, 마이크로소프트, 오픈AI와 같은 거대 기업의 지원을 받으며 프로젝트는 개인의 열정을 넘어 재단이 뒷받침하는 조직으로 성장했다. 이러한 파트너십은 자금 지원뿐만 아니라 가시성 확보, 취약점 동기화, 견고한 배포 파이프라인 구축에 집중하는 우수한 엔지니어링 인재를 확보하는 계기가 되었다. 심지어 자체적으로 ‘클로스위퍼(ClawSweeper)’라는 도구를 개발해 리포트 심사를 자동화하며 프로젝트 운영의 혁신을 증명했다.
결국 보안은 한번 달성하면 끝나는 상태가 아니라 지속적인 과정이다. OpenClaw는 보안 리포트를 치명적인 실패가 아닌 귀중한 데이터로 간주함으로써 실험적 코드와 현장 활용 가능한 인프라 사이의 간극을 성공적으로 메웠다. 미래의 AI를 고민하는 학생들에게 전하는 메시지는 명확하다. 오래 지속될 소프트웨어를 만들고 싶다면, 모든 것을 공개하고 비판을 수용하며 심사 과정을 자동화하라는 것이다.