이 기사의 핵심 내용은?

Claude Fable 5가 로컬 코드와 인프라를 독자적으로 수정하며 자율 디버깅 능력을 입증했다. 이 에이전틱 AI는 브라우저 스크린샷 캡처 및 원격 데이터 수집을 위한 자체 파이썬 도구를 설계했다. 보안 전문가들은 통제되지 않은 에이전트의 공격적인 행동이 인젝션 공격에 취약할 경우 심각한 위험을 초래할 수 있다고 경고했다.

Claude Fable 5, 능동적 자율 디버깅 기능 선보여

•Claude Fable 5가 로컬 코드와 인프라를 독자적으로 수정하며 자율 디버깅 능력을 입증했다.
•이 에이전틱 AI는 브라우저 스크린샷 캡처 및 원격 데이터 수집을 위한 자체 파이썬 도구를 설계했다.
•보안 전문가들은 통제되지 않은 에이전트의 공격적인 행동이 인젝션 공격에 취약할 경우 심각한 위험을 초래할 수 있다고 경고했다.

•Claude Fable 5가 로컬 코드와 인프라를 독자적으로 수정하며 자율 디버깅 능력을 입증했다.
•이 에이전틱 AI는 브라우저 스크린샷 캡처 및 원격 데이터 수집을 위한 자체 파이썬 도구를 설계했다.
•보안 전문가들은 통제되지 않은 에이전트의 공격적인 행동이 인젝션 공격에 취약할 경우 심각한 위험을 초래할 수 있다고 경고했다.

소프트웨어 개발자이자 블로거인 사이먼 윌리슨(Simon Willison)은 로컬 환경에서 복잡한 작업을 자율적으로 수행하는 에이전틱 AI 모델, Claude Fable 5의 능동적 기능을 시연했다. 그는 자신의 Datasette Agent 애플리케이션에서 발생한 사소한 CSS 문제, 즉 예기치 않은 가로 스크롤바 현상을 디버깅하던 중 이 AI가 명시적인 지시 없이 운영체제와 브라우저 환경을 자율적으로 탐색하는 과정을 관찰했다. 모델은 프로젝트 의존성 검사를 요청받은 후, 사용자 브라우저를 스스로 식별하고 애플리케이션 템플릿을 수정해 UI 요소 실행을 위한 자바스크립트를 삽입했으며, 심지어 진단용 스크린샷을 찍기 위한 자체 시스템까지 구축했다.

브라우저 데이터 캡처의 제약을 극복하기 위해 Fable 5는 직접 파이썬 솔루션을 개발했다. 이 모델은 pyobjc-framework-Quartz 프레임워크를 활용해 열려 있는 창을 순회하고 'screencapture' 유틸리티로 스크린샷을 촬영했으며, POST 요청을 통해 JSON 형식의 진단 데이터를 수신하는 로컬 'http.server' 인스턴스를 설정했다. 또한 애플리케이션 소스 코드에 자바스크립트 리스너를 삽입해 DOM 요소를 측정하고, 이를 자체 서버로 전송해 디스크에 기록함으로써 분석 데이터를 확보했다.

내부 제한으로 인해 모델이 Claude Opus로 전환된 이후에도, 해당 어시스턴트는 이 방식을 유지하며 문제 해결 과정을 확인했다. 윌리슨은 전체 디버깅 세션에 약 $12.11의 토큰 비용이 발생했다고 밝혔다. 그는 에이전트의 행동을 흥미롭다고 평가하면서도, 이 정도 수준의 능동적이고 제한 없는 시스템 접근 권한은 중대한 보안 위험을 내포한다고 지적했다. 특히 이러한 에이전트가 악의적인 지침에 노출될 경우 임의의 터미널 명령을 실행해 데이터 유출이나 시스템 손상을 일으킬 수 있다고 경고하며, 자율성이 높은 코딩 에이전트를 운영할 때는 안전한 샌드박싱 환경이 필수적이라고 강조했다.

소프트웨어 개발자이자 블로거인 사이먼 윌리슨(Simon Willison)은 로컬 환경에서 복잡한 작업을 자율적으로 수행하는 에이전틱 AI 모델, Claude Fable 5의 능동적 기능을 시연했다. 그는 자신의 Datasette Agent 애플리케이션에서 발생한 사소한 CSS 문제, 즉 예기치 않은 가로 스크롤바 현상을 디버깅하던 중 이 AI가 명시적인 지시 없이 운영체제와 브라우저 환경을 자율적으로 탐색하는 과정을 관찰했다. 모델은 프로젝트 의존성 검사를 요청받은 후, 사용자 브라우저를 스스로 식별하고 애플리케이션 템플릿을 수정해 UI 요소 실행을 위한 자바스크립트를 삽입했으며, 심지어 진단용 스크린샷을 찍기 위한 자체 시스템까지 구축했다.

브라우저 데이터 캡처의 제약을 극복하기 위해 Fable 5는 직접 파이썬 솔루션을 개발했다. 이 모델은 pyobjc-framework-Quartz 프레임워크를 활용해 열려 있는 창을 순회하고 'screencapture' 유틸리티로 스크린샷을 촬영했으며, POST 요청을 통해 JSON 형식의 진단 데이터를 수신하는 로컬 'http.server' 인스턴스를 설정했다. 또한 애플리케이션 소스 코드에 자바스크립트 리스너를 삽입해 DOM 요소를 측정하고, 이를 자체 서버로 전송해 디스크에 기록함으로써 분석 데이터를 확보했다.

내부 제한으로 인해 모델이 Claude Opus로 전환된 이후에도, 해당 어시스턴트는 이 방식을 유지하며 문제 해결 과정을 확인했다. 윌리슨은 전체 디버깅 세션에 약 $12.11의 토큰 비용이 발생했다고 밝혔다. 그는 에이전트의 행동을 흥미롭다고 평가하면서도, 이 정도 수준의 능동적이고 제한 없는 시스템 접근 권한은 중대한 보안 위험을 내포한다고 지적했다. 특히 이러한 에이전트가 악의적인 지침에 노출될 경우 임의의 터미널 명령을 실행해 데이터 유출이나 시스템 손상을 일으킬 수 있다고 경고하며, 자율성이 높은 코딩 에이전트를 운영할 때는 안전한 샌드박싱 환경이 필수적이라고 강조했다.