개발자, LLM 활용해 RAR 압축 구현체 공개
- •개발자가 LLM을 활용해 만든 RAR 압축 형식의 무료 Rust 구현체 'rars'를 공개했다.
- •이 프로젝트는 5주간 £40의 토큰 비용을 들여 Codex 5.5와 Claude Opus 4.7로 55,000줄의 코드를 작성했다.
- •자율 AI 에이전트와 철저한 테스트를 통해 WinRAR과 5-10% 수준의 성능 차이를 달성했다.
한 개발자가 5주에 걸쳐 AI 모델로 이진 파일을 리버스 엔지니어링하고 사양을 문서화하여 RAR 압축 형식을 완벽하게 구현한 Rust 프로젝트 'rars'를 선보였다. 기존 독점 형식이던 RAR을 무료 소프트웨어로 구현한 이 프로젝트에는 OpenAI Codex 5.5와 Claude Opus 4.7이 사용되었으며, 총 55,000줄의 코드를 작성하는 데 약 £40의 토큰 비용이 소요됐다. 이 구현체는 접근이 까다롭던 RAR 1.3 및 1.4 버전을 포함한 다양한 버전을 지원한다.
개발 과정은 unar, libarchive, UNRARLIB 등 오픈소스 압축 해제 도구의 정보를 모으고, Ghidra와 DOSBox-x를 이용한 리버스 엔지니어링을 병행하여 사양을 처음부터 정의하는 방식으로 진행됐다. 작성자는 Claude를 아키텍처와 문서화 전략가로, Codex를 실무 실행자로 배치하는 구조를 채택했다. 또한, AI가 잘못된 정보를 생성하는 환각 현상을 방지하기 위해 단위 테스트, 헥스 덤프 분석, 문맥 초기화에 대비한 지속적인 격차 문서화 시스템을 구축하여 코드 품질을 관리했다.
OpenAI 모델의 '/goal' 기능을 활용한 자율 루프 시스템은 암호화, 복구 기록, 멀티 볼륨 지원과 같은 복잡한 작업을 16시간씩 수행했다. 그 결과, 압축 성능은 WinRAR과 5-10% 내외의 차이를 보였으며 일부 상황에서는 더 뛰어난 성능을 나타내기도 했다. 다만, 안전한 Rust 코드의 특성과 수동 C 개발 시 적용되는 저수준 성능 최적화가 부재해 기존 도구보다는 다소 느리다. 현재 'cargo install rars-cli' 명령어를 통해 crates.io에서 이용 가능하다.
이번 사례는 LLM 기반 개발의 강력한 잠재력과 동시에 한계를 보여준다. AI 모델은 Rust 코드 생성과 자율 연구에는 탁월했지만, 사용자 경험이나 복잡한 아키텍처 설계에서는 여전히 취약점을 드러냈다. 작성자는 인간의 개입과 구조적 감독 없이는 코드 품질이 급격히 저하될 수 있음을 지적하며, 자율 코딩 과정에서의 아키텍처 관리가 여전히 중요하다고 강조했다.