이 기사의 핵심 내용은?

바이트댄스가 코딩 에이전트의 토큰 사용량을 최대 54%까지 줄여주는 SWE-Pruner를 발표했다. 6억 개의 파라미터를 가진 '뉴럴 스키머'가 특정 작업 목표에 맞춰 코드를 선택적으로 압축한다. Claude Code와 같은 모델의 성능 저하를 최소화하면서도 운영 비용을 획기적으로 낮췄다.

바이트댄스, 코딩 에이전트 비용 50% 절감하는 SWE-Pruner 공개

•바이트댄스가 코딩 에이전트의 토큰 사용량을 최대 54%까지 줄여주는 SWE-Pruner를 발표했다.
•6억 개의 파라미터를 가진 '뉴럴 스키머'가 특정 작업 목표에 맞춰 코드를 선택적으로 압축한다.
•Claude Code와 같은 모델의 성능 저하를 최소화하면서도 운영 비용을 획기적으로 낮췄다.

코딩 에이전트는 소프트웨어 개발의 패러다임을 바꿨지만, 거대한 장벽에 가로막혀 있었다. 복잡한 전체 코드를 이해하기 위해 필요한 방대한 컨텍스트 윈도우 때문이다. 상호작용 기록이 늘어날수록 비용과 지연 시간은 기하급수적으로 증가하기에, 기존의 데이터 단축 방식은 코드의 논리 구조를 손상시켜 AI가 맥락을 놓치게 만드는 한계가 있었다. 바이트댄스가 공개한 SWE-Pruner는 숙련된 개발자가 버그를 찾을 때 코드를 훑어보는 직관에서 착안했다. 단순히 텍스트를 잘라내는 것이 아니라, 6억 개의 파라미터를 갖춘 효율적인 뉴럴 스키머를 활용. 이 모델은 오류 수정이나 기능 추가 등 특정 목표에 부합하는 핵심 코드 라인만을 정교하게 추려내는 필터 역할을 수행한다. 작업 목표를 반영한 프루닝 덕분에 코드의 문법적 구조인 구문(Syntax)이 그대로 유지된다. 실제 검증 결과, SWE-Bench Verified 벤치마크에서 토큰 소모량을 50% 이상 줄이는 데 성공했다. 이러한 접근은 Claude Code 같은 하이엔드 모델 사용 시 발생하는 비용 부담을 대폭 낮춰, 개발자가 더 복잡한 기능을 적은 비용으로 구축할 수 있게 돕는다. 이번 연구는 AI 효율성의 미래가 단순히 거대 모델에 있는 것이 아니라, 정보를 다루는 영리한 방식에 있음을 보여준다. 에이전트에게 선택적 읽기 능력을 부여함으로써, 정확도는 유지하면서도 AI 기반 프로그래밍의 연산 발자국을 혁신적으로 줄일 수 있게 됐다.