AI, 문맥 학습으로 스스로 기술을 습득하다
- •Ctx2Skill 프레임워크를 통해 언어 모델이 인간의 개입 없이 스스로 기술을 발견하고 정교화한다.
- •다중 에이전트 자기 대국 루프를 활용해 탐색 과제를 생성, 해결 및 평가한다.
- •교차 시간 재학습 메커니즘을 적용하여 자율적인 기술 진화 과정에서 발생할 수 있는 적대적 붕괴를 방지한다.
대규모 언어 모델(LLM)은 놀라운 성능을 보여주지만, 학습이 완료되면 지식이 고정되는 근본적인 한계를 지닌다. 특히 복잡한 법률 계약서나 전문 기술 매뉴얼처럼 방대한 문서를 다룰 때, 모델은 단순 읽기만으로는 새로운 정보를 효과적으로 학습하지 못한다. 이를 극복하기 위한 문맥 학습은 모델의 재학습 없이도 새로운 정보에 적응할 수 있게 해주는 핵심적인 능력이다.
기존에는 모델이 텍스트에서 특정 '기술'을 추출하도록 가르치기 위해 인간이 직접 문서를 주석 처리하고 규칙을 정의해야 했다. 이러한 방식은 느리고 비용이 많이 들며 확장성도 낮다. Ctx2Skill 프레임워크는 이러한 인간의 개입을 완전히 배제하고, 모델 스스로 체계적인 토론을 통해 유용한 지식을 추출하도록 설계되었다.
Ctx2Skill의 핵심은 다중 에이전트 자기 대국 시스템이다. 세 명의 학생이 협력하듯, '도전자'는 어려운 퀴즈를 내고 '추론자'는 문제를 풀며, '평가자'는 답안을 채점한다. 이들은 역할을 번갈아 맡으며 경쟁하는 과정에서 무엇이 효과적인지 스스로 파악한다. 모델은 자신의 성공과 실패를 성찰하며 복잡한 과제를 해결하는 방법을 스스로 깨우친다.
모델이 통제 불가능한 과제를 만들거나 쓸모없는 기술을 학습하는 '적대적 붕괴'는 자율 AI 연구의 흔한 걸림돌이다. 연구진은 이를 해결하기 위해 교차 시간 재학습 메커니즘을 도입했다. 이는 과거의 성공적인 사례들을 아카이브처럼 활용하여, 새로운 기술을 학습하는 동안에도 모델이 기존의 기초 지식을 망각하지 않도록 방지하는 장치다.
이번 연구는 자율적이고 적응력 있는 소프트웨어 개발에 중요한 이정표를 제시한다. 고정된 모델에서 스스로 진화하는 프레임워크로 나아감에 따라, AI는 단순한 백과사전을 넘어 숙련된 조수처럼 변모하고 있다. 향후 모델들은 개발자가 별도의 코드를 작성하지 않아도 사용자의 복잡한 문서를 즉시 파악하고 그 안의 업무 흐름을 마스터하게 될 것이다.