Amazon Nova Forge, AI의 '치명적 망각' 해결
- •Amazon Nova Forge는 데이터 믹싱 기술을 통해 모델의 일반 지능 저하를 방지한다.
- •Full-rank 지도 미세 조정을 통해 전문적인 고객 피드백 분류 성능이 17% 향상되었다.
- •데이터 믹싱 덕분에 Nova 2 Lite는 기존 일반 지식 벤치마크의 99%를 유지하는 데 성공했다.
Amazon Web Services(AWS)가 모델의 성능 저하 없이 특정 데이터를 학습시키는 전문 개발 환경, Nova Forge를 공개했다. 일반적으로 기업의 고유 데이터를 AI에 학습시키는 '지도 미세 조정(SFT)' 과정을 거치면, 모델이 특정 분야에는 정통해지지만 기본적인 지시 이행이나 일반 논리 추론 능력을 상실하는 '치명적 망각' 현상이 발생하곤 한다. Nova Forge는 사용자의 고유 데이터셋과 Amazon이 엄선한 훈련 데이터를 혼합하는 방식을 채택하여, 모델이 전문성을 확보하면서도 다재다능함을 유지하도록 설계되었다.
실제로 AWS 팀은 16,000건의 고객 의견을 활용해 Nova 2 Lite와 오픈소스 경쟁 모델들을 비교 평가했다. 이 테스트는 피드백을 1,400개 이상의 정교한 카테고리로 분류하는 난도 높은 과제였으며, 별도의 최적화가 없는 상태에서는 고성능 모델조차 세부적인 분류에 어려움을 겪었다. 하지만 Nova Forge의 Full-rank 지도 미세 조정을 거친 결과, 모델의 정확도는 이전보다 17%나 향상되는 성과를 거두었다.
무엇보다 고무적인 점은 모델이 기존의 일반 지식을 그대로 보존했다는 사실이다. 기존의 표준 미세 조정 모델들은 역사나 수학 등 다양한 분야를 테스트하는 MMLU(Massive Multitask Language Understanding) 벤치마크 점수가 급락하는 경향을 보였으나, 데이터 믹싱이 적용된 Nova 모델은 기존 성능의 99% 수준을 유지했다. 이에 따라 기업들은 내부 물류와 일반적인 비즈니스 커뮤니케이션을 동시에 이해하는 단일 모델을 구축하여 업무 효율성을 극대화할 수 있게 되었다.