대규모 언어 모델(LLM), 관용구의 문화적 맥락을 이해할까
- •ChatGPT와 Microsoft Copilot의 아랍어 관용구 번역 능력을 분석한 연구 발표
- •두 모델 모두 서로 다른 전략을 통해 언어적 뉘앙스를 효과적으로 구현함
- •대규모 언어 모델(LLM)이 창의적 번역 교육을 위한 도구로 활용될 가능성을 확인
외국어를 학습할 때 직역은 흔히 함정에 빠지기 쉽다. 특히 관용구는 단어의 문자 그대로의 의미를 넘어선 독특한 표현으로, 해당 언어의 문화적 맥락과 역사, 사회적 이해가 깊이 깔려 있다. 통계적인 방식으로 정보를 처리하는 대규모 언어 모델(LLM)이 이러한 창의적이고 문화적인 미묘함을 파악할 수 있는지는 그동안 학계의 주요 과제였다. 최근 'Journal of Science and Knowledge Horizons'에 게재된 연구는 현대 AI가 아랍어 관용구를 영어로 번역하는 과정을 분석하여 이 질문에 정면으로 답했다.
연구진은 ChatGPT와 Microsoft Copilot 두 모델을 대상으로 다섯 가지 표준 아랍어 관용구 번역을 요청했다. 이때 번역 이론가 로렌스 베누티(Lawrence Venuti)가 제시한 '외국화'와 '국내화' 프레임워크를 적용했다. 외국화는 원문의 문화적 향취와 구조를 보존하는 방식이며, 국내화는 도착어 문화에 자연스럽게 녹아들도록 바꾸는 방식을 뜻한다. 이번 결과는 AI 기반 언어학의 미래를 밝게 전망하는 근거가 되었다.
분석 결과, 두 모델 모두 효율적인 번역 능력을 보였으나 그 방법론에는 차이가 있었다. ChatGPT는 원문의 느낌을 살리는 외국화 전략을 선호한 반면, Microsoft Copilot은 외국화와 국내화를 혼합하여 자연스러우면서도 본래 의미를 유지하는 하이브리드 전략을 취했다. 이는 AI가 단순히 어휘를 나열하는 수준을 넘어 문화적 의도를 어떻게 전달할지 능동적으로 선택하고 있음을 시사한다.
이번 성과는 언어 교육의 새로운 가능성을 열어준다. 전통적으로 관용구 학습에는 긴 시간의 문화적 몰입과 반복적인 연습이 필요했다. 하지만 이번 연구는 AI가 학생들이 다양한 번역 전략을 실험하고 문화적 차이를 비교할 수 있는 정교한 실습실이 될 수 있음을 보여준다.
우리는 AI가 인간의 기술을 대체하는 존재를 넘어, 서로 다른 문화적 틀 사이를 연결하고 이해를 돕는 사고의 동반자로서 자리 잡는 미래를 향해 나아가고 있다. 대규모 언어 모델(LLM)이 일상 업무에 깊숙이 통합될수록, 이러한 문화적 지능은 데이터 처리 능력만큼이나 중요한 역량이 될 것이다.