사이먼 윌리슨, 빅토리아 시대풍 챗봇 'Mr. Chatterbox' 공개
- •개인용 컴퓨터에서 로컬로 실행되는 윤리적 학습 모델 'Mr. Chatterbox 0.1' 출시
- •1837년부터 1899년까지의 빅토리아 시대 영국 문헌 28,000여 건을 기반으로 학습
- •범용성보다 역사적 언어 표현의 정확성에 집중한 특화된 '약인공지능' 모델
Django 웹 프레임워크의 공동 제작자인 사이먼 윌리슨(Simon Willison)이 빅토리아 시대 영국 담론을 재현하도록 설계된 특화 AI 모델인 llm-mrchatterbox 0.1을 출시했다. 이 프로젝트는 1837년부터 1899년 사이에 출판된 28,000개 이상의 문헌으로 구성된 선별된 말뭉치를 활용하며, 19세기 특유의 격식 있는 산문과 문화적 뉘앙스를 담아낸 차별화된 언어 프로필을 제공한다. 방대한 범용 모델과 달리, 이 '약인공지능(weak)' 모델은 광범위한 문제 해결보다는 역사적 캐릭터의 특성을 구현하는 데 최적화되었다.
Mr. Chatterbox는 윌리슨의 'llm' 도구용 플러그인 형태로 제공되어 사용자가 자신의 하드웨어에서 직접 로컬 추론을 수행할 수 있게 해준다. 이러한 방식은 높은 수준의 데이터 프라이버시를 보장하며, 지속적인 인터넷 연결이나 제3자 서버에 대한 의존도를 제거한다. 특히 로컬 실행 방식을 채택함으로써 연구자와 애호가들은 높은 컴퓨팅 비용 부담 없이 역사적 언어학을 탐구할 수 있는 유용한 수단을 확보하게 되었다.
프로젝트의 핵심 테마는 '윤리적 학습'으로, 출처가 명확하고 퍼블릭 도메인 권리를 존중하는 데이터셋 사용에 대한 의지를 강조한다. 이러한 방법론은 대형 기술 기업들이 흔히 채택하는 무분별한 데이터 수집 전략과는 대조적이다. 실제로 윌리슨은 구체적이고 잘 정의된 역사적 데이터셋에 집중함으로써 투명성과 컴퓨팅 효율성을 유지하면서도 니치 모델이 얼마나 가치 있고 몰입감 있는 경험을 제공할 수 있는지 증명했다.