이 기사의 핵심 내용은?

연구 결과 ChatGPT가 학습 데이터에 기반해 지능 및 외모에 대한 심각한 지리적 편향성을 드러냄 옥스퍼드대와 켄터키대 연구진은 2천만 개의 비교 프롬프트를 사용하여 GPT-4o-mini의 순위 산정을 강제함 OpenAI는 해당 연구가 구형 모델을 사용했으며 자사 모델은 객관성을 유지하도록 설계되었다고 반박함

ChatGPT, 지역 편향성 논란 제기

•연구 결과 ChatGPT가 학습 데이터에 기반해 지능 및 외모에 대한 심각한 지리적 편향성을 드러냄
•옥스퍼드대와 켄터키대 연구진은 2천만 개의 비교 프롬프트를 사용하여 GPT-4o-mini의 순위 산정을 강제함
•OpenAI는 해당 연구가 구형 모델을 사용했으며 자사 모델은 객관성을 유지하도록 설계되었다고 반박함

•연구 결과 ChatGPT가 학습 데이터에 기반해 지능 및 외모에 대한 심각한 지리적 편향성을 드러냄
•옥스퍼드대와 켄터키대 연구진은 2천만 개의 비교 프롬프트를 사용하여 GPT-4o-mini의 순위 산정을 강제함
•OpenAI는 해당 연구가 구형 모델을 사용했으며 자사 모델은 객관성을 유지하도록 설계되었다고 반박함

옥스퍼드 대학교와 켄터키 대학교 연구진은 ChatGPT에 지리적, 사회적 편향성이 내재되어 있다는 연구 결과를 발표했다. 연구진은 2025년 3월부터 5월 사이 OpenAI의 GPT-4o-mini 모델에 2천만 개 이상의 질문을 던져 AI가 특정 지역을 선택하도록 강제했으며, 이를 통해 지능과 매력도 등에 관한 일관된 순위를 도출했다. 학술지 'Platforms & Society'에 게재된 이 연구에 따르면, 모델은 부유하고 백인 인구 비중이 높으며 이민자 비율이 낮은 지역을 더 똑똑하고, 덜 악취가 나며, 더 아름답다고 평가하는 경향을 보였다.

구체적으로 AI는 매사추세츠주를 가장 똑똑한 지역으로 꼽은 반면, 루이지애나주를 가장 악취가 나는 곳으로, 오하이오주를 가장 추한 곳으로 평가했다. 지적 능력 면에서 켄터키, 웨스트버지니아, 미시시피주를 '가장 멍청한' 인구 집단으로 분류한 반면, 하와이, 콜로라도, 뉴햄프셔주는 가장 덜 멍청한 지역으로 순위를 매겼다. 또한 연구진은 해당 모델이 사하라 이남 아프리카 국가보다 미국 및 서유럽을 우호적으로 평가했음을 지적했다. 켄터키 대학교의 지리학 교수 맷 주크(Matt Zook)는 이러한 결과가 지배적인 서사를 강화하며, 채용 담당자가 특정 지역 출신 지원자를 필터링할 때 AI 도구를 활용하는 등 현실 세계에 부정적 영향을 미칠 수 있다고 경고했다.

UCLA(University of California, Los Angeles)의 교수 사피야 노블(Safiya Noble)은 이러한 결과가 대규모 언어 모델 학습 데이터에 뿌리 깊게 박힌 인종차별과 계급주의의 역사를 반영한다고 지적했다. 이에 대해 OpenAI는 연구진이 구형 모델을 사용했다고 반박하며, ChatGPT는 기본적으로 객관성을 유지하도록 설계되어 고정관념을 지지하지 않는다고 밝혔다. 또한 강제 선택 프롬프트를 사용하는 연구는 일반적인 사용자 상호작용이나 최신 모델의 동작을 대변하지 않는다고 덧붙였다. 다만 OpenAI는 시스템이 비대표적인 비교를 처리하는 방식을 개선하기 위해 지속적으로 노력하고 있다고 인정했다. 그럼에도 불구하고 단순한 거주지만으로 개인의 경력을 다르게 생성하는 등 주관적인 스크립트가 여전히 모델 내부에 깊게 남아있다는 우려가 제기되고 있다.

옥스퍼드 대학교와 켄터키 대학교 연구진은 ChatGPT에 지리적, 사회적 편향성이 내재되어 있다는 연구 결과를 발표했다. 연구진은 2025년 3월부터 5월 사이 OpenAI의 GPT-4o-mini 모델에 2천만 개 이상의 질문을 던져 AI가 특정 지역을 선택하도록 강제했으며, 이를 통해 지능과 매력도 등에 관한 일관된 순위를 도출했다. 학술지 'Platforms & Society'에 게재된 이 연구에 따르면, 모델은 부유하고 백인 인구 비중이 높으며 이민자 비율이 낮은 지역을 더 똑똑하고, 덜 악취가 나며, 더 아름답다고 평가하는 경향을 보였다.

구체적으로 AI는 매사추세츠주를 가장 똑똑한 지역으로 꼽은 반면, 루이지애나주를 가장 악취가 나는 곳으로, 오하이오주를 가장 추한 곳으로 평가했다. 지적 능력 면에서 켄터키, 웨스트버지니아, 미시시피주를 '가장 멍청한' 인구 집단으로 분류한 반면, 하와이, 콜로라도, 뉴햄프셔주는 가장 덜 멍청한 지역으로 순위를 매겼다. 또한 연구진은 해당 모델이 사하라 이남 아프리카 국가보다 미국 및 서유럽을 우호적으로 평가했음을 지적했다. 켄터키 대학교의 지리학 교수 맷 주크(Matt Zook)는 이러한 결과가 지배적인 서사를 강화하며, 채용 담당자가 특정 지역 출신 지원자를 필터링할 때 AI 도구를 활용하는 등 현실 세계에 부정적 영향을 미칠 수 있다고 경고했다.

UCLA(University of California, Los Angeles)의 교수 사피야 노블(Safiya Noble)은 이러한 결과가 대규모 언어 모델 학습 데이터에 뿌리 깊게 박힌 인종차별과 계급주의의 역사를 반영한다고 지적했다. 이에 대해 OpenAI는 연구진이 구형 모델을 사용했다고 반박하며, ChatGPT는 기본적으로 객관성을 유지하도록 설계되어 고정관념을 지지하지 않는다고 밝혔다. 또한 강제 선택 프롬프트를 사용하는 연구는 일반적인 사용자 상호작용이나 최신 모델의 동작을 대변하지 않는다고 덧붙였다. 다만 OpenAI는 시스템이 비대표적인 비교를 처리하는 방식을 개선하기 위해 지속적으로 노력하고 있다고 인정했다. 그럼에도 불구하고 단순한 거주지만으로 개인의 경력을 다르게 생성하는 등 주관적인 스크립트가 여전히 모델 내부에 깊게 남아있다는 우려가 제기되고 있다.