주요 LLM 정치적 성향 분석 보고서 발표
- •Trakkr.ai가 웹 검색 없이 4,400개의 응답을 활용해 6개 주요 대규모 언어 모델(LLM)의 정치적 성향을 분석했다.
- •Gemini와 DeepSeek가 가장 중립적인 것으로 나타났으며, ChatGPT와 Llama는 일관되게 좌파 성향을 보였다.
- •모델들이 표방하는 정치적 중립성과 경제적 축에서 측정된 실제 출력값 사이에는 상당한 차이가 존재하는 것으로 확인됐다.
2026년 6월 1일 발표된 Trakkr.ai의 연구는 정치, 경제, 언론, 사회 분야의 민감한 질문들을 통해 6개 주요 AI 모델의 정치적 성향을 지도화했다. 웹 검색 기능을 차단하고 진행된 이 분석은 총 4,400개의 응답을 수집하여 외부 데이터의 영향력을 배제한 모델 고유의 답변을 추출했다. 분석 결과, 6개 모델 중 4개 모델이 정치적 중심점보다 좌측으로 치우쳐 있는 것으로 나타났다.
각 모델은 중심점과의 근접도 및 입장의 일관성을 기준으로 순위가 매겨졌다. Gemini가 중심점에 가장 가까웠고 DeepSeek와 Llama가 그 뒤를 이었다. Claude는 4위, 우파 성향을 보인 Grok이 5위, 좌파 성향의 ChatGPT가 6위를 기록했다. 특히 모델별 세부 지표에서 Grok은 97%의 편향률을 보인 반면, Gemini는 11%의 편향률과 98%의 일관성을 나타내며 안정적인 모습을 보였다.
연구는 모델이 스스로 밝히는 정치적 입장과 경제적 축상에서의 실제 측정값도 비교했다. DeepSeek와 Gemini는 스스로 주장하는 중립성과 실제 측정값이 일치했으나, ChatGPT와 Llama는 중립성을 표방함에도 실제로는 좌파 성향으로 분류됐다. 또한 Grok은 주장보다 0.36단위 우측에, Claude는 0.34단위 좌측에 위치했다.
분석의 기준점은 CHES 2024와 V-Dem 전문가 설문을 활용했다. ChatGPT는 독일 녹색당(Die Grünen), Claude와 Llama는 뉴질랜드 노동당, Gemini와 DeepSeek는 앤서니 앨버니지(Anthony Albanese) 총리가 이끄는 호주 노동당의 위치와 유사하게 매핑됐다. Grok은 프랑스의 에마뉘엘 마크롱(Emmanuel Macron) 대통령의 위치와 가장 가깝게 나타났다.
이번 연구는 미성년자 성별 확정 치료, 화석 연료 단계적 폐지, 다양성 할당제 등 구체적인 정책 현안에 대한 모델별 의견 차이를 평가했다. 중립적인 분류기를 통해 평가된 원본 출력값은 95% 신뢰 구간의 가중 평균으로 계산됐다. 해당 데이터는 재계산이 가능하도록 보존되며, 사용자가 동일한 설문을 직접 수행하여 자신의 정치적 좌표와 모델을 비교해 볼 수 있는 기능도 제공된다.