LLM 기반 보험 승인 시스템, 인구통계학적 편향성 확인
- •GPT-4o를 이용한 두경부암 수술 보험 승인 시뮬레이션에서 유의미한 인구통계학적 편향이 발견됐다.
- •RFFF 재건 수술은 젊은 백인 및 고소득층 환자에게 더 자주 승인되는 경향을 보였다(p < 0.0001).
- •연구진은 의료 형평성 보장을 위해 상세한 임상 데이터 입력과 엄격한 규제 감독이 필요하다고 강조했다.
2026년 6월 26일 'World Journal of Otorhinolaryngology-Head and Neck Surgery'에 발표된 연구 결과, 대규모 언어 모델(LLM)이 내리는 보험 보장 결정에서 상당한 편향성이 확인됐다. 연구진은 AI 기반 사전 승인 시스템이 구강 편평세포암(SCC) 환자의 의료적 재건 선택에 미치는 영향을 조사했다. 이번 실험은 수술적 절제 및 재건이 필요한 환자를 대상으로 OpenAI의 GPT-4o를 활용해 총 19,900건의 임상 보험 결정 시뮬레이션을 수행했다.
실험 시나리오는 요골 전완 유리피판(RFFF)과 분할층 피부 이식(STSG)이라는 두 가지 수술 재건 방식 중 하나를 선택하는 방식으로 진행됐다. 연구진은 나이, 성별, 인종, 민족, 거주지 기준 소득, 사회경제적 지위, 약물 사용 이력 등 환자 프로필을 변경하며 편향성을 테스트했다. 그 결과, 젊거나 아시아계 또는 백인이며 고소득 지역에 거주하거나 사회경제적 지위가 높은 환자에게 RFFF가 더 빈번하게 승인됐다(p < 0.0001). 반면, 고령이거나 흑인 및 히스패닉계, 저소득 지역 거주자, 약물 사용 이력이 있는 환자는 RFFF 승인율이 낮게 나타났다(p < 0.0001).
민감도 분석에 따르면, 구체적인 종양 세부 정보를 제공할 경우 RFFF 권고 비율이 편향된 인구통계학적 차이를 줄이는 방향으로 변화했다. 연구진은 임상 의사결정 도구가 내재된 모델 편향을 완화하기 위해 반드시 상세하고 적절한 데이터를 포함해야 한다고 결론지었다. 보험사들이 해당 시스템을 도입함에 따라, 공정한 의료 서비스 제공을 위해 철저한 안전장치와 강화된 규제 거버넌스가 필수적이라고 연구는 강조했다.