하이브리드 AI 시스템, EDX 보고서 생성 정확도 96.7% 기록
Semantic Scholar
2026년 6월 6일 (토)
- •연구진이 규칙 기반 추출 방식과 LLM을 결합한 전기진단(EDX) 보고서 생성용 하이브리드 시스템을 평가했다.
- •해당 시스템은 2개 의료기관의 332건의 후향적 사례에서 임상의와 96.7%의 일치율을 달성했다.
- •추후 연구를 통해 정상 및 모호한 사례를 포함한 전체 워크플로우 효율성과 임상의 수용성을 검증할 계획이다.
2026년 6월 2일 Muscle & Nerve에 발표된 연구는 전기진단(EDX) 보고서 자동화를 위해 설계된 하이브리드 AI 시스템을 다뤘다. 이 시스템은 규칙 기반 추출기와 제약이 적용된 대규모 언어 모델(Constrained Large Language Model)을 결합하여, 신경 전도 및 근전도 측정값을 표준화된 임상 보고서로 변환한다. 연구진은 2개 기관의 332건(1차 진료 241건, 3차 진료 91건)의 보고서를 바탕으로 후향적 분석을 수행했다. 시스템은 먼저 검사별 기준치를 활용해 비정상 소견을 요약하고, 이후 LLM이 사전 정의된 레이블 목록에서 선택하는 방식으로 진단 해석 초안을 작성한다.
성능 평가에는 진단 레이블의 올바른 선택과 부위 또는 수준의 국소화 정확도를 모두 측정하는 커버리지-국소화 지수(CLI)가 사용됐다. 결과적으로 시스템 출력값과 임상의 해석 사이의 평균 총 일치율은 96.7%(95% CI 95.1–98.1)를 기록했다. 전반적인 일치율은 높았으나 복잡한 검사 사례에서는 다소 낮은 성능을 보였다. 규칙 기반 구성 요소는 정의된 모든 비정상 소견을 성공적으로 포착했으며, LLM은 일관된 표준 초안을 생성했다. 연구 저자들은 이번 평가가 비정상적이고 범위 내에 있는 보고서로 제한됐음을 지적하며, 향후 정상 사례를 포함한 연속적인 일상 임상 데이터에서의 검증을 통해 전체 워크플로우 통합과 임상의 수용성을 평가해야 한다고 강조했다.