GPT 5.4, 법률 계약 분석 정확도 신기록 경신
- •GPT 5.4가 법률 계약서 분석 정확도 79.4%를 기록하며, 이전 버전 대비 전체 오류율을 21% 개선했다.
- •파이낸셜 타임스(Financial Times)가 초안 작성 및 규제 준수 자동화를 위한 엔터프라이즈 법률 AI 플랫폼으로 Wordsmith를 선정했다.
- •대형 로펌의 브랜딩을 활용한 Claude 프롬프트가 자동 법률 자문의 품질과 신뢰성 논란을 야기했다.
법률 기술 업계는 범용 모델이 정교한 초안 작성 보조 도구로 진화함에 따라 가파른 성능 향상을 경험하고 있다. 최근 LegalOn이 발표한 벤치마크에 따르면 GPT 5.4는 계약서 분석에서 79.4%의 정확도를 기록했으며, 이는 전작 대비 5.5%포인트 상승한 수치다. 이러한 점진적 성장은 완전한 자율 법률 업무가 여전히 미래의 과제임을 보여주는 동시에, 오류율 감소가 주니어 변호사들의 업무 부담을 실질적으로 경감하고 있음을 시사한다.
다만 이러한 기술적 진보가 항상 순탄한 것은 아니다. 최근 소셜 미디어에서는 출력 결과에 영향을 미치기 위해 유명 로펌의 이름을 인용한 Claude 프롬프트가 등장하며 법률 자문 자동화의 위험성에 대한 논쟁이 불거졌다. 비록 인공지능이 방대한 문서를 생성할 수는 있으나, 전문가의 감수가 누락된 자동화 결과물은 의뢰인에게 심각한 법적 책임을 지울 수 있다는 전문가들의 경고가 잇따르고 있다.
기업들의 AI 도입 행보는 이러한 우려 속에서도 더욱 가속화되는 양상이다. 실제로 파이낸셜 타임스(Financial Times)는 법무 및 규제 준수 부서 전반에 Wordsmith 플랫폼을 통합하며 전사적 AI 솔루션 도입의 신호탄을 쐈다. 아울러 법률 AI 스타트업 Harvey는 프로 스포츠 업계로 보폭을 넓혀 댈러스 매버릭스와 풀럼 FC의 공식 법률 AI 제공업체로 선정되는 성과를 거두었다.
특히 문서 전반의 복잡한 논리를 처리하는 특화 시스템이 속속 등장하면서 범용 모델과 전문 법률 AI 사이의 간극은 점차 좁아지고 있다. 현재의 도구들은 정의된 용어를 추적하고 조건부 논리를 높은 정밀도로 매핑하는 수준에 도달했다. 이는 고도의 정확성이 요구되는 거래법 분야에서 인용 기반 데이터 추출의 새로운 표준을 정립하고 있다.