Anthropic, Claude AI로 화학 NMR 분석 성능 검증
- •Anthropic은 20개의 합성 화합물을 활용해 Claude 모델의 NMR 분석 성능을 업계 표준 소프트웨어와 비교했다.
- •Opus 4.7은 수소 NMR 예측에서 ±0.079 ppm의 정확도를 기록하며 기존 전문 소프트웨어와 대등하거나 더 뛰어난 성능을 보였다.
- •Claude 모델은 별도의 화학 분야 미세 조정 없이도 역구조 해석(inverse structure elucidation) 작업이 가능함을 입증했다.
Anthropic 연구진은 합성 및 전산 화학자들과 협력하여 화학 분석 작업에서 Claude AI 모델의 효용성을 테스트하고 있다. 연구팀은 Opus 4.7, Opus 4.6, Sonnet 4.6 세 가지 모델을 대상으로 NMR 스펙트럼 예측 및 분자 구조 추론 능력을 평가했다. 이는 화학자들이 일상적으로 수행하는 스펙트럼 분석 및 화학 표현식 변환 작업을 지원하기 위한 시도이다. 연구진은 모델 학습 데이터 컷오프 이후 ChemRxiv에 게시된 20개의 합성 화합물 데이터를 활용해, 업계 표준 소프트웨어인 ChemDraw 및 MestReNova와 직접 성능을 비교했다.
정방향 예측 작업에서 Opus 4.7은 경쟁력 있는 정확도를 나타냈다. 수소(¹H) 스펙트럼 예측 시 Opus 4.7의 평균 오차는 ±0.079 ppm으로 허용 범위 내에 위치했다. 탄소(¹³C) 예측의 경우 Opus 4.7은 오차 ±1.37 ppm을 기록해, ±1.48 ppm을 보인 MestReNova와 대등한 수준을 기록했다. 특히 피크 분할 패턴과 하위 피크 간격 예측에서는 Claude 모델이 더 우수한 성과를 보였는데, 약 80%의 확률로 0.5Hz 이내의 정확도를 달성했다. 이는 기존 소프트웨어가 기록한 26~35%의 정확도를 크게 웃도는 수치이다.
역방향 예측인 구조 해석 분야에서도 유의미한 결과가 나타났다. 총 15개의 문제 중 Opus 4.7은 단일 고리나 두 개 조각으로 이루어진 단순 구조 8개를 모두 맞혔다. 융합 고리나 스피로고리와 같은 복잡한 구조 7개에 대해서도 출발 물질을 힌트로 제공받았을 때 상당한 성공률을 보였다. 다만 연구진은 이번 실험이 소규모 표본으로 진행되었고, 1차원 NMR 데이터에 의존하며 용매 범위가 제한적이라는 한계가 있다고 언급했다. Anthropic은 향후 화학 문헌 이해 및 구조 렌더링 능력을 확장해 과학 연구를 지속적으로 지원할 계획이다.