AI, 생명의 진화적 역사를 해독하다
- •오리건 대학교 연구진, 유전체 분석을 위한 AI 도구 개발
- •LLM 논리를 적용해 고대 생물학적 돌연변이 패턴 분석
- •유전자 쌍의 공통 조상을 정밀하게 추적하는 기술 구현
계산 언어학과 진화 생물학의 결합이 주목받고 있다. 오리건 대학교 연구진은 거대언어모델이 인간의 언어를 처리하는 방식을 응용해 DNA를 분석하는 새로운 인공지능 도구를 공개했다. 일반적으로 GPT나 Claude와 같은 거대언어모델은 텍스트 작성이나 코드 생성에 활용되지만, 이번 연구는 생명의 기본 단위인 유전체를 복잡한 문법 구조를 가진 언어로 접근했다는 점에서 혁신적이다.
이 모델은 유전체를 길고 복잡한 정보의 나열로 간주한다. 이를 통해 인간이 수동으로 추적하기 어려운 특정 생물학적 돌연변이 패턴을 식별하는 법을 학습했다. 단순히 키워드를 검색하는 기존 방식에서 벗어나 진화의 '문법' 자체를 이해하는 구조를 택한 것이다.
이 방법론은 연구진이 유전자 쌍을 과거로 거슬러 올라가 이들이 공통 조상으로부터 갈라진 지점을 정확히 찾아내도록 돕는다. 이는 하나의 도메인에서 개발된 기술을 다른 분야에 적용하는 '전이 학습'이 얼마나 강력한 과학적 발견을 끌어낼 수 있는지 보여주는 사례다. 특히 복잡한 데이터 속에 숨겨진 비밀을 밝혀내는 데 탁월한 성능을 발휘한다.
기존의 진화 타임라인 모델링은 방대한 유전 데이터의 노이즈를 처리하기 위해 상당한 연산 자원이 소모되는 시뮬레이션이 필요했다. 하지만 이번 모델은 수백만 년 동안 일관되게 유지된 패턴을 학습함으로써 불필요한 노이즈를 효과적으로 필터링한다. AI가 단순한 챗봇을 넘어 근본적인 과학적 발견의 영역으로 진화하고 있음을 증명하는 지점이다.
향후 이 도구는 유전자 기능을 이해하는 데 중요한 고유전체학이나 신약 개발 분야를 가속화할 전망이다. 특정 유전자 형질이 왜 유지되거나 사라졌는지를 밝혀내면 생명 현상의 기원을 이해하는 새로운 시각을 얻게 될 것이다. 이는 현대 AI 기술이 단순한 디지털 비서를 넘어 가장 복잡한 과학적 난제를 해결하는 새로운 눈이 되고 있음을 시사한다.