기업 AI 성공의 핵심, 모델보다 '데이터 인프라'다
- •Vanguard Group, 기업 내 복잡한 금융 데이터 질의 자동화를 위해 'Virtual Analyst' 도입
- •성공적인 기업용 AI 도입은 모델 선택보다 'AI 활용 준비가 완료된 데이터' 구축이 우선임을 시사
- •기술적 데이터와 비즈니스 문맥을 연결하는 Semantic Layer 기반 아키텍처 도입
많은 대학생에게 AI 혁명은 그저 적절한 파운데이션 모델을 선택하고 API를 연결하는 소프트웨어 문제처럼 보일 수 있다. 하지만 Vanguard Group의 사례는 AI의 진정한 난관이 알고리즘 자체가 아니라 하위 데이터 아키텍처에 있음을 보여준다. 최근 도입된 'Virtual Analyst' 도구는 대기업이 대규모로 AI를 어떻게 구현하는지 보여주는 모범 사례이다. 이들은 모델이 금융 데이터를 안정적으로 처리하기 전, 데이터의 분류와 관리 체계를 재정립하는 'AI 준비도' 문제를 먼저 해결해야 했다.
기업이 직면한 핵심 문제는 데이터의 부족이 아니라 문맥의 부재였다. 비즈니스 분석가들은 복잡한 SQL 쿼리를 직접 다루느라 단순한 작업에도 데이터 엔지니어 팀에 의존해야 하는 병목 현상을 겪었다. 이를 해결하기 위해 Vanguard Group은 모델 선택에서 벗어나 'AI 활용이 가능한 데이터'를 구축하는 여덟 가지 원칙을 세웠다. 특히 Semantic Layer를 구현하여 자연어 질문을 비즈니스 로직에 따라 실행 가능한 코드로 자동 변환하는 가교를 마련했다.
이번 프로젝트는 AI 구현이 데이터 엔지니어, 비즈니스 분석가, 보안 팀 등이 긴밀히 협력해야 하는 다기능적인 노력임을 증명했다. 이는 기술 산업에 진출하는 학생들에게 시사하는 바가 크다. AI는 단순한 컴퓨터 공학 프로젝트가 아니라 비즈니스 프로세스 혁신이기 때문이다. 기술적 명세와 비즈니스 정의가 결합된 통합 카탈로그가 없다면, AI는 알 수 없는 언어로 쓰인 책을 읽으려 애쓰는 똑똑한 학생에 불과하다.
또한, 이들은 'ground truth' 예시 라이브러리를 구축하여 Retrieval-Augmented Generation 개념을 효과적으로 활용했다. 모델에 질문과 SQL 쌍을 지속적으로 학습시켜 특정 금융 데이터셋의 미묘한 차이를 이해하게 만든 것이다. 그 결과, 며칠이 걸리던 수작업이 몇 분 만에 완료되는 성과를 거두었다. 이러한 변화는 기업용 AI의 미래가 단순히 크고 빠른 모델이 아닌, 이처럼 눈에 보이지 않는 인프라의 개선에 달려 있음을 방증한다.