미국 주 정부의 AI 가치 측정 실패와 과제
- •미국 대부분의 주 정부가 AI 파일럿 프로그램을 운영 중임
- •파편화된 도입 방식으로 인해 주 정부 전반의 AI 확장이 지연되고 있음
- •공공 가치를 증명할 수 있는 성과 지표를 마련한 주는 7곳에 불과함
미국 전역의 공공 기관에서 조용하지만 광범위한 변화가 일어나고 있다. 시민 단체인 코드 포 아메리카(Code for America)의 최근 보고서에 따르면, 거의 모든 주가 개념 증명 단계를 넘어 최소 하나 이상의 AI 파일럿 프로그램을 가동하며 가능성을 타진하고 있다. 그러나 이러한 높은 도입률에도 불구하고, 실제 현장에서 거두는 성과는 여전히 모호한 상태다. 시제품을 실제 공공 서비스 개선으로 연결하는 과정이 전국 정부 기관의 큰 장벽으로 작용하고 있다.
보고서가 지적하는 핵심 문제는 바로 평가 메커니즘의 부재다. 정부 기관들은 운영 효율성을 높이기 위해 생성형 AI를 적극적으로 도입하고 있으나, 공공 부문에서 '성공'의 정의를 내리는 데 난항을 겪고 있다. 현재 AI 도입 성과를 측정할 수 있는 체계를 갖춘 주는 7곳에 불과하다. 이러한 지표가 없다면, 실험적 환경에서 구축된 도구가 기관 전체의 업무 흐름으로 확장되는 과정은 파편화될 수밖에 없다.
연구진은 AI 성숙도를 준비, 시범 운영, 전면적 도입 및 영향력 측정이라는 단계로 구분한다. 여기서 '준비'란 단순한 소프트웨어 도입을 넘어 기초 데이터 인프라와 강력한 거버넌스 체계를 의미한다. 많은 주가 데이터 품질 부족으로 인해 초기 단계에 머물러 있다. 반면 메릴랜드, 텍사스, 유타와 같이 앞서 나가는 주들은 공통적으로 강력한 리더십과 부처 간 데이터 거버넌스, 그리고 안전한 실험 공간인 샌드박스를 우선순위에 두었다.
대학생들이 이번 변화를 바라볼 때 주목해야 할 점은 정부 내 AI 확산의 병목 현상이 기술 그 자체가 아니라는 사실이다. 이는 시스템 설계와 관료주의적 정렬의 문제에 가깝다. 기관들이 AI를 계속 도입함에 따라, 이제는 빠른 실험에서 벗어나 데이터 정제와 성과 측정이라는 지루하지만 필수적인 작업으로 초점을 옮겨야 한다. 정부가 AI 모델을 통해 실제로 예산을 절감하거나 삶의 질을 높였다는 점을 확실히 증명할 때, 비로소 AI는 신기한 기술을 넘어 필수적인 도구로 자리 잡을 것이다.
이 분야가 성숙해짐에 따라 공공 부문 AI에 대한 규제 강화와 표준화된 프레임워크가 등장할 것으로 보인다. '모든 것에 AI를 적용하는' 시대는 이미 도래했으나, '입증 가능한 공공 가치를 창출하는 AI' 시대는 여전히 초기 단계에 머물러 있다. 공공 정책과 기술의 교차점에 관심 있는 이들에게 지금은 이 분야에서 가장 중요한 전환점이 되고 있다.