공공 데이터 보안의 새로운 길: 훈련 없는 AI 활용
- •펜실베이니아주 카운티가 민감한 사용자 입력을 보존하지 않는 부동산 데이터 조회용 AI 챗봇 인터페이스를 도입했다.
- •해당 시스템은 AI를 데이터베이스 언어인 SQL로 변환하는 순수 번역기 역할로만 활용한다.
- •데이터와 AI를 분리한 아키텍처를 통해 AI가 정부의 민감한 정보를 학습하거나 노출하지 않도록 설계했다.
공공 부문에서 생성형 AI 기술을 도입하는 과정은 관리 효율성과 데이터 기밀성 사이의 갈등으로 인해 정체되어 왔다. 정부 기관은 민감한 기록이 AI 학습 데이터로 포함될 위험을 원천 차단해야 하므로, 기존에는 엄격한 도입 지침을 고수해 왔다. 하지만 최근 필라델피아에서 열린 전국주정부최고정보책임자협회(NASCIO) 컨퍼런스에서는 이러한 기술 도입 방식의 새로운 전환점이 제시되었다.
펜실베이니아주 크로퍼드 카운티의 사례는 데이터 안전을 담보하는 실질적인 청사진을 제공한다. 이 카운티는 AI 모델에 민감한 정보를 직접 입력하거나 학습시키는 대신, AI를 단순한 전문 번역기로 활용했다. 시민이 부동산 기록에 대해 질문하면 AI는 그 의도를 해석하여 고정된 데이터베이스 시스템이 이해할 수 있는 명령어로 변환할 뿐, 실제 데이터 자체를 모델 내부에서 처리하지 않는다.
이러한 설계는 기술적으로 매우 정교하다. AI 에이전트를 사용자 인터페이스 영역에만 배치함으로써 모델이 상태를 유지하지 않는 방식으로 운영되도록 했다. AI는 명령을 해석해 SQL 코드를 생성한 뒤 즉시 상호작용을 폐기하며, 덕분에 시스템은 조회된 데이터나 생성된 쿼리를 기억하지 않는다. 이는 자연어 처리의 편리함과 데이터베이스의 보안성 사이에 강력한 방화벽을 구축하는 효과를 낸다.
이번 사례는 모델이 모든 데이터를 흡수하고 기억해야 한다는 기존의 고정관념에서 벗어났다는 점에서 의미가 크다. 인터페이스와 데이터 저장소를 분리함으로써 기관은 외부 처리 파이프라인에 정보를 노출하지 않고도 대화형 기술의 이점을 취할 수 있다. 결과적으로 AI는 정보를 저장하는 거대한 금고가 아닌, 외부와 내부를 연결하는 효율적인 통로로 변모했다.
이러한 아키텍처는 공공 부문의 조달 방식에도 변화를 예고한다. 정부 기관이 디지털 전환을 가속화함에 따라 보안과 데이터 주권을 타협하지 않는 운영 전략이 더욱 중요해지고 있다. 이는 개인정보 보호 위험을 완화할 뿐만 아니라, 보건이나 금융처럼 민감한 데이터를 다루는 다른 분야에서도 활용 가능한 복제 가능한 프레임워크가 될 전망이다.
결국 핵심은 모델의 성능 그 자체가 아니라 시스템 내에서의 전략적인 배치다. 데이터와 AI를 격리함으로써 우리는 보안과 접근성이라는 두 가치를 동시에 잡을 수 있음을 입증했다. 기술이 데이터 처리에 직접 관여하기보다는 시스템의 보조적 역할을 수행하며 더 공평하고 편리한 정보 접근을 가능하게 하는 시대가 도래하고 있다.