AWS와 손잡은 Hexagon, AI 학습 시간 95% 단축
- •Hexagon이 3D 포인트 클라우드 모델 학습 기간을 80일에서 단 4일로 대폭 단축했다.
- •Amazon SageMaker HyperPod를 통해 NVIDIA H100 GPU 클러스터 기반의 자동화된 학습 환경을 구축했다.
- •특화된 AI 모델을 활용해 전 세계 산업 현장의 디지털 트윈 구축과 지리 공간 분석 속도를 높였다.
측정 기술 분야의 글로벌 선도 기업 Hexagon이 Amazon SageMaker HyperPod를 도입해 AI 개발 파이프라인에 혁신을 일으켰다. 이 기업은 물체나 지형의 표면을 수백만 개의 3D 데이터 점으로 표현한 디지털 지도인 포인트 클라우드 처리에 특화되어 있다. 이러한 복잡한 데이터 세트는 도시 전체를 가상 세계에 구현하는 디지털 트윈이나 대규모 건설 현장 관리에 필수적인 기초 자료로 활용된다.
기존에는 온프레미스 하드웨어를 사용하여 3D 데이터를 정제하고 분할하는 전용 모델을 학습시키는 데 무려 80일이 소요되었다. 하지만 SageMaker HyperPod 기반의 고성능 클러스터로 전환하면서, Hexagon은 이 기간을 단 4일로 압축하며 95%라는 놀라운 효율 향상을 달성했다. 이와 같은 변화 덕분에 기업은 새로운 AI 활용 사례를 수개월이 아닌 며칠 만에 테스트할 수 있게 되었으며, 핵심 인프라 솔루션의 시장 출시 기간도 크게 단축했다.
특히 새로운 시스템은 결함이 있는 컴퓨팅 구성 요소를 자동으로 감지하고 교체하는 탄력적인 아키텍처를 특징으로 한다. 이러한 '자가 치유(self-healing)' 기능 덕분에 하드웨어 오류가 발생하더라도 작업자가 개입할 필요 없이 가장 최근의 체크포인트에서 학습을 재개할 수 있다. 또한 Hexagon은 대규모 데이터 흐름을 처리하기 위해 테라바이트급 학습 데이터를 프로세서로 직접 고속 스트리밍하는 특화된 파일 시스템을 사용한다.
이번 협업은 관리형 인프라가 복잡한 클러스터 관리의 부담을 어떻게 덜어주는지 잘 보여주는 사례다. 상태 점검을 자동화하고 서버 간 통신을 최적화함으로써, Hexagon의 엔지니어들은 항공우주, 자동차, 지리 공간 분야의 모델 정확도를 높이는 본연의 작업에만 집중할 수 있게 되었다. 그 결과 전 세계 다양한 산업 분야에서 물리적 환경을 더욱 빠르고 정밀하게 이해할 수 있는 토대가 마련되었다.