구글, 초저가 AI 모델 Gemini 3.1 Flash-Lite 출시
Simon Willison
2026년 3월 4일 (수)
- •구글이 효율성에 특화된 모델 제품군에 초저가형 모델인 Gemini 3.1 Flash-Lite를 새롭게 추가했다.
- •해당 모델의 가격은 입력 토큰 100만 개당 0.25달러로 책정됐으며, 이는 Pro 버전에 비해 현저히 낮은 수준이다.
- •연산의 깊이와 응답 속도 사이의 균형을 맞출 수 있도록 네 가지의 차별화된 '사고 수준' 기능을 제공한다.
IT 기술 전문가 사이먼 윌리슨(Simon Willison)이 공유한 상세 정보에 따르면, 구글은 비용 효율성을 최우선으로 설계한 Gemini 3.1 Flash-Lite를 출시하며 자사 생태계를 확장했다. 이번에 공개된 모델은 Gemini 라인업 중 가장 경제적인 선택지로, 입력 토큰 100만 개당 단 0.25달러, 출력 토큰 100만 개당 1.50달러라는 파격적인 가격을 자랑한다.
Gemini 3.1 Flash-Lite의 운영 비용은 Gemini 3.1 Pro의 약 8분의 1 수준에 불과하다. 이처럼 획기적인 비용 절감 덕분에 과거 예산 제약으로 AI 도입이 어려웠던 대규모 작업 환경에서도 이상적인 대안이 될 전망이다. 특히 주목할 만한 기능은 '최소'에서 '높음'까지 단계별로 선택 가능한 '사고 수준(thinking levels)' 설정이다.
사용자는 특정 프롬프트에 대해 모델이 투입할 연산 자원의 양을 직접 결정할 수 있다. 가령 간단한 질의에는 '최소' 설정을 적용해 자원을 절약하고, 복잡한 추론이 필요한 과업에서는 이를 '높음' 단계로 올려 결과물의 정확도를 높이는 방식이다.
이러한 제어 기능은 속도와 비용, 그리고 지능 사이의 균형을 사용자 요구에 맞춰 조정하는 맞춤형 AI 상호작용으로의 변화를 의미한다. 구글은 AI 도입의 진입 장벽을 낮춤으로써 고도화된 언어 처리 기술을 다양한 애플리케이션에서 더욱 쉽게 활용할 수 있는 토대를 마련했다.