구글 딥마인드 Veo 3.1 공개, 영상 제어력 대폭 강화
- •구글 딥마인드가 Image-to-Image 성능과 캐릭터 일관성이 강화된 Veo 3.1을 출시했다.
- •유튜브 쇼츠 등 모바일 플랫폼에 최적화된 세로형 출력과 4K 업스케일링 기능을 지원한다.
- •제미나이 앱 내 AI 생성 영상의 진위 확인을 돕는 SynthID 워터마크 기술을 확대 적용했다.
구글 딥마인드가 창작자들에게 생성형 영상에 대한 더 정밀한 제어권을 부여하도록 설계된 고급 멀티모달 AI 'Veo 3.1'을 출시했다. 이번 업데이트의 핵심인 'Ingredients to Video' 기능은 Image-to-Image 기술을 활용해 정지된 사진을 역동적인 클립으로 변환한다.
구글 딥마인드의 리드 프로덕트 매니저인 리키 웡(Ricky Wong)은 이 모델이 유튜브 쇼츠와 같은 모바일 플랫폼을 위한 세로형 출력을 지원하며, 전문가 수준의 화질을 위해 1080p 및 4K 해상도로의 최첨단 업스케일링 기능을 제공한다고 설명했다. 이번 업데이트에서 해결된 주요 기술적 난제는 정체성 일관성이다. 이를 통해 캐릭터, 사물, 배경이 서로 다른 장면에서도 안정적으로 유지되어, 프레임마다 시각적 요소의 외형이 변하는 생성형 AI의 고질적인 문제를 방지한다.
이러한 기능들은 제미나이 앱과 다양한 개발자 도구에 통합되어 일반 사용자와 스튜디오 전문가 모두가 활용할 수 있게 되었다. 또한 구글은 투명성을 강조하며, 모든 생성된 콘텐츠에 SynthID를 표시해 사용자가 AI 생성 미디어임을 확인할 수 있도록 했다. 구글은 영상 개선 외에도 기술 연구의 한계를 계속해서 넓혀가고 있다. 최근 퀀텀 컴퓨팅 분야의 이정표를 강조하며, 향후 Veo와 같은 정교한 모델을 구동할 원천 하드웨어 발전의 의지를 재확인했다. 현재 구글은 서로 다른 질감과 캐릭터를 응집력 있는 고영향력 스토리텔링으로 융합하는 도구를 통해 영화 제작자와 소셜 미디어 크리에이터의 역량을 강화하는 데 집중하고 있다.