Google DeepMind, Veo 3 영상 생성 API 개발자 정식 GA
Google DeepMind가 텍스트·이미지 프롬프트로 최대 4K 60fps 영상을 생성하는 Veo 3 API를 Google AI Studio 및 Vertex AI에서 정식 공개했다. 오디오 동기화, 카메라 모션 제어 파라미터가 추가돼 크리에이터 및 영상 앱 개발자의 프로덕션 활용이 가능해졌다.
Veo 3 API 주요 스펙
Veo 3는 텍스트 프롬프트 또는 참조 이미지 한 장으로 최대 4K 해상도, 60fps 영상 클립을 생성한다. 단일 API 호출로 생성 가능한 클립 길이는 최대 8초이며, 여러 클립을 순서대로 이어붙이는 sequence 파라미터를 활용하면 최대 60초 분량의 영상을 하나의 워크플로로 처리할 수 있다.
핵심 파라미터는 세 가지다.
camera_motion:dolly_in,pan_left,orbit등 12종 프리셋 또는 커스텀 벡터 입력audio_prompt: 배경음·효과음 텍스트 설명을 넘기면 영상과 자동 동기화style_reference: 이미지 URL을 전달해 색감·질감 일관성 유지
가격은 생성 해상도와 초 단위 길이를 곱한 크레딧 방식으로 책정되며, 정확한 단가는 공식 페이지 참조.
개발자 접근 방법
Vertex AI의 aiplatform Python SDK 또는 REST API 모두 지원한다.
import vertexai
from vertexai.preview.vision_models import VideoGenerationModel
vertexai.init(project="my-project", location="us-central1")
model = VideoGenerationModel.from_pretrained("veo-3")
video = model.generate_video(
prompt="한강 야경을 드론으로 촬영한 4K 영상, 골든아워 조명",
duration_seconds=8,
resolution="4k",
camera_motion="dolly_in",
audio_prompt="잔잔한 도시 환경음, 바람 소리"
)
video.save("output.mp4")
Google AI Studio에서는 별도 설정 없이 API 키만으로 테스트할 수 있어, 크리에이터 툴을 빠르게 프로토타이핑하기에 적합하다. 한국 리전(asia-northeast3) 지원이 확인되어 레이턴시 민감한 서비스에도 바로 적용 가능하다.
크리에이터·개발자에게 중요한 이유
기존 영상 생성 API는 오디오가 별도 파이프라인이거나 해상도가 1080p에 머물렀다. Veo 3는 오디오 동기화를 단일 API 호출 안에 통합한 최초의 상용 영상 생성 API로, 숏폼 콘텐츠 자동화·광고 소재 A/B 테스트·교육 영상 생성 등 반복 제작 비용을 크게 줄일 수 있다.
한국 크리에이터 플랫폼 개발사 입장에서는 YouTube Shorts, 릴스용 소재를 서버사이드에서 자동 생성하는 파이프라인 구축이 현실적인 선택지가 됐다. 다만 생성 영상 내 워터마크 정책 및 저작권 귀속 조건은 서비스 약관을 반드시 확인해야 한다.