📰 AI 뉴스2026-05-124분

Google DeepMind, Veo 3 영상 생성 API 개발자 프리뷰 공개

Google DeepMind가 텍스트·이미지 프롬프트로 4K 영상을 생성하는 Veo 3 모델을 Vertex AI를 통해 개발자 프리뷰로 공개했다. 오디오 싱크 및 카메라 모션 제어 파라미터가 추가되어 크리에이터 툴 통합 수요가 높아질 전망이다.

google-deepmindvideo-generationvertex-ai

Veo 3 API 핵심 스펙

Veo 3는 최대 4K 해상도, 최대 60초 클립 생성을 지원하며, 프레임레이트는 24fps·30fps·60fps 중 선택 가능하다. 입력 모달리티는 텍스트 단독, 이미지+텍스트, 영상+텍스트(인페인팅) 세 가지다. Vertex AI SDK(google-cloud-aiplatform >= 1.92.0)를 통해 Python·Node.js에서 호출할 수 있으며, 응답은 GCS URI 형태로 반환된다.

from vertexai.preview.vision_models import VideoGenerationModel

model = VideoGenerationModel.from_pretrained("veo-003")
result = model.generate_video(
    prompt="한강 야경을 드론이 천천히 가로지르는 장면, 시네마틱 4K",
    duration_seconds=15,
    fps=30,
    aspect_ratio="16:9",
)
result.videos[0].save("output.mp4")

개발자·크리에이터에게 달라지는 점

이번 업데이트의 핵심은 카메라 모션 제어 파라미터(camera_motion: pan, tilt, zoom, orbit)와 오디오 싱크 힌트 필드 추가다. 기존 Veo 2 대비 프롬프트 adherence 점수가 내부 벤치마크 기준 +18% 향상됐다고 Google은 밝혔다. 숏폼 콘텐츠 자동화, 게임 컷신 프로토타이핑, 광고 소재 A/B 테스트 등 실무 워크플로에 바로 연결 가능한 수준이다.

한국 리전(asia-northeast3, 서울)에서도 프리뷰 접근이 허용되며, 별도 리전 이전 없이 기존 GCP 프로젝트에서 활성화할 수 있다.

가격 및 제한 사항

프리뷰 기간 가격은 공식 페이지 참조. 단, Google은 생성 초당(per-second) 과금 방식을 채택할 예정임을 문서에 명시했다. 현재 분당 요청(RPM) 한도는 프로젝트당 10 RPM, 일일 최대 생성 시간은 600초로 제한된다. 안전 필터는 SynthID 워터마킹과 함께 기본 활성화되어 있으며, 상업용 배포 전 Content Safety API 검토를 권장한다.

출처: Google DeepMind Blog / Vertex AI Release Notes

← 이전

Claude Sonnet 4.6 Extended Thinking, 응답 지연 40% 단축 업데이트

Google, 터미널용 Gemini CLI 정식 출시—로컬 코드베이스 직접 질의