Anthropic, Claude Haiku 4.5 배치 API 정식 GA—대량 처리 비용 50% 추가 절감
Anthropic이 Claude Haiku 4.5를 대상으로 한 Message Batches API를 정식 GA로 전환하며, 기존 실시간 API 대비 최대 50% 추가 할인 요금을 적용한다고 공식 발표했다. 비동기 대량 요청 처리가 필요한 데이터 파이프라인·콘텐츠 자동화 워크플로에서 운영 비용을 대폭 낮출 수 있어 한국 개발자·크리에이터에게 실질적인 영향을 준다.
배치 API란 무엇이고 무엇이 달라졌나
Anthropic Message Batches API는 단일 HTTP 요청으로 최대 10,000개의 프롬프트 요청을 묶어 비동기로 처리하는 엔드포인트다. 이번 GA 전환과 함께 Claude Haiku 4.5 모델에 대해 실시간(Synchronous) API 단가 대비 50% 추가 할인이 공식 적용된다. 처리 결과는 요청 후 최대 24시간 내 반환되며, 결과 파일은 Anthropic 스토리지에서 직접 다운로드할 수 있다. 정확한 단가는 사용량·티어에 따라 달라지므로 공식 페이지 참조가 권장된다.
한국 개발자·크리에이터 활용 시나리오
콘텐츠 대량 생성 분야에서 가장 직접적인 수혜가 예상된다. 예를 들어 쇼핑몰 상품 설명 10,000건을 야간 배치로 돌리면 실시간 API 대비 절반 이하의 비용으로 처리할 수 있다. 데이터 라벨링·분류 파이프라인에서도 동일 효과가 적용된다. 크리에이터 도구 스타트업이라면 사용자가 업로드한 영상 스크립트·썸네일 텍스트를 야간 배치로 자동 생성하는 구조를 구현할 수 있다.
코드 예시(Python SDK 3.x 기준):
import anthropic
client = anthropic.Anthropic()
batch = client.messages.batches.create(
requests=[
{
"custom_id": f"req-{i}",
"params": {
"model": "claude-haiku-4-5",
"max_tokens": 512,
"messages": [{"role": "user", "content": prompts[i]}],
},
}
for i in range(len(prompts))
]
)
print(batch.id) # 배치 ID로 결과 폴링
제한사항 및 주의점
- 응답 지연: 실시간 응답이 필요한 챗봇·인터랙티브 앱에는 적합하지 않음. SLA상 최대 24시간 내 완료 보장.
- 지원 모델: 현재 GA는 Claude Haiku 4.5 한정. Claude Sonnet 4.6·Opus 4.7은 베타 단계로 별도 신청 필요.
- 요청 크기 한도: 배치당 최대 256MB 또는 10,000 요청 중 먼저 도달하는 기준 적용.
- 한국 리전: 현재 Anthropic 공식 리전은 미국·유럽 기준이므로 데이터 레지던시 요건이 있는 서비스는 별도 검토 필요.
비용 최적화가 핵심인 B2B SaaS·콘텐츠 자동화 프로젝트라면 배치 API로의 전환을 즉시 검토할 시점이다.