📰 AI 뉴스2026-06-124분
Anthropic, Claude Haiku 4.5 배치 API 정식 GA—대용량 비동기 처리 비용 최대 50% 절감
Anthropic이 Claude Haiku 4.5를 대상으로 한 Message Batches API를 정식 GA로 전환하며, 최대 10만 건의 요청을 단일 배치로 비동기 제출할 수 있게 됐다. 실시간 응답이 불필요한 데이터 가공·콘텐츠 분류·대규모 번역 파이프라인에서 표준 API 대비 최대 50% 낮은 단가를 공식 적용받는다. 한국 개발자와 크리에이터가 야간 배치 작업이나 대량 텍스트 처리 워크플로를 구성할 때 즉시 활용 가능하다.
anthropicapicost-optimization
무엇이 바뀌었나
Anthropic은 2026년 6월 12일 Claude Haiku 4.5 Message Batches API를 정식 GA(General Availability)로 전환했다. 기존 베타 딱지가 제거되고 SLA 및 프로덕션 지원이 적용된다.
주요 사양은 다음과 같다:
- 단일 배치 최대 요청 수: 100,000건
- 배치 처리 완료 목표 시간: 제출 후 최대 24시간 (통상 1~4시간)
- 가격: 표준 Haiku 4.5 API 단가 대비 입력·출력 토큰 각 50% 할인 (정확한 단가는 공식 페이지 참조)
- 지원 리전: US East, EU West, 아시아-퍼시픽(서울 포함)
크리에이터·개발자 활용 시나리오
실시간 레이턴시가 필요 없는 작업에서 즉각적인 비용 절감 효과를 기대할 수 있다.
import anthropic
client = anthropic.Anthropic()
# 요청 목록 준비 (최대 100,000건)
requests = [
{
"custom_id": f"item-{i}",
"params": {
"model": "claude-haiku-4-5",
"max_tokens": 256,
"messages": [{"role": "user", "content": f"다음 텍스트를 한국어로 번역하세요: {text}"}]
}
}
for i, text in enumerate(source_texts)
]
# 배치 제출
batch = client.messages.batches.create(requests=requests)
print(f"배치 ID: {batch.id}")
# 완료 폴링 후 결과 수집
results = client.messages.batches.results(batch.id)
대표적인 활용 예:
| 시나리오 | 처리 단위 | 절감 예상 | |---|---|---| | 쇼핑몰 상품 설명 자동 번역 | 건당 300토큰 × 5만 건 | ~50% | | 유튜브 자막 요약 파이프라인 | 건당 1,000토큰 × 2만 건 | ~50% | | 코드 리뷰 리포트 일괄 생성 | 건당 800토큰 × 1만 건 | ~50% |
주의사항 및 제한
- 스트리밍 불가: 배치 API는 비동기 전용이므로 실시간 응답이 필요한 챗봇·인터랙티브 UI에는 적합하지 않다.
- 모델 제한: 현재 GA는 Claude Haiku 4.5 한정. Claude Sonnet 4.6 및 Opus 4.7 배치 지원은 별도 일정으로 공지 예정이다.
- 배치 만료: 제출 후 29일 내 결과를 수집하지 않으면 자동 삭제된다.
- 속도 제한 별도: 배치 API는 표준 RPM 한도와 독립적으로 운영되어 동시 운영이 가능하다.
공식 문서 및 요금 상세는 Anthropic Batches API 문서에서 확인할 수 있다.
출처: Anthropic Official Docs