📰 AI 뉴스2026-05-103분
Anthropic, Claude Haiku 4.5 배치 API 처리량 2배 상향
Anthropic이 Claude Haiku 4.5의 메시지 배치(Message Batches) API 처리 한도를 기존 대비 2배로 확대했다. 대규모 문서 분류·코드 리뷰 자동화처럼 비동기 대량 처리가 필요한 워크플로에서 비용 절감과 처리 속도 향상을 동시에 기대할 수 있다.
anthropicapiautomation
변경 사항 요약
Anthropic은 2026년 5월 10일부터 Claude Haiku 4.5 모델에 적용되는 메시지 배치 API의 단일 배치 최대 요청 수를 5,000건에서 10,000건으로 상향 조정했다. 배치 완료 목표 시간(SLO)은 기존과 동일하게 24시간 이내를 유지한다. 배치 API는 실시간 응답이 불필요한 작업에 한해 표준 API 대비 50% 할인된 가격을 제공하며, 정확한 단가는 공식 페이지 참조.
한국 개발자 활용 시나리오
- 대규모 코드베이스 정적 분석: 수천 개 파일을 야간 배치로 돌려 취약점 리포트 자동 생성
- 콘텐츠 크리에이터 자동화: 유튜브 스크립트·블로그 초안을 수백 건씩 묶어 처리 후 편집 단계에서 검수
- 데이터 파이프라인 레이블링: Haiku 4.5의 낮은 레이턴시와 배치 할인을 결합해 ML 학습용 데이터 주석 비용 절감
import anthropic
client = anthropic.Anthropic()
# 배치 요청 최대 10,000건
requests = [
{"custom_id": f"req-{i}", "params": {"model": "claude-haiku-4-5", "max_tokens": 256, "messages": [{"role": "user", "content": f"Summarize: {doc}"}]}}
for i, doc in enumerate(documents) # documents 최대 10,000개
]
batch = client.messages.batches.create(requests=requests)
print(batch.id)
주의사항 및 제한
- 배치 API는 스트리밍 미지원이므로 실시간 UI 응답이 필요한 서비스에는 부적합
- 10,000건 초과 시 복수 배치로 분할 필요; 배치 간 의존성 처리는 애플리케이션 레이어에서 직접 구현해야 함
- Haiku 4.5 외 Claude Sonnet 4.6·Opus 4.7 모델의 배치 한도는 별도 정책 적용 중이며 변경 없음
출처: Anthropic Developer Docs