📰 AI 뉴스2026-05-194분
Anthropic, Claude Haiku 4.5 비전 입력 배치 처리 정식 지원
Anthropic이 Claude Haiku 4.5 모델에 이미지·PDF 등 멀티모달 입력을 Message Batches API로 대량 처리하는 기능을 정식 지원한다고 발표했다. 기존에는 텍스트 전용으로 제한됐던 배치 엔드포인트가 비전 입력까지 확장되어, 대규모 문서 분류·이미지 캡셔닝 파이프라인 구축 비용이 크게 낮아질 전망이다.
anthropicvisionbatch-api
무엇이 바뀌었나
Anthropicは 2026년 5월 19일부로 Claude Haiku 4.5 모델의 Message Batches API에 멀티모달(이미지, PDF, base64 인코딩 파일) 입력 지원을 추가했다. 기존 배치 API는 text 타입 콘텐츠 블록만 허용했으나, 이번 업데이트로 image 및 document 블록도 동일한 배치 요청 내에 포함할 수 있다.
요청 한 건당 최대 이미지 수는 20장, 단일 PDF는 100페이지까지이며, 배치 1회 요청에 최대 10,000건의 멀티모달 요청을 묶어 처리할 수 있다.
실제 활용 시나리오
한국 개발자·크리에이터가 즉시 적용할 수 있는 대표 사례는 다음과 같다.
- 전자상거래 상품 이미지 자동 태깅: 수만 건의 상품 이미지를 야간 배치로 처리해 카테고리·속성 JSON 자동 생성
- 계약서·영수증 대량 OCR 후처리: PDF 스캔본을 배치로 넘겨 구조화된 데이터로 추출
- 유튜브 썸네일 A/B 분석: 수백 개의 썸네일 후보를 한 번에 평가해 CTR 예측 레이블 부여
import anthropic, base64, pathlib
client = anthropic.Anthropic()
requests = []
for img_path in pathlib.Path("./products").glob("*.jpg"):
b64 = base64.standard_b64encode(img_path.read_bytes()).decode()
requests.append({
"custom_id": img_path.stem,
"params": {
"model": "claude-haiku-4-5",
"max_tokens": 256,
"messages": [{
"role": "user",
"content": [
{"type": "image", "source": {"type": "base64", "media_type": "image/jpeg", "data": b64}},
{"type": "text", "text": "카테고리와 주요 속성을 JSON으로 반환하세요."}
]
}]
}
})
batch = client.messages.batches.create(requests=requests)
print(batch.id)
요금 및 주의사항
Message Batches API 할인(표준 API 대비 50% 절감)은 멀티모달 입력 토큰에도 동일하게 적용된다. 이미지 토큰 산정 방식은 기존 동기 API와 동일하므로 고해상도 이미지는 리사이징 후 전송을 권장한다. 정확한 입력 토큰당 단가는 공식 페이지 참조. 배치 결과는 요청 제출 후 최대 24시간 내 반환이 보장된다.
출처: Anthropic 공식 문서