k
korAI
AI 뉴스 전체
📰 AI 뉴스2026-05-313분

Anthropic, Claude Haiku 4.5 배치 API 50% 할인 정식 적용

Anthropic이 Claude Haiku 4.5를 대상으로 Message Batches API 이용 시 표준 요금 대비 50% 할인을 정식 정책으로 확정했다. 대량 문서 처리·데이터 레이블링·콘텐츠 파이프라인을 운영하는 한국 개발팀에게 비용 절감 효과가 크며, 실시간성이 필요 없는 워크로드에서 즉시 활용 가능하다.

anthropicclaudeapi

배치 API 할인 정책 개요

Anthropic은 Claude Haiku 4.5 모델에 대해 Message Batches API 사용 시 입력·출력 토큰 모두 50% 할인을 적용하는 정책을 정식 확정했다. 배치 API는 요청을 묶어 비동기로 처리하며, 결과는 최대 24시간 내 반환된다. 실시간 응답이 필요 없는 대용량 작업에 최적화된 구조다.

할인 적용 후 Claude Haiku 4.5 배치 요금은 공식 페이지 참조. 단일 배치당 최대 10,000건 요청을 묶을 수 있으며, 각 요청은 최대 200K 컨텍스트를 지원한다.

한국 개발팀 주요 활용 사례

문서·콘텐츠 파이프라인

  • 쇼핑몰 상품 설명 대량 생성, 블로그 초안 배치 번역 등 반복 작업에 투입 시 월 비용을 절반 수준으로 절감 가능
  • RAG 파이프라인에서 수만 건 청크 요약·태깅 작업을 오프피크 시간대에 배치로 실행

데이터 레이블링 및 평가

  • ML 팀이 파인튜닝용 데이터 품질 검수를 배치로 돌려 GPU 인프라 없이 LLM-as-judge 파이프라인 구성
  • A/B 테스트 결과 분류·감성 분석 등 수십만 건 처리 시 비용 효율 극대화

사용 시 주의사항

  • 배치 처리 특성상 최대 24시간 지연이 발생할 수 있어 SLA가 엄격한 서비스에는 부적합
  • Claude Opus 4.7, Claude Sonnet 4.6에는 별도 할인율이 적용되므로 모델별로 Anthropic 공식 가격표를 확인해야 함
  • Python SDK(anthropic>=0.28.0)에서 client.beta.messages.batches.create() 메서드로 호출 가능하며, 결과 폴링은 batches.retrieve(batch_id)로 처리
출처: Anthropic Documentation