k
korAI
AI 뉴스 전체
📰 AI 뉴스2026-06-124분

Anthropic, Claude Haiku 4.5 배치 API 정식 GA—대용량 비동기 처리 비용 최대 50% 절감

Anthropic이 Claude Haiku 4.5를 대상으로 한 Message Batches API를 정식 GA로 전환하며, 최대 10만 건의 요청을 단일 배치로 비동기 제출할 수 있게 됐다. 실시간 응답이 불필요한 데이터 가공·콘텐츠 분류·대규모 번역 파이프라인에서 표준 API 대비 최대 50% 낮은 단가를 공식 적용받는다. 한국 개발자와 크리에이터가 야간 배치 작업이나 대량 텍스트 처리 워크플로를 구성할 때 즉시 활용 가능하다.

anthropicapicost-optimization

무엇이 바뀌었나

Anthropic은 2026년 6월 12일 Claude Haiku 4.5 Message Batches API를 정식 GA(General Availability)로 전환했다. 기존 베타 딱지가 제거되고 SLA 및 프로덕션 지원이 적용된다.

주요 사양은 다음과 같다:

  • 단일 배치 최대 요청 수: 100,000건
  • 배치 처리 완료 목표 시간: 제출 후 최대 24시간 (통상 1~4시간)
  • 가격: 표준 Haiku 4.5 API 단가 대비 입력·출력 토큰 각 50% 할인 (정확한 단가는 공식 페이지 참조)
  • 지원 리전: US East, EU West, 아시아-퍼시픽(서울 포함)

크리에이터·개발자 활용 시나리오

실시간 레이턴시가 필요 없는 작업에서 즉각적인 비용 절감 효과를 기대할 수 있다.

import anthropic

client = anthropic.Anthropic()

# 요청 목록 준비 (최대 100,000건)
requests = [
    {
        "custom_id": f"item-{i}",
        "params": {
            "model": "claude-haiku-4-5",
            "max_tokens": 256,
            "messages": [{"role": "user", "content": f"다음 텍스트를 한국어로 번역하세요: {text}"}]
        }
    }
    for i, text in enumerate(source_texts)
]

# 배치 제출
batch = client.messages.batches.create(requests=requests)
print(f"배치 ID: {batch.id}")

# 완료 폴링 후 결과 수집
results = client.messages.batches.results(batch.id)

대표적인 활용 예:

| 시나리오 | 처리 단위 | 절감 예상 | |---|---|---| | 쇼핑몰 상품 설명 자동 번역 | 건당 300토큰 × 5만 건 | ~50% | | 유튜브 자막 요약 파이프라인 | 건당 1,000토큰 × 2만 건 | ~50% | | 코드 리뷰 리포트 일괄 생성 | 건당 800토큰 × 1만 건 | ~50% |

주의사항 및 제한

  • 스트리밍 불가: 배치 API는 비동기 전용이므로 실시간 응답이 필요한 챗봇·인터랙티브 UI에는 적합하지 않다.
  • 모델 제한: 현재 GA는 Claude Haiku 4.5 한정. Claude Sonnet 4.6 및 Opus 4.7 배치 지원은 별도 일정으로 공지 예정이다.
  • 배치 만료: 제출 후 29일 내 결과를 수집하지 않으면 자동 삭제된다.
  • 속도 제한 별도: 배치 API는 표준 RPM 한도와 독립적으로 운영되어 동시 운영이 가능하다.

공식 문서 및 요금 상세는 Anthropic Batches API 문서에서 확인할 수 있다.

출처: Anthropic Official Docs