k
korAI
AI 뉴스 전체
📰 AI 뉴스2026-06-064분

Anthropic, Claude Haiku 4.5 배치 API 요금 50% 추가 인하

Anthropic이 Claude Haiku 4.5의 Message Batches API 요금을 기존 대비 50% 추가 인하하며, 대량 비동기 처리 워크플로에서 가장 경쟁력 있는 가격대를 형성했다. 인하된 요금은 즉시 적용되며 기존 사용자는 별도 조치 없이 자동 적용된다. 비용 민감한 스타트업과 인디 개발자의 프로덕션 진입 장벽이 낮아질 전망이다.

anthropicclaudeapi

변경된 요금 구조

Anthropic은 2026년 6월 6일부로 Claude Haiku 4.5 Message Batches API 가격을 공식 조정했다.

| 구분 | 변경 전 | 변경 후 | |---|---|---| | 입력 토큰 (배치) | $0.050 / 1M tokens | $0.025 / 1M tokens | | 출력 토큰 (배치) | $0.125 / 1M tokens | $0.063 / 1M tokens | | 실시간 API 입력 | $0.080 / 1M tokens | 변동 없음 | | 실시간 API 출력 | $0.250 / 1M tokens | 변동 없음 |

배치 API는 24시간 내 처리를 보장하는 비동기 방식으로, 실시간 응답이 불필요한 대규모 작업에 최적화되어 있다. 이번 인하로 배치 대비 실시간 요금 프리미엄이 더욱 명확해졌다.

배치 API 핵심 스펙

  • 최대 요청 수: 배치당 100,000개 요청
  • 최대 배치 크기: 256 MB
  • 처리 보장 시간: 24시간 이내
  • 컨텍스트 윈도우: Claude Haiku 4.5 기준 200K tokens 동일 적용
  • 지원 기능: 시스템 프롬프트, 도구 사용(Tool Use), 비전(이미지 입력)
  • 결과 조회: 폴링 또는 웹훅(베타) 방식

한국 개발자 실전 적용 시나리오

대량 문서 분류·태깅 파이프라인

import anthropic

client = anthropic.Anthropic()

# 예: 상품 리뷰 10만 건 감성 분석
requests = [
    {
        "custom_id": f"review-{i}",
        "params": {
            "model": "claude-haiku-4-5",
            "max_tokens": 10,
            "messages": [{"role": "user", "content": f"감성: {review}"}]
        }
    }
    for i, review in enumerate(reviews)  # reviews: 리스트
]

batch = client.messages.batches.create(requests=requests)
print(batch.id)  # batch_01... 저장 후 결과 폴링

10만 건 기준 입력 평균 100 tokens, 출력 5 tokens 가정 시:

  • 입력 비용: 10M tokens × $0.025 = $0.25
  • 출력 비용: 0.5M tokens × $0.063 = $0.032
  • 총합 약 $0.28 (약 370원) 수준

콘텐츠 크리에이터: 영상 스크립트 수백 편을 한 번에 SEO 키워드 분석하거나, 썸네일 문구 A/B 변형 생성을 야간 배치로 처리해 비용을 최소화할 수 있다.

오픈소스 프로젝트: 깃허브 이슈 자동 분류, PR 요약 생성 등 CI/CD 파이프라인 내 비동기 AI 작업에 적합하다.

경쟁 모델과의 비교

유사 경량 모델 배치 요금과 비교하면, Claude Haiku 4.5의 이번 인하 후 입력 토큰 단가는 시장 최저 수준 중 하나에 해당한다. 단, 정확한 타사 비교는 각 공식 요금 페이지를 직접 확인할 것을 권장한다.

공식 요금 페이지: Anthropic Pricing

출처: Anthropic 공식 블로그