k
korAI
AI 뉴스 전체
📰 AI 뉴스2026-06-013분

Anthropic, 프롬프트 캐시 TTL 1시간→5시간 확대

Anthropic이 Claude API의 프롬프트 캐싱(Prompt Caching) 유효 시간을 기존 최대 1시간에서 5시간으로 연장했다. 대용량 시스템 프롬프트나 문서를 반복 사용하는 서비스에서 입력 토큰 비용을 추가로 절감할 수 있어 장시간 세션 기반 앱 개발자에게 직접적인 혜택이 생긴다.

anthropicclaudeapi

변경 내용 요약

Anthropic은 2026년 6월 1일부로 모든 Claude API 티어에서 프롬프트 캐시 TTL(Time-to-Live) 상한을 1시간 → 5시간으로 상향했다. 캐시 적중 시 입력 토큰 요금은 기존과 동일하게 일반 입력 토큰의 10% 수준이 유지된다. 캐시 쓰기(write) 비용 역시 변동 없이 **일반 입력 토큰의 25%**로 고정된다.

모델별 캐싱 지원 현황 및 비용

| 모델 | 최소 캐시 토큰 | 최대 캐시 블록 | 캐시 적중 요금 | |---|---|---|---| | Claude Opus 4.7 | 1,024 | 4개 | 공식 페이지 참조 | | Claude Sonnet 4.6 | 1,024 | 4개 | 공식 페이지 참조 | | Claude Haiku 4.5 | 2,048 | 4개 | 공식 페이지 참조 |

TTL 5시간 적용을 위해 별도 파라미터 변경은 필요 없으며, 기존 cache_control: {"type": "ephemeral"} 설정이 자동으로 새 TTL에 적용된다.

한국 개발자 실전 적용 포인트

이번 변경으로 가장 이득을 보는 시나리오는 긴 시스템 프롬프트·약관·코드베이스 스냅숏을 컨텍스트로 유지하는 SaaS 서비스다. 예를 들어 5만 토큰 분량의 내부 API 문서를 시스템 프롬프트에 포함해 쓰는 경우, 사용자 세션이 1시간을 넘겨도 캐시가 유지되므로 세션당 재캐싱 비용이 발생하지 않는다. Python SDK(anthropic>=0.28) 및 TypeScript SDK(@anthropic-ai/sdk>=0.24) 최신 버전에서 별도 업데이트 없이 즉시 적용된다. 비용 모니터링은 Anthropic Console의 Usage → Cache Metrics 탭에서 캐시 적중률과 절감액을 실시간 확인할 수 있다.

출처: Anthropic Documentation Changelog