📰 AI 뉴스2026-06-124분
Anthropic, Tool Use 스트리밍 응답 정식 지원—에이전트 UX 대폭 개선
Anthropic이 Claude API의 Tool Use(함수 호출) 결과를 스트리밍으로 반환하는 기능을 정식 지원하기 시작했다. 기존에는 도구 실행 완료 후 전체 응답을 한 번에 받아야 했으나, 이제 중간 추론 텍스트와 도구 입력 파라미터가 실시간으로 델타 스트림으로 전달된다. 응답 대기 시간이 체감상 크게 줄어 챗봇·코딩 에이전트 등 인터랙티브 서비스의 사용자 경험이 개선된다.
anthropicapistreaming
변경 전후 비교
| 항목 | 이전 | 이후 |
|------|------|------|
| Tool Use 응답 방식 | 완성 후 일괄 반환 | 델타 스트림 실시간 반환 |
| 중간 추론 텍스트 노출 | 불가 | thinking 델타로 실시간 수신 |
| 도구 입력 파라미터 | 완성 시점 단일 이벤트 | input_json_delta로 점진 수신 |
| 적용 모델 | — | Claude Sonnet 4.6 · Haiku 4.5 (Opus 4.7 포함) |
구현 방법
스트리밍 Tool Use는 기존 stream=True 플래그와 동일한 방식으로 활성화된다. 새로 추가된 이벤트 타입은 다음과 같다.
# Python SDK 예시 (anthropic >= 0.35.0)
with client.messages.stream(
model="claude-sonnet-4-6",
max_tokens=4096,
tools=[search_tool],
messages=messages
) as stream:
for event in stream:
if event.type == "content_block_delta":
if event.delta.type == "input_json_delta":
# 도구 파라미터 점진 수신
print(event.delta.partial_json, end="", flush=True)
elif event.type == "content_block_start":
if event.content_block.type == "tool_use":
print(f"\n[도구 호출 시작: {event.content_block.name}]")
요금은 기존 Tool Use API와 동일하게 입출력 토큰 기준으로 청구되며 스트리밍 추가 비용은 없다(공식 페이지 참조).
한국 크리에이터·개발자에게 미치는 영향
- 실시간 코딩 에이전트: 도구 파라미터가 화면에 타이핑되듯 표시되어 사용자가 실행 전 의도를 즉각 확인 가능
- RAG 파이프라인 UX: 검색 쿼리가 생성되는 과정을 시각화해 신뢰도 체감 향상
- 스트리밍 비용 최적화: 중간 단계에서 불필요한 도구 호출을 감지해 조기 중단 로직 구현이 용이해짐
공식 마이그레이션 가이드는 Anthropic 개발자 문서의 Tool use streaming 섹션에서 확인할 수 있다.
출처: Anthropic 개발자 문서