k
korAI
AI 뉴스 전체
📰 AI 뉴스2026-05-224분

OpenAI Responses API, 파일 검색·웹 검색 도구 정식 GA

OpenAI가 Responses API에 내장된 파일 검색(File Search)과 웹 검색(Web Search) 도구를 정식 GA로 전환했다. 기존 Assistants API 대비 단일 요청에서 다중 도구를 병렬 호출할 수 있어 RAG 파이프라인 구축 비용과 코드 복잡도를 동시에 낮출 수 있다.

openaiapirag

무엇이 바뀌었나

OpenAI Responses API는 2025년 초 베타로 공개된 이후 이번 정식 GA를 통해 프로덕션 워크로드 적용이 가능해졌다. 핵심 변화는 파일 검색웹 검색 두 내장 도구가 단일 API 호출 안에서 병렬로 실행된다는 점이다. 기존 Assistants API에서는 Thread → Run → Step을 순차적으로 관리해야 했지만, Responses API는 tools 배열에 도구를 선언하면 모델이 자동으로 호출 순서를 결정한다.

파일 검색은 벡터 스토어(Vector Store)와 통합되어 최대 10,000개 파일, 파일당 최대 512 MB를 지원한다. 청킹·임베딩·인덱싱은 OpenAI 인프라가 처리하므로 별도 임베딩 모델 운영이 불필요하다. 웹 검색은 gpt-4ogpt-4o-mini 계열 모델에서 활성화되며, 검색 결과 인용(citation) 객체가 응답에 포함되어 출처 추적이 용이하다.

한국 개발자·크리에이터에게 미치는 영향

RAG 파이프라인 단순화: 사내 문서 기반 챗봇이나 코드 리뷰 보조 도구를 만들 때 LangChain·LlamaIndex 같은 오케스트레이션 레이어 없이 Responses API 단독으로 파일 검색을 처리할 수 있다. 스타트업이나 1인 개발자에게 초기 아키텍처 결정 비용을 줄여 준다.

비용 구조: 파일 검색 도구는 벡터 스토어 스토리지 비용(공식 페이지 참조)과 검색당 토큰 비용이 별도로 청구된다. 웹 검색은 검색 호출 횟수 기준으로 과금되며 정확한 단가는 OpenAI 공식 페이지를 참조해야 한다. 기존 Assistants API를 사용 중이라면 OpenAI가 2026년 말 Assistants API 지원 종료를 예고한 만큼 마이그레이션 시점을 검토할 필요가 있다.

크리에이터 툴 연동: 영상 스크립트 리서치, 레퍼런스 수집, 긴 PDF 분석 등 콘텐츠 제작 보조 워크플로우에서 웹 검색과 파일 검색을 한 요청에 묶어 처리할 수 있어 자동화 스크립트 작성이 간결해진다.

마이그레이션 체크리스트

  1. Assistants API 사용 여부 확인: beta.assistants 엔드포인트를 호출 중이라면 Responses API 전환 계획 수립.
  2. 벡터 스토어 재활용: 기존 Assistants API용 Vector Store ID는 Responses API에서 그대로 참조 가능.
  3. 스트리밍 응답 처리: Responses API는 Server-Sent Events(SSE) 스트리밍을 기본 지원하므로 클라이언트 파서 업데이트 필요.
  4. 인용 객체 파싱: 웹 검색 결과에 포함된 annotations 필드를 UI에서 출처 링크로 렌더링하는 로직 추가 권장.
  5. 요금 모니터링: 도구 호출 횟수가 늘어날 수 있으므로 Usage 대시보드에서 tool_use 토큰 항목을 별도 추적.
출처: OpenAI Platform Changelog