📰 AI 뉴스2026-05-153분

OpenAI, o3 추론 모델 API 일반 공개—티어별 요금 확정

OpenAI가 o3 모델의 API 접근을 모든 유료 티어에 정식 개방하고 입력·출력·캐시 토큰 단가를 공식 확정했다. 기존 o1 대비 복잡한 수학·코드 벤치마크에서 최대 20% 향상된 성능을 제공하며, 한국 개발자들이 별도 웨이팅리스트 없이 즉시 호출할 수 있게 됐다.

openaiapireasoning

o3 API 정식 개방 개요

OpenAI는 2026년 5월 15일부로 추론 특화 모델 o3의 API를 Tier 1 이상 모든 유료 계정에 개방했다. 기존에는 연구자·엔터프라이즈 계약 고객에게만 제한적으로 제공됐으나, 이번 조치로 한국 스타트업과 개인 개발자도 즉시 사용 가능하다. 모델 식별자는 o3이며, o3-mini(고속·저비용)와 o3(풀 추론) 두 변형이 동시 제공된다.

요금 및 컨텍스트 스펙

| 모델 | 입력(1M 토큰) | 출력(1M 토큰) | 캐시 할인 | 컨텍스트 윈도우 | |---|---|---|---|---| | o3-mini | $1.10 | $4.40 | 50% | 128K | | o3 | $10.00 | $40.00 | 50% | 200K |

원화 환산은 결제 시점 환율이 적용되며, 정확한 최신 단가는 OpenAI 공식 Pricing 페이지를 참조한다. 배치(Batch) API 사용 시 추가 50% 할인이 적용돼 비동기 대용량 추론 파이프라인 구축 비용을 대폭 절감할 수 있다.

개발자 활용 포인트

코드 리뷰·디버깅 에이전트 구축에 o3-mini가 가성비 선택지로 부상할 전망이다. 함수 호출(Function Calling)과 구조화 출력(Structured Outputs)을 모두 지원하므로, 기존 GPT-4o 기반 파이프라인을 최소한의 코드 수정으로 마이그레이션할 수 있다. 단, 스트리밍 응답은 현재 o3-mini에만 지원되며 o3 풀 모델의 스트리밍은 추후 업데이트 예정이다. 레이트리밋은 Tier 1 기준 분당 요청(RPM) 500으로 설정돼 있어 프로덕션 트래픽이 높은 서비스는 Tier 업그레이드를 검토해야 한다.

출처: OpenAI Platform Changelog

← 이전

Meta, Llama 4 공식 파인튜닝 레시피 공개—한국어 데이터셋 가이드 포함

OpenAI, 강화학습 기반 파인튜닝 API 일반 공개—도메인 특화 추론 성능 강화