OpenAI, o3 추론 모델 API 일반 공개—티어별 요금 확정
OpenAI가 o3 모델의 API 접근을 모든 유료 티어에 정식 개방하고 입력·출력·캐시 토큰 단가를 공식 확정했다. 기존 o1 대비 복잡한 수학·코드 벤치마크에서 최대 20% 향상된 성능을 제공하며, 한국 개발자들이 별도 웨이팅리스트 없이 즉시 호출할 수 있게 됐다.
o3 API 정식 개방 개요
OpenAI는 2026년 5월 15일부로 추론 특화 모델 o3의 API를 Tier 1 이상 모든 유료 계정에 개방했다. 기존에는 연구자·엔터프라이즈 계약 고객에게만 제한적으로 제공됐으나, 이번 조치로 한국 스타트업과 개인 개발자도 즉시 사용 가능하다. 모델 식별자는 o3이며, o3-mini(고속·저비용)와 o3(풀 추론) 두 변형이 동시 제공된다.
요금 및 컨텍스트 스펙
| 모델 | 입력(1M 토큰) | 출력(1M 토큰) | 캐시 할인 | 컨텍스트 윈도우 | |---|---|---|---|---| | o3-mini | $1.10 | $4.40 | 50% | 128K | | o3 | $10.00 | $40.00 | 50% | 200K |
원화 환산은 결제 시점 환율이 적용되며, 정확한 최신 단가는 OpenAI 공식 Pricing 페이지를 참조한다. 배치(Batch) API 사용 시 추가 50% 할인이 적용돼 비동기 대용량 추론 파이프라인 구축 비용을 대폭 절감할 수 있다.
개발자 활용 포인트
코드 리뷰·디버깅 에이전트 구축에 o3-mini가 가성비 선택지로 부상할 전망이다. 함수 호출(Function Calling)과 구조화 출력(Structured Outputs)을 모두 지원하므로, 기존 GPT-4o 기반 파이프라인을 최소한의 코드 수정으로 마이그레이션할 수 있다. 단, 스트리밍 응답은 현재 o3-mini에만 지원되며 o3 풀 모델의 스트리밍은 추후 업데이트 예정이다. 레이트리밋은 Tier 1 기준 분당 요청(RPM) 500으로 설정돼 있어 프로덕션 트래픽이 높은 서비스는 Tier 업그레이드를 검토해야 한다.