📰 AI 뉴스2026-06-014분
Meta, Llama 4 Maverick 함수 호출 기능 정식 GA
Meta가 Llama 4 Maverick 모델에 구조화된 함수 호출(Function Calling) 기능을 정식 지원하며 에이전트 파이프라인 구축이 가능해졌다. JSON 스키마 기반 도구 정의와 병렬 다중 호출을 지원해 오픈소스 에이전트 프레임워크와의 통합이 크게 간편해진 점이 핵심이다.
metallamaagent
무엇이 달라졌나
Meta는 2026년 6월 1일 Llama 4 Maverick(활성 파라미터 17B, 총 400B MoE 구조)의 공식 함수 호출 API를 정식 GA로 전환했다. 이전까지는 커뮤니티 패치 수준의 구현만 존재했으며, 공식 지원이 아니어서 프로덕션 적용에 걸림돌이 있었다. 이번 릴리스에서는 OpenAI 호환 tools 파라미터 스키마를 채택해 기존 GPT-4o·Claude 기반 코드를 최소한의 수정으로 마이그레이션할 수 있다.
핵심 스펙 및 성능 수치
- 병렬 호출: 단일 응답에서 최대 8개 도구 동시 호출 지원
- 지연 시간: Meta 내부 벤치마크 기준 첫 토큰(TTFT) 평균 320ms (A100 80GB 단일 노드, 배치 크기 1)
- 컨텍스트 윈도우: 함수 호출 포함 최대 128K 토큰
- 로컬 추론: Ollama 0.5.x 이상, llama.cpp
b3800이상에서--function-calling플래그로 활성화 - 가격은 Meta AI API(클라우드) 기준 공식 페이지 참조
한국 개발자 실전 적용 포인트
로컬 환경에서 무료로 실행 가능한 오픈소스 에이전트를 구성할 때 Llama 4 Maverick이 현실적인 선택지가 됐다. LangChain ChatOllama, LlamaIndex Ollama 클래스 모두 이번 업데이트 이후 공식 함수 호출 경로를 지원한다. 특히 사내 데이터를 외부 API로 보내기 어려운 금융·의료 도메인 스타트업에서 RAG+도구 호출 조합을 온프레미스로 구현하는 데 바로 활용 가능하다. 단, 한국어 함수명·파라미터 설명 사용 시 영문 대비 정확도가 약 4~6%p 낮다는 커뮤니티 측정 결과가 있으므로, 스키마의 description 필드는 영문 병기를 권장한다.
출처: Meta AI Blog