📰 AI 뉴스2026-05-264분

Meta, Llama 4 Reasoning 오픈웨이트 공개—수학·코드 추론 특화 모델

Meta가 수학 증명과 코드 디버깅에 특화된 추론 전용 모델 Llama 4 Reasoning을 오픈웨이트로 공개했다. 70B 파라미터 단일 모델로 AIME 2025 기준 정확도 78%를 기록하며, Apache 2.0 라이선스로 상업적 사용이 가능하다.

metaopen-sourcereasoning

모델 개요 및 출시 배경

Meta는 기존 Llama 4 Scout·Maverick이 범용 성능에 초점을 맞췄던 것과 달리, 이번 Llama 4 Reasoning은 강화학습 기반 추론(RLVR) 파이프라인을 집중 적용해 수학·논리·코드 디버깅 정확도를 극대화했다. 모델 가중치는 Hugging Face(meta-llama/Llama-4-Reasoning-70B)에서 즉시 다운로드 가능하며, llama.cpp·vLLM·Ollama 최신 버전에서 구동이 확인됐다.

벤치마크 및 스펙

| 항목 | 수치 | |---|---| | 파라미터 | 70B (Dense) | | 컨텍스트 길이 | 128K 토큰 | | AIME 2025 정확도 | 78% | | HumanEval+ | 84.3% | | MATH-500 | 91.2% | | 최소 VRAM (4비트 양자화) | 40GB | | 라이선스 | Apache 2.0 |

추론 시 <think>...</think> 태그로 내부 사고 과정을 명시하며, 최종 답변과 중간 추론 단계를 분리해 파싱할 수 있다.

한국 개발자 활용 시나리오

로컬 수학 튜터 서비스: 128K 컨텍스트를 활용해 교재 PDF 전체를 넣고 단계별 풀이를 생성하는 에듀테크 앱 구축이 가능하다. 코드 디버깅 에이전트: HumanEval+ 84.3% 성능을 바탕으로 사내 레거시 Python 2→3 마이그레이션 자동화 파이프라인에 적용할 수 있다. 온프레미스 배포: Apache 2.0 라이선스이므로 데이터 외부 전송이 불가한 금융·의료 환경에서 폐쇄망 서버에 직접 올려 운영할 수 있으며, 4비트 양자화 시 A100 40GB 1장으로 서빙이 가능하다. 한국어 추론 성능은 공식 벤치마크에 포함되지 않아 실 도입 전 자체 평가가 권장된다.

출처: Meta AI Blog

← 이전

OpenAI Realtime API WebRTC 정식 GA—음성 대화 앱 구축 비용 공개

Anthropic, Claude Code SDK 정식 GA—에이전트 코딩 파이프라인 직접 통합