k
korAI
AI 뉴스 전체
📰 AI 뉴스2026-06-024분

Meta, Llama 4 Maverick 비전 API 가중치·추론 코드 전면 오픈소스 공개

Meta가 Llama 4 Maverick의 멀티모달(텍스트+이미지) 추론 가중치와 Hugging Face Transformers 호환 추론 코드를 상업적 이용 가능한 Llama 4 Community License 하에 전면 공개했다. 이전까지 비전 기능은 Meta AI 서비스 내부에서만 제공됐으나, 이제 로컬 또는 자체 서버에서 이미지 이해 기능을 무료로 구동할 수 있다. 클라우드 비용 없이 이미지 기반 앱을 만들려는 한국 인디 개발자에게 즉각적인 선택지가 생겼다.

metallamaopen-source

공개 범위 및 라이선스

Meta가 공개한 패키지는 다음 세 가지다.

  1. 가중치: meta-llama/Llama-4-Maverick-17B-128E-Instruct (Hugging Face Hub)
  2. 추론 코드: PyTorch 기반, Flash Attention 2 최적화 포함
  3. 변환 스크립트: GGUF(llama.cpp), ONNX 변환 공식 지원

라이선스는 Llama 4 Community License로, 월 활성 사용자 7억 명 미만 서비스는 상업적 이용 무료. 그 이상은 Meta와 별도 계약이 필요하다.

하드웨어 요구 사항 및 실행 예시

| 정밀도 | 최소 VRAM | 권장 GPU | |---|---|---| | BF16 풀 정밀도 | 약 140 GB | H100 × 2 이상 | | 4-bit AWQ 양자화 | 약 24 GB | RTX 4090 / A10G | | GGUF Q4_K_M | 약 12 GB | RTX 3090 |

# llama.cpp로 로컬 실행 (이미지 입력)
./llama-cli \
  -m llama-4-maverick-17b-q4_k_m.gguf \
  --mmproj llama-4-maverick-mmproj-q4.gguf \
  --image ./screenshot.png \
  -p "이 UI의 접근성 문제를 찾아줘"

한국 개발자·크리에이터 활용 포인트

UI 자동 QA: 스크린샷을 입력하면 레이아웃 깨짐·대비 문제를 자동으로 리포트하는 CI 파이프라인을 클라우드 API 비용 없이 구축할 수 있다.

영상 썸네일 분석: 유튜브 크리에이터는 경쟁 채널 썸네일을 배치로 분석해 색상·텍스트 구성 패턴을 추출하는 스크립트를 로컬에서 돌릴 수 있다.

Ollama 지원 예정: Ollama 팀이 공식 모델카드 지원을 이번 주 내로 머지할 예정이라고 GitHub 이슈에서 확인됐다. 지원 완료 시 ollama run llama4-maverick-vision 한 줄로 실행 가능해진다.

가중치 다운로드 및 상세 스펙은 Meta 공식 페이지 참조.

출처: Meta AI Blog