Mistral, Codestral 2 정식 출시—코드 전용 32B 오픈웨이트 모델
Mistral AI가 코드 생성·완성 특화 모델 Codestral 2를 정식 공개하며 Apache 2.0 라이선스로 가중치를 배포했다. 전작 대비 컨텍스트 윈도우가 256K 토큰으로 확대되고 FIM(Fill-in-the-Middle) 정확도가 대폭 향상돼, 로컬 환경에서 GitHub Copilot 수준의 인라인 완성을 자체 인프라로 구현할 수 있게 됐다.
무엇이 달라졌나
Mistral AI는 2026년 6월 11일 Codestral 2를 정식 출시하며 Apache 2.0 라이선스로 모델 가중치를 공개했다. 파라미터 수는 32B로, 전작(22B) 대비 규모가 커졌음에도 4-bit GPTQ 양자화 시 약 20 GB VRAM에서 실행 가능하다. 컨텍스트 윈도우는 기존 32K에서 256K 토큰으로 8배 확장되어 대형 모노레포 전체를 한 번에 참조할 수 있다.
핵심 개선 사항:
- FIM 정확도: HumanEval-Infilling 벤치마크 기준 전작 대비 +11 p 향상
- 다국어 코드: Python·TypeScript·Rust·Go·Java 등 40개 언어 공식 지원
- 지시 수행 모드:
-instruct변형 동시 배포, 채팅형 코드 리뷰·리팩터링 지원 - API 엔드포인트:
api.mistral.ai/v1/fim/completions즉시 호출 가능, 가격은 공식 페이지 참조
한국 개발자·크리에이터 활용 포인트
로컬 IDE 통합이 가장 즉각적인 활용처다. continue.dev 플러그인과 tabbycoder는 이미 Codestral 2 엔드포인트를 지원하며, VS Code·JetBrains 모두에서 인라인 FIM 완성을 활성화할 수 있다.
// continue.dev config.json 예시
{
"models": [
{
"title": "Codestral 2",
"provider": "mistral",
"model": "codestral-2",
"completionOptions": { "maxTokens": 512 }
}
]
}
사내 보안 정책으로 외부 API를 사용하지 못하는 팀은 Ollama (ollama pull codestral2:32b-q4_K_M) 또는 llama.cpp 서버로 에어갭 환경에서도 동일한 완성 품질을 누릴 수 있다.
크리에이터 관점에서는 긴 컨텍스트를 활용한 전체 프로젝트 문서 자동 생성이 유망하다. 256K 윈도우 덕분에 수천 줄 규모의 코드베이스를 단일 프롬프트에 넣고 README·API 문서·변경 이력 초안을 한 번에 뽑아낼 수 있다.
주의사항 및 다음 단계
- 라이선스: Apache 2.0이지만 Mistral AI의 사용 정책(AUP)은 별도 적용되므로 상업 서비스 배포 전 AUP 전문 확인 필요
- 양자화 품질 차이: Q4_K_M 대비 Q8_0은 FIM 정확도가 약 2 p 높으나 VRAM 요구량이 ~34 GB로 증가
- 벤치마크 재현: Mistral 공식 GitHub(
mistralai/codestral-evals)에 평가 스크립트가 공개되어 있어 사내 코드베이스 기준 자체 검증 권장 - 로드맵: Mistral은 멀티모달(코드+다이어그램 이해) 버전을 2026 Q3에 예고한 상태