📰 AI 뉴스2026-05-104분

Mistral, Codestral 2 출시—코드 컨텍스트 256K·FIM 강화

Mistral AI가 코딩 특화 오픈소스 모델 Codestral 2를 공개했다. 컨텍스트 윈도우가 256K 토큰으로 늘어나고 Fill-in-the-Middle(FIM) 정확도가 전작 대비 크게 향상돼, Cursor·Neovim 등 로컬 코드 에디터와 연동하는 한국 개발자에게 실질적 대안이 될 전망이다.

opensourcecodingmistral

Codestral 2 핵심 스펙

| 항목 | Codestral 1 | Codestral 2 | |------|------------|-------------| | 컨텍스트 윈도우 | 32K 토큰 | 256K 토큰 | | 파라미터 수 | 22B | 22B (동일) | | FIM 지원 | ✅ | ✅ (정확도 향상) | | 라이선스 | Mistral Commercial | Apache 2.0 | | 가중치 공개 | ✅ | ✅ |

가격은 Mistral API 기준 공식 페이지 참조. 가중치는 HuggingFace 공식 저장소에서 무료 다운로드 가능.

한국 개발자가 주목해야 할 이유

1. 라이선스 완전 개방 전작의 Mistral Commercial License와 달리 Apache 2.0 적용으로 상업 프로덕트·SaaS에 자유롭게 내장 가능. 국내 스타트업이 자체 AI 코딩 어시스턴트를 만들 때 법적 리스크가 크게 줄어든다.

2. 256K 컨텍스트로 대형 모노레포 처리 모노레포 환경에서 여러 패키지에 걸친 리팩터링 작업을 단일 프롬프트로 처리할 수 있다. 기존 32K에서는 파일을 잘게 분할해야 했던 불편이 해소된다.

3. 로컬 실행 최적화

# ollama로 로컬 실행 (VRAM 24GB 권장)
ollama pull codestral2
ollama run codestral2

Q4_K_M 양자화 기준 약 13GB 모델 크기로, RTX 4090 단일 GPU에서 구동 가능.

Cursor·VS Code 연동 방법

Cursor의 경우 Settings > Models > Custom Model에서 Ollama 엔드포인트(http://localhost:11434)와 모델명 codestral2를 입력하면 FIM 기반 인라인 자동완성이 즉시 활성화된다. VS Code + Continue 익스텐션 사용자도 동일한 방식으로 설정 가능.

한계

한국어 자연어 지시 이해도는 GPT-4o·Claude Sonnet 4.6 대비 낮아, 코드 생성 명령은 영어로 작성 권장
멀티모달(이미지·다이어그램→코드) 기능 미지원
256K 풀 컨텍스트 사용 시 추론 속도 저하 가능—로컬 환경에서 실 사용 전 벤치마크 필수

출처: Mistral AI Blog

← 이전

Meta Llama 4 Scout, 로컬 추론 공식 지원—RTX 4090 단일 GPU 구동 확인

Anthropic, Claude Haiku 4.5 배치 API 처리량 2배 상향