k
korAI
📰 AI 뉴스

AI 뉴스

매일 3개 자동 업데이트 · 공식 발표와 실전 경험을 기반으로 큐레이션합니다.

2026-06-20·3

Anthropic, Claude Opus 4 시스템 프롬프트 캐싱 정식 지원—긴 컨텍스트 반복 호출 최적화

Anthropic이 Claude Opus 4 모델에 대해 최대 200K 토큰 범위의 시스템 프롬프트 캐싱을 정식 지원하기 시작했다. 대형 코드베이스나 문서를 반복적으로 참조하는 에이전트 워크플로에서 입력 토큰 비용을 최대 90%까지 절감할 수 있어, 장문 컨텍스트를 활용하는 한국 개발자에게 실질적인 운영 비용 개선이 기대된다.

4분anthropicclaude

OpenAI, Codex 클라우드 샌드박스 정식 GA—격리 환경서 코드 자율 실행

OpenAI가 Codex 에이전트가 클라우드 격리 샌드박스 내에서 코드를 직접 작성·실행·테스트·수정하는 전 과정을 자율 수행하는 Codex 클라우드 샌드박스를 정식 GA(General Availability)로 전환했다. 로컬 환경 설정 없이 API 키만으로 완전한 CI 수준의 코드 실행 루프를 구성할 수 있어, 서버리스 에이전트 파이프라인을 구축하는 개발팀에 즉각적인 실용성을 제공한다.

4분openaicodex

Anthropic, Claude Code SDK 정식 GA—에이전트 워크플로 직접 빌드 가능

Anthropic이 Claude Code의 핵심 에이전트 기능을 외부 애플리케이션에 직접 내장할 수 있는 Claude Code SDK를 정식 출시했다. 개발자는 파일 읽기·쓰기, 터미널 실행, 웹 검색 등 내장 도구를 자신의 파이프라인에 그대로 활용하거나 커스텀 툴을 추가해 독자적인 코딩 에이전트를 구성할 수 있다. 기존 CLI 단독 사용 대비 자동화 통합 범위가 크게 확장되어 CI/CD, 사내 개발 포털, 코드 리뷰 봇 등 다양한 B2B 시나리오에 적용이 가능해졌다.

4분anthropicclaude-code
2026-06-19·3

Cursor 0.50, 멀티 파일 에이전트 모드 정식 출시

Cursor가 0.50 버전에서 멀티 파일 동시 편집과 터미널 자동 실행을 결합한 에이전트 모드를 정식 GA로 전환했다. 기존 Composer 대비 컨텍스트 윈도우를 최대 200K 토큰까지 확장해 대규모 모노레포 작업이 가능해졌으며, 한국 개발자들이 많이 사용하는 Next.js·NestJS 프로젝트 템플릿도 공식 지원 목록에 추가됐다.

4분cursoragent

Claude Code, 병렬 서브에이전트 실행 기능 베타 공개

Anthropic이 Claude Code에 복수의 서브에이전트를 동시에 스폰(spawn)해 독립 작업을 병렬 처리하는 기능을 베타로 공개했다. 테스트 작성·린트 수정·문서 업데이트 같은 독립적 태스크를 분리 실행해 전체 소요 시간을 최대 60% 단축할 수 있으며, 크리에이터·개발자 모두 복잡한 프로젝트 자동화에 즉시 적용 가능하다.

4분claude-codeanthropic

Anthropic, Claude Haiku 4.5 배치 API 정식 GA—대량 처리 비용 50% 추가 절감

Anthropic이 Claude Haiku 4.5를 대상으로 한 Message Batches API를 정식 GA로 전환하며, 기존 실시간 API 대비 최대 50% 추가 할인 요금을 적용한다고 공식 발표했다. 비동기 대량 요청 처리가 필요한 데이터 파이프라인·콘텐츠 자동화 워크플로에서 운영 비용을 대폭 낮출 수 있어 한국 개발자·크리에이터에게 실질적인 영향을 준다.

4분anthropicapi
2026-06-18·3

OpenAI Codex CLI 정식 GA—터미널에서 자연어로 코드 실행

OpenAI가 터미널 전용 코딩 에이전트 Codex CLI를 정식 출시했다. 로컬 파일시스템을 직접 읽고 수정하며, 샌드박스 모드와 자동 승인 모드를 분리 제공해 안전성과 생산성을 동시에 확보했다. 기존 VS Code 중심 워크플로를 벗어나 CLI 기반 개발 환경을 선호하는 한국 백엔드·DevOps 개발자에게 즉시 활용 가능한 도구다.

4분openaicli

Hugging Face, 서드파티 추론 프로바이더 통합 API 정식 공개

Hugging Face가 단일 API 엔드포인트로 Together AI·Fireworks AI·Nebius 등 외부 추론 인프라를 호출할 수 있는 Inference Providers 기능을 정식 공개했다. 모델 허브에서 프로바이더를 선택하면 동일한 `InferenceClient` 코드로 공급사를 전환할 수 있어 벤더 종속 리스크가 줄어든다. 오픈소스 모델을 프로덕션에 투입하는 한국 스타트업과 크리에이터 툴 개발자에게 멀티 클라우드 전략의 실용적 출발점이 된다.

5분huggingfaceopen-source

Google, Gemini 2.5 Flash-Lite 정식 GA—저비용 고속 추론 API 공개

Google DeepMind가 Gemini 2.5 Flash-Lite를 Google AI Studio 및 Vertex AI에서 정식 GA로 전환했다. 기존 Gemini 2.5 Flash 대비 입출력 토큰 단가를 최대 50% 낮추면서 응답 지연은 유사하게 유지해, 대량 배치 처리나 비용 민감형 프로덕션 파이프라인에 실질적인 대안이 생겼다.

4분googlegemini
2026-06-17·3
2026-06-16·3
2026-06-15·3
2026-06-14·3

Anthropic, Claude Opus 4 확장 사고 API 정식 공개—복잡한 추론 태스크 직접 통합

Anthropic이 Claude Opus 4의 확장 사고(Extended Thinking) 기능을 Messages API를 통해 정식으로 외부 개발자에게 공개했다. 사고 토큰 예산(thinking budget)을 직접 설정할 수 있어 수학·코드 검증·다단계 계획 수립 등 고난이도 태스크에 투입 비용과 응답 품질을 개발자가 직접 조율할 수 있다. 기존 프롬프트 엔지니어링만으로 한계를 느끼던 복잡한 비즈니스 로직 자동화 작업에 바로 적용 가능하다는 점에서 실무 활용 범위가 크게 넓어진다.

4분anthropicllm

Meta, Llama 4 Scout 멀티모달 파인튜닝 레시피 공식 공개—이미지+텍스트 커스텀 모델 구축 가능

Meta가 Llama 4 Scout(17B 활성 파라미터, MoE 구조)에 대한 멀티모달 지도 파인튜닝(SFT) 레시피와 예제 데이터셋을 공식 GitHub 리포지터리에 공개했다. 텍스트 전용 파인튜닝과 달리 이미지-텍스트 쌍 데이터를 활용해 도메인 특화 시각 이해 모델을 누구나 직접 학습시킬 수 있게 됐다. 클라우드 GPU 비용을 최소화하는 LoRA 기반 학습 스크립트도 함께 제공되어 스타트업과 1인 개발자도 실질적으로 활용 가능한 수준이다.

5분metaopen-source

OpenAI, GPT-4o 비전 파인튜닝 정식 GA—이미지 입력 커스텀 모델 API 공개

OpenAI가 GPT-4o의 이미지 입력을 포함한 멀티모달 파인튜닝을 정식 지원하며, 개발자는 이제 텍스트와 이미지를 혼합한 학습 데이터로 도메인 특화 비전 모델을 직접 훈련할 수 있다. 기존 텍스트 전용 파인튜닝 대비 UI 검수·의료 이미지·제조 결함 탐지 등 실무 적용 범위가 크게 확장되어, 반복적인 프롬프트 엔지니어링 없이 일관된 비전 추론 결과를 얻을 수 있다.

4분openaifine-tuning
2026-06-13·3
2026-06-12·3

OpenAI Codex CLI 정식 GA—터미널에서 코드 자율 실행

OpenAI가 터미널 기반 코딩 에이전트 Codex CLI를 정식 GA로 전환하며 GPT-4.1 모델과의 통합을 강화했다. 파일 읽기·쓰기·명령 실행을 샌드박스 없이 로컬에서 수행할 수 있어 한국 백엔드·DevOps 개발자의 일상 워크플로에 직접 연결된다. npm 또는 pip 단일 명령으로 설치 가능하며, 요금은 GPT-4.1 API 종량제를 그대로 적용한다.

4분openaicli

Anthropic, Tool Use 스트리밍 응답 정식 지원—에이전트 UX 대폭 개선

Anthropic이 Claude API의 Tool Use(함수 호출) 결과를 스트리밍으로 반환하는 기능을 정식 지원하기 시작했다. 기존에는 도구 실행 완료 후 전체 응답을 한 번에 받아야 했으나, 이제 중간 추론 텍스트와 도구 입력 파라미터가 실시간으로 델타 스트림으로 전달된다. 응답 대기 시간이 체감상 크게 줄어 챗봇·코딩 에이전트 등 인터랙티브 서비스의 사용자 경험이 개선된다.

4분anthropicapi

Anthropic, Claude Haiku 4.5 배치 API 정식 GA—대용량 비동기 처리 비용 최대 50% 절감

Anthropic이 Claude Haiku 4.5를 대상으로 한 Message Batches API를 정식 GA로 전환하며, 최대 10만 건의 요청을 단일 배치로 비동기 제출할 수 있게 됐다. 실시간 응답이 불필요한 데이터 가공·콘텐츠 분류·대규모 번역 파이프라인에서 표준 API 대비 최대 50% 낮은 단가를 공식 적용받는다. 한국 개발자와 크리에이터가 야간 배치 작업이나 대량 텍스트 처리 워크플로를 구성할 때 즉시 활용 가능하다.

4분anthropicapi
2026-06-11·3
2026-06-10·3

OpenAI, Realtime API WebRTC 모드 정식 GA—브라우저 직접 음성 통화 구현

OpenAI가 Realtime API의 WebRTC 전송 방식을 정식 GA로 전환했다. 기존 WebSocket 방식 대비 서버 중계 없이 브라우저와 모델 간 직접 저지연 음성 스트림이 가능해져, 별도 백엔드 없이 클라이언트 단에서 실시간 음성 대화 앱을 구현할 수 있다. 한국 크리에이터·스타트업의 음성 인터페이스 프로토타입 비용과 인프라 복잡도가 대폭 줄어들 전망이다.

4분openairealtime

Meta Llama 4 Maverick GGUF 공식 배포—Ollama·llama.cpp 즉시 로컬 실행

Meta가 Llama 4 Maverick 모델의 GGUF 포맷 공식 가중치를 Hugging Face에 공개했다. Q4_K_M 양자화 기준 약 24GB로, RTX 4090 단일 GPU 또는 M2 Max MacBook Pro에서 추론이 가능하다. Ollama와 llama.cpp 최신 버전에서 즉시 `ollama pull llama4:maverick` 한 줄로 실행할 수 있어 국내 로컬 AI 개발 환경이 한 단계 넓어질 것으로 보인다.

4분metallama

Google DeepMind, Veo 3 동영상 생성 API 정식 GA—크리에이터 워크플로 직접 통합 가능

Google DeepMind가 Veo 3 동영상 생성 모델의 API를 Vertex AI를 통해 정식 공개했다. 텍스트·이미지 프롬프트로 최대 1080p, 60fps 동영상을 프로그래밍 방식으로 생성할 수 있어, 콘텐츠 제작 파이프라인 자동화가 현실화됐다. 한국 크리에이터와 미디어 스타트업이 자체 서비스에 고품질 동영상 생성 기능을 직접 내재화할 수 있는 첫 번째 공식 경로다.

4분google-deepmindvideo-generation
2026-06-09·3

GitHub Copilot, 에이전트 모드 VS Code 정식 GA—멀티파일 자율 편집 지원

GitHub Copilot의 에이전트 모드가 VS Code에서 정식 출시되어, 단일 프롬프트로 여러 파일을 자율적으로 생성·수정·삭제하는 작업이 가능해졌다. 터미널 명령 실행 및 테스트 자동 수정 루프까지 포함되어 기존 인라인 제안 방식과 차별화된다.

3분copilotdeveloper-tools

EU AI법 범용 AI 실천 강령 최종안 확정—한국 기업 대응 체크리스트

유럽연합이 AI법(AI Act)의 범용 AI(GPAI) 모델 적용 조항에 대한 실천 강령(Code of Practice) 최종안을 확정 공고했다. 연간 활성 사용자 1000만 명 이상 또는 학습 연산량 10²⁵ FLOP 초과 모델에 대해 투명성 보고서 및 저작권 학습 데이터 로그 제출이 의무화된다. 한국 기업도 EU 시장에 AI 서비스를 제공할 경우 2026년 8월부터 적용 대상이 된다.

4분ai-policyregulation

Google DeepMind, Gemma 3 27B 함수 호출 공식 지원—온프레미스 에이전트 구축 가능

Google DeepMind가 오픈소스 모델 Gemma 3 27B에 함수 호출(Function Calling) 기능을 정식 탑재하고 Hugging Face 및 Kaggle을 통해 업데이트된 가중치를 배포했다. 이로써 개발자는 외부 API 호출이나 로컬 툴 실행을 클라우드 의존 없이 자체 인프라에서 구현할 수 있어, 데이터 외부 유출을 꺼리는 기업 환경에서의 에이전트 파이프라인 구축 비용이 크게 낮아진다.

4분google-deepmindopen-source
2026-06-08·3
2026-06-07·2
2026-06-06·1
2026-06-05·1
2026-06-04·3

OpenAI, 파인튜닝 대시보드 v2 정식 GA—실시간 손실 모니터링·자동 하이퍼파라미터 튜닝

OpenAI가 파인튜닝 대시보드를 전면 개편해 학습 중 손실 곡선·검증 지표를 실시간으로 시각화하는 기능과 자동 하이퍼파라미터 탐색 옵션을 정식 제공한다. gpt-4o-mini 및 gpt-4o 계열 모델에 즉시 적용 가능하며, 기존 API 키와 프로젝트 구조를 그대로 유지한 채 마이그레이션 없이 사용할 수 있어 한국 개발팀의 MLOps 워크플로우 진입 장벽이 낮아진다.

4분openaifine-tuning

Anthropic, Claude Code IDE 확장 VS Code·JetBrains 동시 정식 GA

Anthropic이 Claude Code의 VS Code 및 JetBrains 계열 IDE 네이티브 확장을 동시에 정식 출시했다. 터미널 CLI 없이 에디터 패널 안에서 코드 리뷰·자동 수정·테스트 생성을 완결할 수 있으며, 기업 요금제 사용자는 Claude Sonnet 4 모델이 기본 적용된다.

5분anthropicclaude-code

OpenAI, Structured Outputs v2 정식 GA—스키마 복잡도 한계 대폭 완화

OpenAI가 Structured Outputs v2를 정식 출시하며 중첩 객체 깊이 제한을 기존 5단계에서 20단계로 확대하고, `anyOf` · `$ref` 등 JSON Schema 고급 키워드를 공식 지원하기 시작했다. 복잡한 도메인 모델을 그대로 스키마로 넘길 수 있어, 별도 전처리 없이 LLM 출력을 타입 안전하게 파싱하는 프로덕션 파이프라인 구축이 용이해진다.

4분openaiapi
2026-06-03·3
2026-06-02·3

Google, Gemini 2.5 Flash 추론 예산 동적 제어 API 정식 GA

Google DeepMind가 Gemini 2.5 Flash의 '추론 예산(thinking budget)' 파라미터를 개발자가 요청 단위로 동적으로 조절할 수 있는 API를 정식 GA로 전환했다. 이로써 단순 분류 작업에는 추론을 최소화해 비용을 낮추고, 복잡한 코드 생성 작업에는 예산을 높여 품질을 극대화하는 혼합 전략이 가능해진다. 한국 스타트업 및 인디 크리에이터에게 토큰 비용 최적화의 실질적 수단이 생긴 셈이다.

4분googlegemini

Meta, Llama 4 Maverick 비전 API 가중치·추론 코드 전면 오픈소스 공개

Meta가 Llama 4 Maverick의 멀티모달(텍스트+이미지) 추론 가중치와 Hugging Face Transformers 호환 추론 코드를 상업적 이용 가능한 Llama 4 Community License 하에 전면 공개했다. 이전까지 비전 기능은 Meta AI 서비스 내부에서만 제공됐으나, 이제 로컬 또는 자체 서버에서 이미지 이해 기능을 무료로 구동할 수 있다. 클라우드 비용 없이 이미지 기반 앱을 만들려는 한국 인디 개발자에게 즉각적인 선택지가 생겼다.

4분metallama

Google DeepMind, Veo 3 영상 생성 API 개발자 정식 GA

Google DeepMind가 텍스트·이미지 프롬프트로 최대 4K 60fps 영상을 생성하는 Veo 3 API를 Google AI Studio 및 Vertex AI에서 정식 공개했다. 오디오 동기화, 카메라 모션 제어 파라미터가 추가돼 크리에이터 및 영상 앱 개발자의 프로덕션 활용이 가능해졌다.

4분google-deepmindvideo-generation
2026-06-01·5

Claude Code, 서브에이전트 병렬 실행 정식 지원—대형 리팩토링 속도 대폭 향상

Anthropic이 Claude Code에 서브에이전트 병렬 실행 기능을 정식 GA했다. 하나의 작업을 여러 독립 에이전트가 동시에 처리하도록 분할해 대규모 코드베이스 리팩토링·테스트 생성 시간을 기존 대비 최대 60% 단축할 수 있다. 한국 개발자들이 실무에서 가장 많이 요청한 기능 중 하나로, 모노레포 환경에서 특히 효과적이다.

4분claude-codeagents

Meta, Llama 4 Scout 한국어 파인튜닝 공식 레시피·데이터셋 오픈소스 공개

Meta가 Llama 4 Scout(17B 활성 파라미터) 모델의 한국어 특화 파인튜닝 레시피와 함께 약 120만 건 규모의 한국어 인스트럭션 데이터셋을 Hugging Face에 공개했다. 8×H100 이하 환경에서 재현 가능하도록 설계돼 국내 스타트업과 1인 크리에이터도 커스텀 모델을 빌드할 수 있는 문턱이 크게 낮아졌다. 한국어 BLEU·ROUGE 지표가 기존 베이스 모델 대비 각각 18%, 22% 향상됐다고 Meta는 밝혔다.

5분llamaopen-source

OpenAI Realtime API, WebRTC 직접 연결 정식 GA—서버 없이 음성 AI 앱 구축

OpenAI가 Realtime API의 WebRTC 다이렉트 연결 모드를 정식 GA로 전환하며, 별도 백엔드 서버 없이 브라우저·모바일 앱에서 곧바로 저지연 음성 대화 AI를 구현할 수 있게 됐다. 기존 WebSocket 방식 대비 평균 레이턴시가 40% 감소했으며, 한국 개발자들이 많이 사용하는 React·Flutter SDK에 공식 예제가 추가됐다.

4분openairealtime-api

Meta, Llama 4 Maverick 함수 호출 기능 정식 GA

Meta가 Llama 4 Maverick 모델에 구조화된 함수 호출(Function Calling) 기능을 정식 지원하며 에이전트 파이프라인 구축이 가능해졌다. JSON 스키마 기반 도구 정의와 병렬 다중 호출을 지원해 오픈소스 에이전트 프레임워크와의 통합이 크게 간편해진 점이 핵심이다.

4분metallama

Anthropic, 프롬프트 캐시 TTL 1시간→5시간 확대

Anthropic이 Claude API의 프롬프트 캐싱(Prompt Caching) 유효 시간을 기존 최대 1시간에서 5시간으로 연장했다. 대용량 시스템 프롬프트나 문서를 반복 사용하는 서비스에서 입력 토큰 비용을 추가로 절감할 수 있어 장시간 세션 기반 앱 개발자에게 직접적인 혜택이 생긴다.

3분anthropicclaude
2026-05-31·2
2026-05-30·3

OpenAI, o3 추론 모델 무료 플랜 일일 한도 3배 확대

OpenAI가 ChatGPT 무료 플랜 사용자에게 제공하는 o3 모델의 일일 메시지 한도를 기존 대비 3배 늘렸다. 고비용 추론 모델에 대한 접근 장벽이 낮아져, API 도입 전 검증 단계에 있는 한국 개발자·인디 크리에이터에게 실질적인 테스트 기회가 넓어진다.

3분openaillm

한국 AI 기본법 시행령 초안 공개—고위험 AI 판단 기준 명시

과학기술정보통신부가 2026년 하반기 시행 예정인 AI 기본법의 시행령 초안을 입법예고했다. 초안에는 '고위험 AI' 해당 여부를 판단하는 서비스 유형·영향 범위 기준이 처음으로 수치와 함께 제시돼, AI 서비스를 개발·운영 중인 국내 기업과 크리에이터 플랫폼이 즉각적인 법적 검토에 나서야 하는 상황이다.

4분ai-policyregulation

GitHub Copilot Workspace, 멀티파일 자율 에이전트 모드 정식 GA

GitHub이 Copilot Workspace의 멀티파일 자율 에이전트 모드를 정식 출시하며, 이슈 하나로 브랜치 생성·파일 수정·PR 초안 작성까지 단일 플로우로 자동화할 수 있게 됐다. Copilot Enterprise 구독자는 즉시 사용 가능하며, 개인 Pro 플랜 사용자에게는 월 50회 무료 실행 크레딧이 제공된다. 대규모 레거시 코드베이스를 다루는 한국 백엔드·풀스택 개발자에게 반복 작업 자동화의 실질적 진입 장벽이 낮아졌다는 점에서 주목된다.

4분github-copilotdeveloper-tools
2026-05-29·3
2026-05-28·3

Mistral, Codestral 2 정식 공개—80개 언어 코드 완성 성능 강화

Mistral AI가 코드 특화 모델 Codestral 2를 정식 공개했다. 전작 대비 컨텍스트 윈도우가 256K 토큰으로 확장되었고, Rust·Go·Kotlin 등 시스템 언어 벤치마크에서 GPT-4o를 상회하는 결과를 발표했다. Mistral API 및 주요 IDE 플러그인을 통해 즉시 사용 가능해 한국 개발자들의 로컬·온프레미스 배포 대안으로 주목받고 있다.

4분open-sourcecoding

EU AI법 범용 AI 행동강령 최종안 확정—한국 서비스 수출 시 준수 필수

유럽 AI 오피스(AI Office)가 범용 AI(GPAI) 모델 공급자 대상 행동강령(Code of Practice) 최종안을 확정 발표했다. 시스템적 위험 모델(학습 연산량 10²⁵ FLOP 초과) 기준, 투명성 보고·레드팀 의무가 구체화되었다. EU 내 AI 서비스 출시를 목표로 하는 한국 스타트업과 개발자는 2026년 8월 2일 전까지 준수 체계를 갖춰야 한다.

5분ai-policyregulation

Anthropic, Claude Sonnet 4 확장 사고 모드 정식 GA—추론 토큰 예산 32K로 확대

Anthropic이 Claude Sonnet 4의 확장 사고(Extended Thinking) 모드를 정식 GA로 전환하며 추론 토큰 예산 상한을 기존 16K에서 32K 토큰으로 두 배 확대했다. 복잡한 다단계 코드 리팩터링, 아키텍처 설계, 수학적 증명 등 긴 사고 체인이 요구되는 작업에서 정확도가 크게 향상되어 한국 개발자의 프로덕션 워크플로우 도입 장벽이 낮아졌다.

4분anthropicllm
2026-05-27·2
2026-05-26·3
2026-05-25·3
2026-05-24·3

Cursor, 백그라운드 에이전트 정식 GA—로컬 환경 병렬 실행 지원

Cursor가 백그라운드 에이전트(Background Agent) 기능을 정식 GA로 전환하며, 개발자가 에디터를 떠나지 않고도 여러 태스크를 병렬로 위임할 수 있게 됐다. 각 에이전트는 격리된 로컬 샌드박스에서 실행되며 결과를 PR 또는 diff 형태로 반환해 코드 리뷰 워크플로와 자연스럽게 연결된다. 에이전트당 실행 시간 제한과 토큰 소비가 플랜별로 달라 팀 단위 도입 시 비용 예측이 중요해졌다.

4분cursordev-tools

OpenAI, GPT-4o 비전 파인튜닝 정식 GA—이미지·텍스트 혼합 학습 지원

OpenAI가 GPT-4o의 비전 파인튜닝(Vision Fine-Tuning)을 정식 GA로 전환해, 이미지와 텍스트가 혼합된 학습 데이터셋으로 모델을 커스터마이징할 수 있게 됐다. UI 캡처 분류, 도면 해석, 상품 이미지 태깅 등 멀티모달 도메인 특화 태스크에서 범용 모델 대비 정확도가 유의미하게 향상된다. 학습 비용은 텍스트 파인튜닝 대비 토큰당 단가가 높으므로 데이터셋 설계 단계에서 품질 우선 전략이 필요하다.

5분openaifine-tuning

GitHub Copilot Workspace, MCP 서버 연동 정식 지원

GitHub Copilot Workspace가 Model Context Protocol(MCP) 서버 연동을 정식 GA로 지원하며, 외부 데이터소스·툴을 Workspace 태스크 플랜에 직접 주입할 수 있게 됐다. 이로써 Jira 티켓, Notion 문서, 사내 API 스펙 등을 별도 복사 없이 코딩 컨텍스트로 활용할 수 있어 한국 개발팀의 협업 자동화 파이프라인 구축에 실질적 변화가 예상된다.

4분github-copilotmcp
2026-05-23·3

Anthropic, Claude Opus 4 확장 사고 모드 정식 GA—복잡한 추론 태스크 대응

Anthropic이 Claude Opus 4의 확장 사고(Extended Thinking) 모드를 API에서 정식 GA로 전환했다. 수학·코드 디버깅·다단계 플래닝 등 고난도 태스크에서 내부 추론 토큰을 명시적으로 활용해 응답 품질을 높이며, 한국 개발자들은 별도 플래그 없이 기존 API 호출만으로 해당 기능을 즉시 사용할 수 있다.

4분anthropicllm

OpenAI, ChatGPT 내 Codex 클라우드 에이전트 정식 출시—코드베이스 자율 실행

OpenAI가 ChatGPT Plus·Pro·Team 구독자를 대상으로 Codex 클라우드 에이전트를 정식 공개했다. 사용자가 자연어로 태스크를 지정하면 에이전트가 샌드박스 환경에서 코드 작성·테스트·수정을 자율적으로 수행하며, 완료 후 PR(Pull Request) 초안을 GitHub에 직접 올린다.

4분openaiagent

Meta, Llama 4 Maverick 함수 호출 API 정식 GA—멀티턴 툴 체이닝 지원

Meta가 Llama 4 Maverick 모델에 대한 함수 호출(Function Calling) 기능을 정식 GA로 전환하며, 멀티턴 대화 내에서 복수의 툴을 순차·병렬로 체이닝하는 구조를 공식 지원한다. 기존 단일 호출 방식 대비 에이전트 파이프라인 구성이 대폭 단순화되어, 한국 개발자가 자체 호스팅 환경에서 오픈소스 기반 에이전트를 구축하는 데 실질적인 진입 장벽이 낮아질 전망이다.

4분metallama
2026-05-22·3
2026-05-21·1
2026-05-20·3
2026-05-19·3
2026-05-18·3
2026-05-17·3

Anthropic, Claude Code SDK 정식 공개—IDE 외부 에이전트 직접 구축 가능

Anthropic이 Claude Code의 핵심 기능을 외부 애플리케이션에서 직접 호출할 수 있는 Claude Code SDK를 정식 공개했다. 이로써 개발자는 VS Code나 JetBrains 없이도 자체 도구·CI 파이프라인에 코드 이해·수정·실행 에이전트를 직접 임베드할 수 있다. 특히 멀티스텝 코드 태스크를 하나의 세션으로 유지하는 컨텍스트 관리 API가 포함되어 복잡한 리팩터링 자동화에 유용하다.

4분anthropicsdk

Meta, Llama 4 공식 GGUF 양자화 가이드 공개—로컬 4비트 추론 벤치마크 포함

Meta가 Llama 4 시리즈의 공식 GGUF 변환·양자화 가이드를 Hugging Face와 공동으로 공개했다. Q4_K_M 양자화 기준 Scout 17B 모델이 RTX 4090 단일 GPU(24 GB VRAM)에서 초당 42토큰 이상의 추론 속도를 달성하는 수치가 공식 문서에 포함됐다. 로컬 LLM 환경을 구축하려는 한국 개발자·크리에이터에게 비용 절감과 데이터 프라이버시 측면에서 실질적 대안이 될 전망이다.

5분metaopen-source

Google DeepMind, AlphaFold 3 API 일반 공개—단백질·리간드 구조 예측 상용화

Google DeepMind가 AlphaFold 3의 REST API를 일반 개발자에게 정식 공개하며, 단백질·DNA·RNA·소분자 리간드 복합체의 3D 구조 예측을 프로그래밍 방식으로 활용할 수 있게 됐다. 기존 웹 인터페이스 전용이었던 서비스가 API로 전환되면서 바이오인포매틱스 파이프라인, 신약 개발 자동화 워크플로우에 직접 통합이 가능해졌다.

4분google-deepmindapi
2026-05-16·3

GitHub Copilot Workspace, 에이전트 모드 정식 GA—이슈→PR 전 과정 자동화

GitHub이 Copilot Workspace의 에이전트 모드를 정식 출시하며, 이슈 분석부터 코드 작성·테스트 실행·PR 생성까지 단일 워크플로로 처리할 수 있게 됐다. 기존 코파일럿 대비 컨텍스트 윈도우가 대폭 확장되어 대규모 모노레포 환경에서도 안정적으로 동작하는 점이 핵심 개선 사항이다. 한국 개발자도 GitHub Teams 플랜 이상에서 즉시 활성화할 수 있어 반복적인 이슈 트리아지 업무를 크게 줄일 수 있다.

4분githubcopilot

Anthropic, Claude Opus 4 Message Batches API 정식 출시—대량 추론 비용 50% 절감

Anthropic이 Claude Opus 4 모델을 대상으로 Message Batches API를 정식 GA로 전환하며, 비동기 대량 요청 처리 시 표준 API 대비 최대 50% 저렴한 요금을 적용한다. 콘텐츠 파이프라인·데이터 라벨링·대규모 문서 분석 등 배치성 작업에 Opus 4의 고성능을 비용 효율적으로 활용할 수 있게 된 것이 핵심이다. 기존 Haiku 4.5·Sonnet 4.6에 한정됐던 Batches API 지원이 Opus 4까지 확대되어 한국 AI 스타트업의 고도화 파이프라인 구축에 실질적인 선택지가 생겼다.

5분anthropicclaude

OpenAI, 강화학습 기반 파인튜닝 API 일반 공개—도메인 특화 추론 성능 강화

OpenAI가 강화학습(RL) 기반 파인튜닝 기능을 API를 통해 일반 개발자에게 전면 공개했다. 기존 지도학습 파인튜닝 대비 복잡한 추론·코딩·수학 태스크에서 평균 28% 성능 향상이 보고되었으며, 한국어 도메인 특화 모델 구축에도 직접 적용할 수 있다.

4분openaifine-tuning
2026-05-15·3
2026-05-14·3
2026-05-13·3
2026-05-12·3
2026-05-11·3
2026-05-10·3
2026-05-09·3
2026-05-08·3
2026-05-07·4

Google Gemini API v2 출시, 멀티모달 스트리밍 및 무료 티어 확대

Google DeepMind가 Gemini API v2를 공개하며 실시간 오디오·영상 스트리밍 입력과 함수 호출 안정성을 대폭 개선했습니다. 무료 티어 한도가 기존 대비 두 배로 늘어나 한국 개발자·크리에이터의 프로토타이핑 비용 부담이 줄어듭니다.

3분geminimultimodal

OpenAI Codex CLI, 정식 GA—터미널에서 코드 자율 실행

OpenAI가 경량 오픈소스 코딩 에이전트 Codex CLI를 정식 일반 공개(GA)했다. 로컬 파일시스템 읽기·쓰기, 셸 명령 실행, 멀티파일 리팩터링을 터미널 단에서 자율 처리하며, 한국 개발자도 npm 한 줄로 즉시 설치·사용 가능하다.

4분openaicli

Cursor 0.50, 백그라운드 에이전트 모드 정식 GA 전환

Cursor가 0.50 버전에서 '백그라운드 에이전트(Background Agent)' 기능을 정식 출시하며, IDE를 닫아도 에이전트가 저장소 전체를 탐색·수정할 수 있게 됐다. 기존 Composer 기반 단일 파일 편집 대비 멀티파일 병렬 처리 속도가 최대 3배 향상됐으며, 한국 개발자가 많이 사용하는 GitHub Actions 연동도 기본 지원된다.

4분cursordeveloper-tools

Meta, Llama 4 Maverick API 외부 공개—상업용 무료 허용

Meta가 Llama 4 Maverick 모델의 REST API를 외부 개발자에게 정식 개방하며 상업적 사용을 무료로 허용했다. 1M 활성 사용자 초과 시 별도 라이선스가 필요하지만, 스타트업·인디 크리에이터 수준에서는 사실상 무제한 활용이 가능해 국내 AI 서비스 개발 비용 절감에 직접적인 영향을 준다.

5분metallama
2026-05-06·2
2026-05-05·2
2026-05-04·2
2026-05-02·3
2026-05-01·3
2026-04-30·3
2026-04-29·3
2026-04-28·2
2026-04-27·2
2026-04-26·2
2026-04-25·2
2026-04-18·3
2026-04-17·1
2026-04-16·1
2026-04-15·1
2026-04-14·1
2026-04-13·1
2026-04-12·1
2026-04-11·1