이 글은 2026년 1월 27일 기준으로 작성되었습니다.
모델/가격/정책은 바뀌었을 수 있어요. 최신 llm 글로 업데이트를 확인하세요.
문샷 AI, Kimi K2.5 MoE 모델 공개
문샷 AI가 수학과 코딩에 특화된 1.04조 매개변수 규모의 MoE 모델 Kimi K2.5를 공개했습니다.

세 줄 요약
- 문샷 AI가 15조 개의 시각 및 텍스트 데이터를 학습한 1.04조 매개변수 규모의 MoE 모델인 Kimi K2.5를 공개했습니다.
- AIME 2025(96.1%) 및 LiveCodeBench(85.0%) 등 수학과 코딩 관련 지표에서 Llama 3.1 405B 모델을 상회하는 성과를 기록했습니다.
- 전체 매개변수 중 320억 개만 활성화하는 구조를 채택하여 추론 효율성을 높였으며 코딩 에이전트를 함께 제공합니다.
예: 개발자가 작성 중인 프로그램의 구조가 담긴 설계도를 사진으로 찍어 올리면 인공지능이 구성 요소 사이의 논리적 연결을 분석하고 누락된 명령문을 생성하여 제안합니다.
현황: 15조 토큰 기반의 거대 MoE 모델
2026년 1월 27일, 문샷 AI는 자사 모델인 Kimi K2.5를 오픈소스로 배포하며 기술 사양을 상세히 공개했습니다. 이 모델은 Kimi-K2-Base를 기반으로 약 15조 개의 시각 및 텍스트 혼합 토큰을 추가 학습한 네이티브 멀티모달 모델입니다. 총 매개변수는 1.04조 개에 달하지만, 추론 시에는 혼합 전문가(MoE) 구조를 통해 320억 개의 파라미터만 활성화합니다.
벤치마크 결과는 이 모델의 성능이 수학과 코딩 분야에 집중되어 있음을 보여줍니다. Kimi K2.5는 수학적 추론 능력을 측정하는 AIME 2025에서 96.1%의 점수를 얻었습니다. 코딩 역량을 평가하는 LiveCodeBench(v6)에서는 85.0%를 기록했습니다. 소프트웨어 엔지니어링 실무 능력을 가늠하는 SWE-Bench Verified에서는 76.8%를 기록해 오픈소스 코딩 모델 중 상위권의 경쟁력을 나타냈습니다. 이는 기존 오픈소스 모델인 Llama 3.1 405B를 여러 지표에서 넘어서는 수치입니다.
분석: 효율성과 오픈소스 전략의 결합
Kimi K2.5의 특징은 학습 효율성입니다. 문샷 AI는 'MuonClip' 옵티마이저를 도입해 대규모 학습 과정에서 발생하기 쉬운 불안정성을 제어했습니다. 이를 통해 15조 개라는 데이터를 학습하면서도 각 토큰이 모델 성능에 기여하는 효용성을 높였습니다. 텍스트와 이미지를 동시에 처리하는 네이티브 멀티모달 구조는 코딩 에이전트가 단순한 텍스트 편집기를 넘어 UI/UX 설계도까지 이해하며 작업할 수 있도록 지원합니다.
다만 고려해야 할 사항도 있습니다. 문샷 AI는 15조 개의 토큰을 사용했다고 밝혔으나, 이 중 시각 데이터와 텍스트 데이터의 구체적인 비율은 공개하지 않았습니다. 또한 2026년 초에 출시된 Llama 4 등 다른 모델과의 직접적인 비교 수치가 아직 제한적이라는 점도 참고해야 합니다. 연산 자원 통제 상황에서 이러한 거대 모델이 지속적으로 업데이트될 수 있을지에 대한 관점도 존재합니다.
실전 적용
개발자와 연구자들은 엔비디아(NVIDIA) NIM API나 허깅페이스(Hugging Face)를 통해 Kimi K2.5를 워크플로우에 통합할 수 있습니다. 복잡한 수학적 문제 해결이 필요한 금융 공학이나 대규모 코드베이스를 관리해야 하는 기업 환경에서 이 모델의 코딩 에이전트는 유용한 도구가 될 수 있습니다.
오늘 바로 할 일:
- 허깅페이스에서 Kimi K2.5의 모델 카드를 확인하고 개별 환경에서의 구동 가능 여부를 점검하십시오.
- 기존에 해결하지 못했던 SWE-Bench 수준의 복잡한 코드 오류 보고서를 코딩 에이전트에 입력해 성능을 테스트하십시오.
- 엔비디아 NIM API를 활용해 멀티모달 추론 속도가 실제 서비스 요구사항을 충족하는지 검증하십시오.
FAQ
Q: Kimi K2.5의 학습 데이터 구성은 어떻게 되나요? A: 약 15조 개의 시각 및 텍스트 혼합 토큰을 사용했습니다. 다만 시각 데이터와 텍스트 데이터의 구체적인 수치적 비율은 공식적으로 확인되지 않았습니다.
Q: 기존 Llama 모델과 비교했을 때 강점은 무엇인가요? A: 2026년 1월 기준 벤치마크 데이터에 따르면 수학(AIME 2025)과 실전 코딩(SWE-Bench Verified) 분야에서 Llama 3.1 405B를 상회하는 성능을 보여줍니다.
Q: 모델의 크기가 커서 운영 비용이 발생할 것 같습니다. A: 전체 파라미터는 1.04조 개지만 MoE 구조를 통해 추론 시에는 320억 개의 파라미터만 활성화하므로 모델 규모 대비 효율적인 추론이 가능합니다.
결론
문샷 AI의 Kimi K2.5 공개는 고성능 코딩 인공지능의 접근성을 높이는 계기가 되었습니다. 15조 토큰의 학습과 MoE 구조의 효율성을 결합한 이 모델은 해당 기술력이 글로벌 표준에 근접했음을 보여줍니다. 향후 이 모델이 실제 개발 현장에서 일관된 성능을 유지할지, 그리고 데이터 투명성 문제를 어떻게 해결해 나갈지가 중요할 것입니다.
참고 자료
업데이트 받기
주간 요약과 중요한 업데이트만 모아서 보내드려요.
오류를 발견했나요? 정정/오류 제보로 알려주시면 검토 후 업데이트에 반영할게요.