TL;DRMagistral Small(24B)은 Mistral이 소개한 강화학습 중심 LLM으로, 상용 모델과 견줄 만한 수학·코드 추론 능력을 보여주면서도 완전 오픈소스로 공개된 점이 핵심입니다. 자체 RL 스택으로 훈련되어 reasoning, multilingual, multimodal 처리 성능이 향상되었으며 Apache 2.0 라이선스 덕분에 재사용 자유도가 높습니다.본문Magistral 모델 개요Mistral의 Magistral 프로젝트는 "pure RL from scratch" 접근법으로, SFT(지도학습) 없이 강화학습(Reinforcement Learning, RL)만으로 모델을 훈련하는 새로운 파이프라인입니다.Magistral Medium은 상위 모델로, 이러한 RL 기반 학습을 통해 A..