큐브 뉴스 Blog AI 경이로운 수학 AI 모델 Light-R1-32B, 저비용으로 DeepSeek 능가
AI

경이로운 수학 AI 모델 Light-R1-32B, 저비용으로 DeepSeek 능가

혁신적인 AI 모델의 탄생

수학 문제 해결에 최적화된 오픈 소스 AI
모델 Light-R1-32B가 등장했어요.
이 모델은 고급 수학 문제를 해결
하는 데 특화되어 있습니다. 😮

저렴한 비용으로 뛰어난 성능

이 모델은 32억 개의 파라미터를
가지고 있으며, DeepSeek과 같은
대형 모델보다 성능이 뛰어나다고 해요.
놀랍게도, 12개의 Nvidia H800 GPU로
6시간 만에 훈련을 완료했으며,
총 비용은 1,000달러에 불과했답니다. 💰

허깅페이스에 공개

Light-R1-32B는 Apache 2.0 라이선스로
허깅페이스에 공개되어 있어, 기업이나
연구자들이 자유롭게 사용할 수 있습니다.
상업적 목적으로도 활용할 수
있다는 점이 매력적이죠. 📂

경쟁 모델보다 우수한 성과

이 모델은 American Invitational
Mathematics Examination(AIME)
벤치마크에서 DeepSeek-R1-Distill-Qwen-32B
모델을 능가하는 성과를 보였어요.
AIME24에서 76.6, AIME25에서
64.6의 점수를 기록하며,
기존 모델보다 월등한 성과를
보였다고 합니다. 📊

교육 기반의 훈련 방식

커리큘럼 기반의 감독
훈련(SFT)과 직접 선호
최적화(DPO)를 통해 문제 해결
능력을 개선했다고 해요.
이러한 방식은 수학적 추론을
효과적으로 향상시킨다고 하네요. 🧠

상업적 활용에 용이한 라이선스

Apache 2.0 라이선스를 통해
상업적 제품에 자유롭게
배포할 수 있는 점도
이 모델의 장점입니다.
특히, 특허 분쟁을
억제하는 데 유리한
조건이라고 합니다. 🏢

더 많은 정보는 여기에서 확인하세요.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

Exit mobile version