Aionda

"deepseek-r1" 태그

1개의 글이 있습니다

전체 태그 보기 전체 글 보기

커뮤니티2026년 1월 31일2026-01-31

DeepSeek-R1: 강화학습과 GRPO로 구현한 추론 효율화

DeepSeek-R1이 입증한 강화학습 기반의 자가 교정 및 추론 능력 향상과 GRPO 알고리즘을 통한 연산 자원 효율화 전략을 살펴봅니다.