카페검색 본문
테이블글 본문
정확도순
-
RL과 메모리 기반 개인 에이전트, Macaron AI 실측 2025.10.28
전부입니다. 비용 최적화 Macaron은 자체 개발한 전동기 강화 학습(All-Sync RL) 아키텍처, LoRA 적용 및 자체 개발 다중 컨볼루션 DAPO 프레임워크의 시너지 효과를 통해 GPU 유휴 시간을 최소화하고 훈련 시간을 단축합니다. 예를 들어, 기존에 9시간이...