카페검색 본문
테이블글 본문
정확도순
-
DeepSeek 마침내 오픈소스 1위 자리를 내주었지만, 후계자 역시 중국 출신이다 2025.07.19
얻은 추론 방안은 동일한 전문가 수에서: 총 파라미터는 1.5배 증가했지만, 통신 부분을 제외하면 이론상의 prefill 및 decode 소요 시간이 더 짧습니다. 통신 중첩 등 복잡한 요소를 고려하더라도 이 방안은 V3보다 비용이 크게 증가하지 않습니다. 즉...