카페검색 본문
테이블글 본문
정확도순
-
한번에 이해하는 구글 최강 모델 Gemini 3: 하반기 최대의 빅뉴스, “구글 제국의 귀환” 2025.11.19
점수 차이는 고작 몇 % 안 되는 수준이었다. 하지만 Gemini 3는 이 치열한 접전을 완전히 단절적 격차로 바꿔버렸다. Humanity's Last Exam(HLE) Gemini 2.5 Pro: 21.6% Claude Sonnet 4.5: 13.7% Gemini 3 Pro: 37.5% (도구 미사용), 45.8% (도구 사용...
-
Kimi K2 Thinking 모델 공개! 에이전트·추론 능력 완전체로 거듭났습니다 🔥 2025.11.09
라는 철학을 바탕으로 탄생한 차세대 Thinking Agent입니다. 생각하면서 동시에 도구를 사용하는 능력을 타고났죠. Humanity's Last Exam(인류 최종 시험), BrowseComp(자율 검색 능력 평가), SEAL-0(복합 정보 수집 추론) 등 여러 벤치마크에서 SOTA...
-
마스크 Grok 4 다차원 도약: 추론 × 다중 지능체 × 음성, 300 달러로 AI 수익성 한계 탐색? 2025.07.28
단순히 대화만 가능한 것이 아닙니다. 이미 다음과 같은 기능을 갖추고 있습니다: 박사 학위 시험에서 만점을 획득했으며, Humanity’s Last Exam에서 25.4%의 정답률을 기록해 Gemini와 GPT를 앞섰습니다; 'AI 학습 그룹'을 구성해 다중 지능체 협업을...