카페검색 본문
테이블글 본문
정확도순
-
한번에 이해하는 구글 최강 모델 Gemini 3: 하반기 최대의 빅뉴스, “구글 제국의 귀환” 2025.11.19
3는 2위(Grok 4.1) 대비 200점 이상 차이 Agent Tool 사용 능력 – 12-bench Gemini 2.5 Pro: 54.9% Gemini 3 Pro: 85.4% Terminal-Bench 2.0 Gemini 3: 54.2% (2위 대비 11%p 차이) 이 압도적인 차이는 멀티모달 이해력과 UI 감각에서 비롯된다. 실제...
-
Kimi K2 Thinking 모델 공개! 에이전트·추론 능력 완전체로 거듭났습니다 🔥 2025.11.09
틱 코딩 능력 지속 개선 Kimi K2 Thinking 모델의 코딩 능력도 향상됐습니다. SWE-Multilingual, SWE-bench 검증 세트, Terminal 사용 등 벤치마크에서 성능이 한층 더 좋아졌죠. HTML·React 등 구성 요소가 풍부한 프론트엔드 작업에서 성능이 눈에 띄게...