카페검색 본문
테이블글 본문
정확도순
-
한번에 이해하는 구글 최강 모델 Gemini 3: 하반기 최대의 빅뉴스, “구글 제국의 귀환” 2025.11.19
Bench Verified(실제 코드 수정 능력) Claude: 77.2% Gemini 3: 76.2% (근소한 차이로 2위) 그러나 다른 벤치마크들은 압도적이다. LiveCodeBench Gemini 3는 2위(Grok 4.1) 대비 200점 이상 차이 Agent Tool 사용 능력 – 12-bench Gemini 2.5 Pro: 54.9%...