카페검색 본문
테이블글 본문
정확도순
-
한번에 이해하는 구글 최강 모델 Gemini 3: 하반기 최대의 빅뉴스, “구글 제국의 귀환” 2025.11.19
다른 벤치마크들은 압도적이다. LiveCodeBench Gemini 3는 2위(Grok 4.1) 대비 200점 이상 차이 Agent Tool 사용 능력 – 12-bench Gemini 2.5 Pro: 54.9% Gemini 3 Pro: 85.4% Terminal-Bench 2.0 Gemini 3: 54.2% (2위 대비 11%p 차이) 이 압도적인 차이...
-
(챗지피티) 벤치마크 2025.05.03
**벤치마크(Benchmark)**는 비교 및 평가의 기준을 뜻하며, 다양한 분야에서 성능, 품질, 효율성을 측정하고 평가하기 위한 표준 또는 기준을 제공하는 데 사용됩니다. 이 용어는 기준점이라는 뜻에서 유래했으며, 비즈니스, IT, 금융, 학문 등 여러 영역...