구글이 챗GPT 추격의 신호탄을 쏜 '제미나이3 프로'보다 추론 성능을 두 배 이상 높인 '제미나이3.1 프로'를 19일(현지 시간) 공개했습니다.
구글은 이 모델이 단순한 답변이 아니라 어려운 과제에 활용할 수 있는 고급 추론 능력을 제공한다고 강조했습니다.
실제로 이 모델은 새로운 논리 패턴을 풀어내는 능력을 평가하는 'ARC-AGI-2' 성능 지표(벤치마크)에서 전작(31.1%)의 갑절 이상인 77.1%의 점수를 얻었습니다.
경쟁작인 오픈AI GPT-5.2(52.9%)나 앤트로픽 클로드 오퍼스4.6(68.8%)보다도 높은 수치입니다.
코딩 능력을 측정하는 'SWE-벤치 베리파이드'에서도 최고 수준으로 평가받는 오퍼스4.6(80.8%)에 버금가는 80.6%를 기록했습니다.
학술 추론 능력을 평가하는 '인류의 마지막 시험'(HLE)에서도 도구 미사용 기준 점수 44.4%를 받아, GPT-5.2(34.5%)와 오퍼스4.6(40%)에 앞섰습니다.
구글은 이 모델이 복잡한 주제를 시각적으로 형상화해 설명하거나 데이터를 통합해 분석하는 등 실용적인 영역에서 쓰일 수 있다고 설명했습니다.
제미나이3.1 프로는 이날부터 사용할 수 있지만, 일반 소비자 대상 서비스는 유료 요금제 이용자에게 우선 제공됩니다.
YTN 김종욱 (jwkim@ytn.co.kr)
[저작권자(c) YTN science 무단전재, 재배포 및 AI 데이터 활용 금지]