구글의 업그레이드가 추론 장벽을 깨다 — 딥 씽크 84.6% 기록, 오픈 문제 자율 해결 에이전트 공개
구글 딥 씽크가 수학·코딩·과학 벤치마크에서 기존 최고 모델을 압도했습니다. ARC-AGI-2 84.6%, 오픈 문제 자율 해결 에이전트 Aletheia도 함께 공개됐습니다.
구글 딥 씽크가 수학·코딩·과학 벤치마크에서 기존 최고 모델을 압도했습니다. ARC-AGI-2 84.6%, 오픈 문제 자율 해결 에이전트 Aletheia도 함께 공개됐습니다.