결론부터 말씀 드리겠습니다.
• 구글 제미나이 3 딥 씽크가 수학·코딩·과학 벤치마크에서 기존 최고 모델을 압도했습니다. ARC-AGI-2에서 84.6%를 기록했습니다
• 오픈 수학 문제를 자율적으로 해결하는 연구 에이전트 Aletheia도 함께 공개됐습니다
• 구글 AI Ultra 구독자와 연구자 API로 제공 중이며, 과학 연구의 프론티어가 빠르게 확장되고 있습니다
여러분들은 2026년 AI 경쟁에서 누가 가장 앞서 있다고 생각하시나요?
오픈AI와 앤스로픽이 모든 헤드라인을 장악하는 것처럼 보입니다.
그런데 구급 방금 모든 사람에게 왜 여전히 AI 경쟁에서 가장 강력한 세력인지 상기시켜줬습니다.
수학, 코딩, 과학 벤치마크를 초토화한 딥 씽크 업그레이드와, 오픈 문제를 자율적으로 해결하는 새로운 연구 에이전트를 내놓았습니다.
하나씩 정리해 드리겠습니다.
1. 딥 씽크가 추론 벤치마크를 초토화하다
구글이 제미나이 3 딥 씽크 추론 모드를 대폭 업그레이드했습니다.
결과는 압도적입니다.
• ARC-AGI-2: 84.6% — 오퍼스 4.6(68.8%)과 GPT-5.2(52.9%)를 완전히 압도했습니다
• Humanity’s Last Exam: 48.4% — 새로운 최고 기록입니다
• 2025 물리·화학 올림피아드: 금메달 수준 — 세계 최고 수준의 과학 추론 능력을 입증했습니다
• 코드포스: 3,455 Elo — 오퍼스 4.6보다 거의 1,000점 높습니다
이건 단순한 벤치마크 향상이 아닙니다. 추론의 한계를 넘어선 것입니다.
2. Aletheia — 오픈 문제를 자율적으로 해결하는 수학 에이전트
구글은 딥 씽크와 함께 Aletheia라는 새로운 에이전트도 공개했습니다.
이건 단순한 챗봇이 아닙니다. 자율적으로 오픈 수학 문제를 해결하고, 증명을 검증하며, 도메인 벤치마크에서 새로운 최고 기록을 세우는 연구 에이전트입니다.
과학자들이 수년간 풀지 못한 문제를 AI가 자율적으로 탐구하고 해결하는 시대가 온 겁니다.
구글 딥마인드는 이를 “수학과 과학 발견을 가속화하는 것”이라고 설명했습니다.
3. 제공 방식 — AI Ultra 구독자와 연구자 API
딥 씽크 업그레이드는 현재 구글 AI Ultra 구독자에게 제미나이 앱에서 제공되고 있습니다.
API 액세스는 연구자 얼리 액세스 프로그램을 통해 제한적으로 공개됩니다.
이건 구글이 단순히 소비자 서비스가 아니라 과학 연구를 위한 프론티어 AI를 추진하고 있다는 의미입니다.
4. 왜 이게 중요한가
구글이 2025년 말 벤치마크와 헤드라인을 장악한 후, 2026년에는 오픈AI와 앤스로픽이 더 많은 주목을 받았습니다.
하지만 이번 업그레이드는 잊지 말아야 할 사실을 상기시켜줍니다.
구글은 여전히 AI 경쟁에서 가장 강력한 세력입니다.
딥 씽크의 점수는 놀랍습니다. 수학과 과학의 프론티어가 빠르게 미탐구 영역으로 이동하고 있습니다.
AI가 인간의 지식 한계를 넘어서는 순간이 점점 가까워지고 있습니다.
정리하면
-
구글 제미나이 3 딥 씽크가 수학·코딩·과학 벤치마크에서 기존 최고 모델을 압도했습니다
-
ARC-AGI-2 84.6%, Humanity’s Last Exam 48.4%, 코드포스 3,455 Elo를 기록했습니다
-
오픈 수학 문제를 자율적으로 해결하는 연구 에이전트 Aletheia도 함께 공개됐습니다
-
구글 AI Ultra 구독자와 연구자 API로 제공 중입니다
-
과학 연구의 프론티어가 빠르게 확장되고 있으며, 구글이 여전히 AI 경쟁의 최강자임을 보여줍니다
구글이 잠시 주목받지 못했을 때, 오픈AI와 앤스로픽이 헤드라인을 장악했습니다.
하지만 이번 업그레이드는 추론의 한계를 넘어선 돌파구입니다.
AI가 과학 발견을 가속화하는 시대가 빠르게 다가오고 있습니다.
자주 묻는 질문 (FAQ)
Q. 딥 씽크가 GPT-5.2보다 얼마나 뛰어난가요?
ARC-AGI-2에서 GPT-5.2는 52.9%, 오퍼스 4.6은 68.8%였는데 딥 씽크는 84.6%를 기록했습니다. 거의 2배에 가까운 격차입니다.
Q. Aletheia는 어떤 문제를 풀 수 있나요?
아직 해결되지 않은 오픈 수학 문제를 자율적으로 탐구하고, 증명을 검증하며, 새로운 발견을 합니다. 과학자들의 연구 보조자 역할을 할 수 있습니다.
Q. 일반 사용자도 딥 씽크를 쓸 수 있나요?
현재는 구글 AI Ultra 구독자와 연구자 얼리 액세스 프로그램 참가자만 사용 가능합니다. 향후 더 넓게 공개될 것으로 예상됩니다.
감자나라ai 유튜브 채널에서 최신 AI 모델 비교와 실전 활용법을 더 자세히 다룹니다.
구독해주시면 감사하겠습니다.
감사합니다. 다음 시간에 뵙겠습니다.
—
작성: 감자나라ai (오종현)
발행: potato-ai.xyz
