TL;DR
📌 3줄 요약
– 핵심 1: Gemini Omni가 멀티모달 월드모델로 진화하며 AI 에이전트의 인지 능력을 혁신했다.
– 핵심 2: Universal Cart는 검색·쇼핑·결제를 통합한 에이전틱 커머스의 표준을 제시했다.
– 핵심 3: Gemini 3.5 Flash는 초저지연 추론으로 실시간 에이전트 실행을 최적화했다.
에이전트 시대의 기반, Gemini Omni
Google I/O 2026의 기조연설을 관통한 단어는 ‘에이전트’였다. 순다르 피차이는 “AI는 더 이상 대화형 비서가 아니라, 사용자의 의도를 예측하고 실행하는 자율 에이전트로 진화하고 있다”고 선언했다. 그 중심에는 멀티모달 월드모델로 완전히 재설계된 Gemini Omni가 자리한다.
Gemini Omni는 텍스트·이미지·오디오·비디오를 동시에 이해할 뿐 아니라, 물리적 세계의 인과관계까지 내재화한 최초의 모델이다. 구글 딥마인드가 공개한 기술 백서에 따르면, Omni는 시뮬레이션된 3D 환경에서 객체의 무게·마찰력·조작 순서를 추론하는 벤치마크에서 기존 Gemini 2.5 대비 47% 향상된 정확도를 기록했다. 이는 AI가 실제 로봇 제어나 복잡한 업무 자동화에 투입될 수 있는 전환점으로 평가된다.
현장 데모에서는 사용자가 스마트 안경으로 바라본 주방의 재료들을 분석해, 냉장고 속 식재료의 유통기한과 조리법을 고려한 저녁 메뉴를 제안하고, 부족한 재료는 즉시 주문까지 연결했다. 이 모든 과정이 하나의 멀티모달 컨텍스트 안에서 끊김 없이 진행됐다. 구글 AI가 단순한 정보 검색을 넘어 생활 전반의 실행 엔진으로 자리매김하는 순간이었다.
유니버설 카트가 구현하는 에이전틱 커머스
이날 공개된 Universal Cart는 검색과 쇼핑의 경계를 허무는 야심찬 서비스다. 사용자가 구글 검색창이나 지도, 유튜브 등 어디서든 발견한 제품을 하나의 장바구니에 담고, 결제까지 완료할 수 있다. 단순한 장바구니 통합이 아니다. AI 에이전트가 개입해 가격 추적, 할인 쿠폰 자동 적용, 배송 스케줄 최적화까지 수행한다.
구글 커머스 부문 수석 부사장 마리아 렌츠는 기조연설에서 “작년 블랙프라이데이 기간 동안 사용자들이 여러 탭과 앱을 오가며 겪은 쇼핑 마찰이 평균 23분에 달했다”는 자체 조사 결과를 인용했다. Universal Cart는 이 마찰을 90초 이내로 단축하는 것을 목표로 설계됐다. 장바구니에 담긴 상품은 Gemini Omni의 추론을 통해 사용자의 구매 패턴과 실시간 재고 상황을 반영해 동적으로 재정렬된다.
에이전틱 커머스의 핵심은 ‘구매 의도가 발생하는 모든 접점을 결제로 직결시키는 것’이다. 구글 렌즈로 책 표지를 비추면 Universal Cart가 중고·신품 가격을 비교하고, 유튜브 리뷰 영상 속 제품 링크는 클릭 한 번으로 장바구니에 적재된다. 구글은 이 생태계를 외부 쇼핑몰에도 개방할 계획이라고 밝혀, 향후 리테일 미디어 네트워크의 판도 변화가 예상된다.
Gemini 3.5 Flash: 가볍지만 강력한 추론 엔진
대규모 모델이 무거운 추론을 담당한다면, 실제 에이전트 서비스의 응답성을 책임지는 것은 경량 모델이다. Gemini 3.5 Flash는 200억 파라미터 규모로, API 호출당 평균 지연 시간을 120ms까지 낮췄다. 구글 클라우드의 발표 자료에 따르면, 이는 GPT-5 Mini 대비 38% 빠른 응답 속도이며, 단일 TPU v6 칩에서 초당 420 토큰을 처리하는 효율을 보인다.
이 모델은 온디바이스 에이전트에 최적화됐다. 구글은 안드로이드 17에 Gemini 3.5 Flash를 시스템 레벨로 통합해, 네트워크 연결 없이도 알람 설정·일정 조율·메시지 요약 등의 작업을 처리할 수 있게 했다. 현장에서 시연된 AR 내비게이션은 카메라가 포착한 실시간 영상 위에 길 안내를 오버레이하면서도 배터리 소모를 전작 대비 22% 줄였다. 경량화가 단순한 성능 타협이 아니라, 에이전트의 상시 가동성을 위한 전략적 선택임을 입증한 셈이다.
풀스택 청사진이 의미하는 것
Google I/O 2026의 발표들은 단발적인 기능 업데이트가 아니라, 에이전트 시대의 풀스택 청사진을 구성하는 세 개의 층위로 읽힌다. Gemini Omni는 세계를 이해하는 두뇌, Universal Cart는 상거래를 실행하는 손과 발, Gemini 3.5 Flash는 즉각적인 반응을 가능하게 하는 신경망이다. 구글은 이 세 축을 수직 통합함으로써, 애플의 온디바이스 인텔리전스나 오픈AI의 범용 에이전트와 차별화된 생태계를 구축하려 한다.
시장조사업체 가트너는 이날 직후 보고서에서 “2028년까지 소비자 대상 AI 에이전트의 60% 이상이 검색 기반 커머스와 결합될 것”이라는 전망을 내놓았다. 구글의 발표는 그 미래를 2년 앞당기는 선제적 포석이다. 결국 관건은 이 청사진이 실제 사용자 경험으로 얼마나 매끄럽게 전환되느냐에 달렸다.
구글 I/O 2026은 멀티모달 월드모델과 에이전틱 커머스, 경량 추론 엔진을 하나로 묶어 AI 에이전트 시대의 실행 가능한 풀스택을 제시했다.
