AI 인프라 뉴스
AI 클라우드 조달 모델이 바뀌고 있습니다
NVIDIA가 AI Compute at Scale로 AI 클라우드 조달, revenue-sharing, credit-support 모델을 공식화했습니다.
이 글에서 다룰 내용
AI Factory, AI 클라우드 조달 모델, Sharon AI·Firmus 배치 규모, 추론 인프라 관점을 순서대로 봅니다.
GPU를 파는 것에서 AI Factory를 짓는 것으로
NVIDIA가 말하는 NVIDIA AI Compute at Scale은 단순히 더 좋은 칩을 만들겠다는 선언이 아닙니다. AI 모델이 실제 서비스에 쓰이는 전 과정을 하나의 인프라로 묶어서 제공하겠다는 전략입니다.
과거에는 GPU를 사고, 서버를 조립하고, 데이터센터를 짓고, 소프트웨어를 까는 과정을 각각 따로 했습니다. 이제는 NVIDIA가 이 모든 것을 통합된 형태로, 말 그대로 공장처럼 제공합니다.
이걸 NVIDIA는 AI Factory라고 부릅니다. 모델 훈련부터 추론까지, 데이터가 들어가서 지능이 나오는 완전 자동화된 생산 라인입니다.
GB300은 이번 발표에서 실제 배치 규모를 보여주는 핵심 장비로 등장합니다. NVIDIA 발표에 따르면 Sharon AI는 최대 4만 개의 NVIDIA Grace Blackwell GB300 GPU를 배치하고, Firmus는 인도네시아 Batam에 DSX AI factory 캠퍼스를 구축할 계획입니다.
왜 직접 사지 않고 빌리는 시대가 되었나
AI 모델이 커지면서 기업이 GPU를 직접 사고 데이터센터까지 준비하는 방식은 점점 부담이 커지고 있습니다. 전력 확보, 부지 선정, 하드웨어 도입, 운영 인력까지 한 번에 해결해야 하기 때문입니다.
더 큰 문제는 세대 교체 속도입니다. 1년 전에 산 장비가 구식이 되는 일이 반복되니, 자본 부담은 갈수록 커집니다.
그래서 AI 클라우드 방식이 주류가 되고 있습니다. 필요한 만큼 빌리고, 다 쓰면 반납하는 구독 모델이죠.
NVIDIA도 이 흐름을 공식적으로 지원하며, AI 클라우드 사업자가 NVIDIA 인프라를 조달해 고객에게 클라우드 서비스로 제공하는 모델을 제시했습니다. 발표문에는 revenue-sharing과 credit-support 구조가 함께 언급됐습니다.
이게 바로 ‘at Scale’의 진짜 의미입니다. 소수의 거대 기업만 쓸 수 있던 AI 컴퓨팅을, 누구나 규모에 맞게 쓸 수 있게 만드는 것입니다.
새로운 인프라 제공자들: Sharon AI와 Firmus
NVIDIA AI Compute 생태계에는 기존 빅테크만 있는 게 아닙니다. Sharon AI 같은 기업은 중소 규모 데이터센터 운영자가 직접 NVIDIA 인프라를 활용해 AI 서비스를 제공하는 새로운 모델을 보여줍니다.
Firmus 역시 비슷한 맥락에서 주목받습니다. NVIDIA 발표에 따르면 Firmus는 인도네시아 Batam에 DSX AI factory 캠퍼스를 만들고, 최대 360MW와 17만 개 NVIDIA GPU 규모까지 확장하는 계획을 제시했습니다.
이런 기업들이 의미 있는 이유는, AI 인프라가 더 이상 소수 거대 기업의 전유물이 아니라는 걸 보여주기 때문입니다. 규모는 작아도 전문성으로 승부하는 플레이어들이 생태계를 다변화하고 있습니다.
결국 고객 입장에서는 선택지가 늘어납니다. 어느 클라우드에서, 어떤 조건으로, 어느 지역의 인프라를 쓸지 고를 수 있게 됩니다.
결국 중요한 건 추론 인프라
지금까지 AI 인프라 투자의 대부분은 모델을 학습시키는 데 집중되었습니다. 하지만 학습은 한 번이고, 추론은 계속됩니다.
실제 비즈니스에서 돈이 되는 건 모델을 써먹는 추론 단계입니다. 사용자가 질문하고, AI가 답하는 그 순간마다 연산이 일어납니다.
NVIDIA가 GB300으로 추론 성능을 강조하고, Sharon AI나 Firmus 같은 기업이 추론 특화 인프라에 투자하는 이유가 바로 여기에 있습니다. 학습은 한 번의 비용이지만, 추론은 매일 발생하는 운영 비용입니다.
AI 인프라 조달 방식이 바뀌고 있습니다. 직접 사서 쓰던 시대에서, 필요할 때 필요한 만큼 빌려 쓰는 시대로. NVIDIA AI Compute at Scale은 이 변화를 이끄는 엔진입니다.
GPU를 사던 시대에서, AI 인프라를 서비스처럼 조달하는 시대로 무게중심이 옮겨가고 있습니다.
참고 출처
- NVIDIA Blog, “NVIDIA Unlocks AI Compute at Scale, Inviting Partners to Power the AI Infrastructure Buildout”, 2026-07-02. 공식 원문 보기
- Google News RSS에서 NVIDIA Blog 공식 출처명과 최근 발행일을 확인했습니다. Google News RSS에서 확인하기
