엔비디아, 글로벌 AI 컴퓨팅 수요 대응 위해 AI 클라우드 생태계 확장한다

2026-06-02 김미혜 기자, elecnews@elec4.co.kr

아프리카·남미 포함 6개 대륙으로 영토 넓히며 에이전틱 AI 워크로드 수요 충족...글로벌 파트너사 협업 기반 훈련·추론 인프라 증설

엔비디아가 아시아 최대 ICT 전시회 컴퓨텍스(COMPUTEX) 2026을 맞이해 개최한 엔비디아 GTC 타이베이(NVIDIA GTC Taipei)에서 엔비디아 AI 클라우드(AI Cloud) 생태계를 통해 글로벌 AI 팩토리 인프라 확장을 가속화하고 있다고 밝혔다. 엔비디아 파트너사들은 에이전틱 AI 애플리케이션을 확장하려는 기업, 스타트업, 국가, AI 연구소, 개발자들의 수요 급증에 대응해 인프라 용량을 대폭 확대하는 추세를 보이고 있다.

업체 측에 따르면, 엔비디아 AI 클라우드는 오늘날 가장 인기 있는 AI 애플리케이션 이면의 폭발적인 토큰 수요를 충족하기 위해 설계된 전용 클라우드 생태계다. 이러한 AI 클라우드는 새로운 벤더와 지역 내 인프라 용량을 찾는 기업, 스타트업, 국가의 급증하는 AI 수요에 대응하기 위해 엔비디아 풀스택 AI 인프라와 함께 공동 설계됐다.

이 클라우드 플랫폼은 엔비디아 가속 컴퓨팅, 네트워킹, AI 소프트웨어를 결합해 파트너사들이 모델 훈련, 파인튜닝, 추론, 에이전틱 AI, 피지컬 AI, 소버린 AI 배포를 지원하도록 이끈다. 구체적인 구성은 파트너사와 워크로드별로 다르다는 설명이다.

AI 클라우드 파트너사들이 엔비디아를 선택하는 이유는 최첨단 프론티어 모델과 오픈소스 AI를 구동할 때 토큰 비용 최소화, 와트당 최고 처리량 등 최적의 경제성을 제공하기 때문이다고 업체 측은 전했다. 엔비디아 가속 컴퓨팅, 네트워킹, AI 소프트웨어로 구축된 이 클라우드 플랫폼은 데이터, 개발자, 사용자, 산업 현장에 AI 인프라를 더 가깝게 제공한다. 이로써 고객이 에이전틱 AI 애플리케이션을 대규모로 훈련, 튜닝, 운영할 수 있도록 지원한다는 것이다. 이 생태계는 전 세계 거의 모든 지역에 걸쳐 확장돼 선구적인 모델 개발자, 기업, 스타트업, 소프트웨어 공급업체, 국가 차원의 AI 프로그램을 위한 지역별, 국가별 AI 역량을 지원한다.

엔비디아 창립자 겸 CEO 젠슨 황(Jensen Huang)은 “모든 기업과 국가는 데이터를 인텔리전스로 전환하기 위해 AI 팩토리 인프라를 필요로 한다”며, “엔비디아 AI 클라우드는 모델 훈련부터 실시간 추론, 인류의 업무 방식을 혁신할 AI 에이전트에 이르기까지 차세대 AI를 구축하는 지역, 산업, 개발자와 풀스택 AI 팩토리를 더욱 가깝게 연결한다”고 말했다.

광범위한 AI 클라우드 생태계

현재 AI 클라우드 제공업체, 통신사, 소버린 AI 구축 기업, 수직 통합형 인프라 제공업체들은 엔비디아와 협력해 AI 팩토리를 구축하고 있다. 이는 최첨단 AI, 엔터프라이즈 AI, 통신, 개발자 클라우드, 국가 AI 프로그램 분야의 고객들에게 서비스를 제공하기 위함이라고 업체 측은 밝혔다.

동남아시아, 호주, 미주 전역에서 지역적 성장이 가속화되는 가운데, 아프리카의 카사바와 남미의 클라로(Claro)가 합류하면서 엔비디아 AI 클라우드는 이제 6개 대륙으로 영토를 넓혔다.

엔비디아 AI 클라우드는 대규모 AI 인프라 구축을 선도적인 AI 연구소, 기업, 정부, 디지털 서비스 제공업체의 수요와 연계하고 있다. 코어위브(CoreWeave), 퍼머스(Firmus), 아이렌(IREN), 엔스케일(Nscale) 등 파트너사들은 프론티어 모델 개발, 기업용 AI, 에이전틱 애플리케이션, 대규모 추론을 지원하고자 AI 인프라를 확장하고 있다.

각 지역별로 엔비디아 AI 클라우드는 AI 팩토리를 현지 산업과 소버린 AI 생태계에 밀착시키고 있다. 파트너사인 파이어버드(Firebird), GMI 클라우드(GMI Cloud), 인도삿 오레두 허치슨(Indosat Ooredoo Hutchison), 람다(Lambda), 네이버 클라우드(Naver Cloud), 샤론 AI(Sharon AI), 요타(Yotta), YTL 등은 신생 AI 기업, 국가 AI 이니셔티브, 금융 서비스, 통신, 제조, 교육, 헬스케어, 개발자 생태계를 다각도로 지원한다.

정부와 규제 산업의 경우, 지역 AI 클라우드를 통해 소버린 통제권과 현지 컴플라이언스 요구사항을 충족할 수 있다. 또한 개발자와 기업은 사용자와 데이터 근처에서 작동해야 하는 AI 에이전트, 기업용 코파일럿, 디지털 워커 등 AI 서비스를 위한 가속 인프라에 접근하는 데 따르는 번거로움을 줄일 수 있다는 설명이다.

퍼머스, 호주와 아시아 태평양 전역으로 AI 팩토리 입지 확장

퍼머스 테크놀로지(Firmus Technologies)는 남호주와 동남아시아 전역으로 AI 팩토리 입지를 확장하고 있다. 이들은 대규모 훈련, 추론, 에이전틱 AI 워크로드 수요 증가를 지원하는 에너지 효율적 인프라를 구축하고 있다.

퍼머스는 '프로젝트 사우스게이트(Project Southgate)'를 통해 타스매니아, 멜버른, 남호주, 뉴사우스웨일스에 AI 팩토리를 개발 중이다. 재생 에너지, 첨단 냉각 기술, 인프라 용량을 빠르게 가동할 수 있는 모듈형 인프라에 중점을 두고 있다. 또한 ST 텔레미디어 글로벌 데이터센터(ST Telemedia Global Data Centres)와 협력을 통해 싱가포르에도 AI 인프라를 배포했다.

퍼머스는 인프라 구축 과정에서 엔비디아 가속 컴퓨팅과 레퍼런스 아키텍처를 활용하고 있으며, 엔비디아 DSX는 AI 팩토리 설계, 배포, 운영의 효율화를 지원한다.

엔비디아 DSX 플랫폼과 정렬되도록 설계된 액체 냉각 방식의 '퍼머스 하이퍼큐브(HyperCube)'는 모듈형 AI 팩토리 구축을 가속화하고 토큰 비용을 최소화하도록 설계됐다. 퍼머스는 냉각과 에너지를 포함한 AI 팩토리 공급망 전반에서 혁신을 지속하고 있다.

퍼머스 공동 CEO 팀 로젠필드(Tim Rosenfield)는 “AI 에이전트는 토큰에 대한 새로운 산업 규모의 수요를 창출하고 있으며, 아시아 태평양 지역에는 더 빠르게 구축되고 더 효율적으로 액체 냉각되며 기가와트 규모로 운영 가능한 AI 팩토리를 필요로 한다”며, “퍼머스는 엔비디아와 함께 아시아 태평양 지역의 가장 중요한 고객들을 위해 AI 토큰을 최대한 효율적이고 신속하게 인도하도록 설계된 액체 냉각식 AI 인프라를 구축하고 있다”고 밝혔다.

코어위브, 피지컬 AI와 차세대 AI 팩토리 가속화

코어위브는 차세대 에이전틱 AI, 피지컬 AI, 프론티어 모델 워크로드를 지원하기 위해 엔비디아 AI 클라우드 플랫폼을 확장하고 있다.

엔비디아 베라 루빈(Vera Rubin)과 엔비디아 베라 CPU를 초기 도입한 코어위브는 엔비디아 스펙트럼-X 이더넷 포토닉스(Spectrum-X Ethernet Photonics)를 가장 먼저 도입한 기업 중 하나이기도 하다. 이를 통해 100만 개 GPU 규모의 AI 팩토리를 위한 네트워킹 기반을 제공한다. 또한, 최신 프론티어 월드 피운데이션 모델인 엔비디아 코스모스 3(Cosmos 3) 도입을 포함해 로보틱스와 피지컬 AI 워크플로우용 플랫폼을 확장하고 있다. 이를 통해 코어위브는 개발 팀이 합성 데이터를 생성하고 모델을 파인튜닝하며 로봇 데이터 플라이휠을 가속화하도록 지원하고자, 앤트로픽(Anthropic)을 포함한 선도적인 AI 연구소들이 대규모 프론티어 모델을 구동하기 위해 코어위브 인프라를 활용 중이다.

코어위브 공동창립자 겸 회장 겸 CEO 마이클 인트레이터(Michael Intrator) “AI 팩토리는 에이전틱 시대의 근간이 되고 있다. 코어위브는 엔비디아와 협력해 AI 연구소, 기업, 개발자가 프론티어 모델, AI 에이전트, 피지컬 AI 시스템을 실제 프로덕션 애플리케이션으로 전환하는 데 필요한 성능, 규모, 신뢰성을 제공하는 풀스택 클라우드 인프라를 구축하고 있다”고 말했다.

네비우스, 에이전틱 워크플로우용 오픈 피지컬 AI 워크벤치 구축

네비우스(Nebius)는 모델 훈련, 추론, 피지컬 AI 개발을 위한 풀스택 플랫폼을 통해 엔비디아 AI 클라우드를 확장하고 있다.

엔비디아 베라 루빈을 조기 도입한 네비우스는 자체 네비우스 AI 클라우드, 토큰 팩토리(Token Factory) 추론 레이어, 새로운 피지컬 AI 워크벤치(Physical AI Workbench)를 포함해 실리콘부터 소프트웨어까지 통합된 AI 인프라를 구축 중이다. 이 워크벤치는 엔비디아 코스모스 3, 엔비디아 아이작 심(Isaac Sim), 아이작 GR00T 등의 기술을 AI 에이전트가 조합할 수 있는 구성 가능한 워크플로우로 연결한다. 이를 통해 로보틱스와 자율 시스템 개발 팀이 시뮬레이션과 합성 데이터 단계에서 훈련과 평가 단계로 더 빠르게 넘어갈 수 있도록 돕는다고 업체 측은 전했다.

네비우스 창립자 겸 CEO 아르카디 볼로즈(Arkady Volozh)는 “개발자가 인프라를 연결하는 데 몇 주씩 허비하지 않고 곧바로 AI 시스템을 구축할 수 있어야 한다”며, “네비우스는 엔비디아와 함께 로보틱스, 생명 과학부터 일반 기업에 이르기까지 AI 워크로드를 실험에서 프로덕션 단계로 가속화하는 데 필요한 도구, 데이터, 컴퓨팅을 AI 에이전트가 스스로 구성할 수 있는 AI 클라우드를 만들고 있다”고 말했다.

엔비디아 엑셈플러 클라우드 모멘텀

엔비디아가 2025년 엑셈플러 클라우드(Exemplar Cloud)를 도입한 이래 코어위브, 크루소(Crusoe), 람다, 네비우스, 벌처(Vultr), YTL 등 6개 엔비디아 클라우드 파트너(NVIDIA Cloud Partner, NCP)가 엑셈플러 클라우드 자격을 획득했다. 이처럼 확장되는 파트너 명단은 실제 프로덕션 AI 워크로드에 대해 일관된 성능, 신뢰성, 효율성을 제공할 수 있는 AI 클라우드 인프라 수요가 증가하고 있음을 보여준다.

이들 제공업체는 AI 클라우드 생태계 전반의 성능 기준을 높이는 데 기여하며 기업, 개발자, AI 연구소에 훈련, 추론, 에이전틱 AI 서비스를 대규모로 확장할 수 있는 검증된 선택지를 한층 폭넓게 제공하고 있다는 설명이다.

AI 팩토리 경제성을 위한 설계

AI 중심축이 모델 개발에서 추론과 대규모 추론으로 이동함에 따라 인프라 평가 기준은 단순히 발표된 용량에 그치지 않는다. 플랫폼 활용도, 가동 시간, 긴 자산 수명, 그리고 사람들이 실제 업무에 투입할 수 있는 유용한 AI 에이전트 범위와 깊이에 따라 결정되는 토큰 출력 경제성이 중요해지고 있다.

엔비디아 풀스택 AI 팩토리 플랫폼을 기반으로 구축된 AI 클라우드는 파트너사들이 이러한 기준에 맞춰 인프라를 최적화하도록 지원한다고 업체 측은 전했다.

토큰당 비용은 하드웨어 성능, 소프트웨어 최적화, 생태계 지원, 실제 활용도를 직접 반영하는 총소유비용(TCO) 지표다. 엔비디아는 컴퓨팅, 네트워킹, 메모리, 스토리지 전반의 풀스택 공동 설계와 소프트웨어 최적화, 강력한 토큰 처리량을 바탕으로 업계 최저 수준의 토큰당 비용을 실현한다는 것이다.

DSX, AI 클라우드 인프라 용량 가동 속도 향상 지원

엔비디아 AI 클라우드는 AI 팩토리 설계, 구축, 운영을 위해 엔비디아 DSX 플랫폼을 도입하고 있다.

DSX는 검증된 레퍼런스 디자인, 시뮬레이션, 소프트웨어, 생태계 기술을 결합해 클라우드 제공업체가 인프라 용량을 더 빠르게 가동하고 효율적으로 운영하며 수익을 극대화하도록 이끈다는 설명이다.

업체 측에 따르면, DSX 심은 배포 전 AI 팩토리를 모델링하고 검증하도록 지원한다. DSX 플렉스(Flex)는 전력망 조건에 맞춰 AI 팩토리가 워크로드를 동적으로 조정하도록 지원한다. DSX 맥스LPS(DSX MaxLPS)는 전력이 제한된 AI 팩토리가 고정된 전력 예산 내에서 컴퓨팅을 극대화해 GPU를 최대 40% 더 많이 가동하도록 한다. DSX OS는 대규모 라이프사이클 관리와 운영 자동화를 지원한다.

결과적으로 DSX는 AI 클라우드가 배포 리스크를 줄이고 복원력을 높이며, 와트당 더 많은 토큰을 인도하는 동시에 최저 토큰 비용을 달성하도록 돕는다고 업체 측은 밝혔다.

100자평 쓰기