최근 글로벌 AI 경쟁 심화로 인한 GPU 품귀 현상과 높은 인프라 구축 비용이 기업들의 핵심 과제로 떠오르고 있다. 엔비디아 GPU가 데이터센터 시장의 90% 이상을 차지하는 상황에서, 업계에서는 GPU 종속성 탈피와 함께 고성능 국산 AI 반도체(NPU)로의 전환이 가속화되고 있다.

그러나 NPU 업계가 공통적으로 직면한 과제가 있다. 바로 '레퍼런스 확보' 다. 아무리 뛰어난 칩을 만들어도 실서비스 환경에서 검증된 사례가 없으면 고객 도입으로 이어지기 어렵다. 이를 위해서는 NPU 하드웨어뿐만 아니라, 이를 효율적으로 운영하고 실서비스에 빠르게 적용할 수 있는 전문 소프트웨어 플랫폼 이 반드시 필요하다.

AI 인프라 전문 기업 두다지가 퓨리오사AI(FuriosaAI)와 'AI 가속기 생태계 공동 구축 및 기술 협력을 위한 업무협약(MOU)' 을 체결했다. 퓨리오사AI의 하드웨어 및 소프트웨어 기술과 두다지의 MLOps/LLMOps/NPUOps 통합 플랫폼 NuFi(누파이) 를 결합하여, 공공기관과 기업에 혁신적인 AI 서비스를 제공한다는 계획이다.


두다지와 NuFi

두다지는 2017년에 설립된 AI 인프라 전문 기업이다. Docker와 Kubernetes 기반의 프라이빗 클라우드 구축에서 출발해, Vision AI 응용 연구, AI 반도체를 활용한 NVIDIA GPU 대체 소프트웨어 연구 등을 거쳐 현재의 AI 인프라 플랫폼 NuFi를 개발했다.

NuFi(누파이) 는 기업 맞춤형 LLM 도입을 위한 올인원 AI 인프라 플랫폼으로, 데이터 준비부터 모델 학습, 배포, 지속적인 업데이트까지 LLM 라이프사이클 전체를 하나의 플랫폼에서 관리할 수 있다. 주요 특장점은 다음과 같다.

  • 하이브리드 인프라(GPU & NPU) — GPU와 NPU를 동시에 할당받아 RAG 구축, LoRA 파인튜닝 등을 수행할 수 있으며, NPU를 활용한 전성비 극대화와 온도 기반 스마트 스케줄링으로 안정성을 보장한다.
  • 원클릭 자동화 LLMOps — 단 한 번의 클릭으로 모델을 최신 상태로 자동 업데이트하고 배포할 수 있다.
  • 엔터프라이즈급 보안(Air-Gap) — 외부 인터넷망과 완벽하게 분리된 폐쇄망 환경에서도 제약 없이 설치·운영이 가능하다.
  • 전문가 밀착 기술 지원 — RAG 파이프라인 구축부터 최적화된 서빙 환경까지, 전문 AI 엔지니어가 직접 지원한다.
  • 직관적인 모니터링 대시보드 — GPU/NPU 자원 사용량, 실시간 추론 상태, 장비 온도 등을 실시간으로 확인할 수 있다.

보안이 최우선인 금융·공공·국방, 빠른 AI 도입이 필요한 기업, GPU 종속에서 벗어나 전성비와 가성비를 동시에 확보하려는 조직이 주요 타깃이다.


퓨리오사AI

퓨리오사AI는 자체 설계 NPU(신경망 처리 장치)를 개발하는 국내 대표 AI 반도체 팹리스 기업이다. 1세대 NPU '워보이(Warboy)'에 이어 2세대 NPU '레니게이드(RNGD)'를 출시했으며, 엔비디아 GPU 대비 뛰어난 전력 효율과 추론 성능으로 주목받고 있다.

네이버클라우드, KT 등 국내 주요 클라우드 사업자와 협력하고 있으며, LG AI연구원, 오픈AI 등 글로벌 빅테크의 기술 검증도 통과했다. 아시아 스타트업 최초로 MLPerf에 등재되었고, 백준호 대표이사가 국내 최고 권위의 반도체 상인 해동반도체공학상을 수상하기도 했다. 현재도 차세대 NPU와 소프트웨어 스택을 지속적으로 연구·개발하고 있는, 대한민국을 대표하는 AI 반도체 기업이다.


MOU 핵심 내용

1. 'Ecosystem Co-Builder' 공식 선정

두다지가 퓨리오사AI의 '생태계 공동 구축 파트너(Ecosystem Co-Builder)' 로 지정되었다. 단순한 기술 제휴나 리셀러 관계가 아니라, 퓨리오사AI의 NPU 생태계를 함께 설계하고 키워나가는 파트너라는 의미다. 이를 통해 퓨리오사AI의 신제품이 공식 출시되기 전 '얼리 액세스(Early Access)' 권한을 부여받게 된다.

2. 신규 NPU 출시 전 선제적 기술 통합 및 실서비스 검증

얼리 액세스를 통해 제공받은 신기술을 NuFi 플랫폼에 조기 통합한다. 현행 RNGD는 물론 향후 출시될 제품군까지 NuFi 환경에서 선제적으로 통합 및 검증이 이루어진다. 두다지가 통합 과정에서 발견한 피드백은 퓨리오사AI의 개발에 직접 반영되어, 고객은 더 안정적이고 최적화된 환경을 제공받을 수 있다.

3. 국산 NPU 기술을 '사실상 표준(de facto standard)'으로 확산

AI 서비스가 보편화되면서 추론 인프라 수요가 급증하고 있고, 단일 GPU 벤더만으로는 이를 감당하기 어려운 시대가 오고 있다. 정부 역시 K-클라우드 프로젝트 등을 통해 국산 NPU 실증과 데이터센터 적용을 적극 지원하고 있다. 두다지는 이번 MOU를 통해 퓨리오사AI와 함께 국산 NPU 기술 인터페이스를 생태계 사실상 표준으로 확산시킨다는 목표 아래, 공공·B2B 시장에서의 협력을 본격화한다.


NuFi가 만드는 NPU 도입의 새로운 경로

국산 NPU 산업에서 가장 큰 병목은 "좋은 칩은 있는데, 실서비스에 올리기까지가 너무 어렵다"는 점이다. 하드웨어만으로는 고객이 NPU를 도입할 수 없고, SDK 설정부터 모델 최적화, 배포, 모니터링까지 전 과정을 지원하는 플랫폼이 필요하다.

NuFi는 바로 그 역할을 한다.

NuFi는 Kubernetes 환경에서 DeviceFetcher 인터페이스 하나만 구현하면 신규 NPU를 코드 수정 없이 플랫폼에 편입할 수 있도록 설계되어 있다. 실제로 퓨리오사AI의 RNGD를 NuFi에 통합한 결과, RTX 3090 대비 처리량 2.4배, 첫 토큰 응답속도(TTFT) 5.8배, 전력 효율 최대 6.8배 의 성능을 확인했다. GPU 대비 더 적은 전력으로 더 높은 처리량을 낼 수 있어, 전성비와 가성비를 동시에 확보할 수 있는 셈이다.

웹 대시보드에서 클릭 한 번으로 RNGD가 마운트된 Jupyter 환경이 자동 생성되어, 인프라 지식 없이도 바로 모델 실험을 시작할 수 있다. 두다지는 이미 네이버클라우드 환경에서 퓨리오사AI NPU를 활용한 실증을 수행하며 실서비스 레퍼런스를 쌓아왔고, AI 엑스포 도쿄에서 공동 부스를 운영하며 '퓨리오사 이지 컨버터'와 '소형 객체 감지' 모델을 시연한 바 있다.

이번 MOU로 얼리 액세스까지 확보하면서, 앞으로는 다음과 같은 흐름이 가능해진다.

  1. 퓨리오사AI 신제품 출시 전 → NuFi에 선제 통합·검증 완료
  2. 제품 출시 시점 → 고객이 NuFi를 통해 즉시 도입 가능
  3. 도입 이후 → NuFi의 MLOps/NPUOps 환경에서 운영·모니터링·최적화까지 원스톱 지원

GPU에서 NPU로의 전환을 고민하는 공공기관과 기업에게, NuFi가 가장 빠르고 안정적인 경로가 될 수 있도록 만들어 간다는 방침이다.