기술설명 NPU Furiosa RNGD NPU에서 LLM 모델 서빙하기 Furiosa NPU에 LLM 모델을 포팅하고, LlamaIndex와 LangChain 기반 RAG 시스템을 구축한 과정을 공유드립니다. 들어가며 최근 LLM(Large Language Model) 서비스가 급격히 확산되면서, GPU 자원의 수급 2025. 12. 19 14 min read