K8s 위에서 만난 NPU: Furiosa RNGD 통합부터 Prefix Caching 분석까지
1. 도입 최근 LLM(대규모 언어 모델) 서비스가 고도화되면서, 막대한 GPU 도입 비용과 전력 소모를 해결하기 위해 NPU(신경망 처리 장치) 도입을 고려하는 조직이 늘고
두다지의 기술 이야기를 공유합니다
1. 도입 최근 LLM(대규모 언어 모델) 서비스가 고도화되면서, 막대한 GPU 도입 비용과 전력 소모를 해결하기 위해 NPU(신경망 처리 장치) 도입을 고려하는 조직이 늘고
들어가며 최근 AI 산업은 초거대 모델의 등장으로 인해 연산 자원 확보가 곧 경쟁력이 되는 시대에 진입했습니다. 그러나 NVIDIA GPU 중심의 서버향 연산 자원 독점은 공급망
In the era of bots, emulators, and modded apps, trusting client requests blindly is a recipe for disaster. To protect critical flows like Registration and
Introduction In native cross-platform development (Android with Kotlin and iOS with Swift), choosing an architecture is a strategic decision that directly impacts productivity, maintainability, and
Introduction In the world of native cross-platform development (Android Kotlin + iOS Swift), one of the greatest challenges is maintaining Business Logic Consistency. Project specifications are
In the era of Declarative UI, the transition between Android (Kotlin) and iOS (Swift) is no longer a journey of starting from scratch. Once you
들어가며 바이브 코딩(Vibe Coding)이 개발자들 사이에서 빠르게 확산되고 있습니다. Andrej Karpathy가 명명한 이 개발 방식은 "코드를 직접 작성하는 대신, AI와 함께 코드의
logrotate를 이용해 시스템 로그가 쌓여 디스크 용량이 부족해지는 것을 사전에 방지하는 방법을 알아보자. 개요 리눅스 서버를 운영하다 보면 로그 파일이 지속적으로 누적되면서 루트 파티션(/)의
Make에서 셀프호스팅 n8n으로 마이그레이션하고, 운영 통계 데이터를 자동으로 Google Spreadsheet에 기록하는 워크플로우를 구축한 경험을 공유합니다. 들어가며 운영 업무를 하다 보면 매주 반복되는 보고 작업이 있습니다.
영상 데이터를 효율적으로 벡터화하고, 대규모 유사도 검색을 안정적으로 수행하기 위한 설계와 구현 과정을 정리합니다. 들어가며 영상 기반 서비스나 데이터 분석 환경에서는 이 영상이 이미 처리된
들어가며 Rule-based 챗봇의 한계를 개선하기 위해 RAG 기반 챗봇을 개발하게 되었습니다. 이 글에서는 시스템 구조, 챗봇고도화 방법과 챗봇 평가까지의 과정에서 얻은 경험을 공유합니다. 기존 챗봇의
네이버톡톡이나 카카오톡 같은 채팅 플랫폼은 모두 메시지를 수신하기 위한 웹훅을 제공하고 있습니다. 하지만 플랫폼마다 인증 방식이나 페이로드 구조, 이미지/파일과 같은 데이터 처리 방식에는 제법