본문 바로가기
반응형

전체 글235

HGX와 DGX HGX와 DGX는 NVIDIA의 고성능 컴퓨팅(HPC) 및 AI 워크로드를 위한 하드웨어 플랫폼 이름인데, 각각의 용도와 구성 방식이 다릅니다. 아래에 간단히 차이를 정리해 드릴게요:✅ NVIDIA HGXHGX는 '플랫폼'입니다.서버 제조사들이 이를 기반으로 서버를 커스터마이징할 수 있도록 만든 모듈형 설계 플랫폼이에요.GPU, NVSwitch, NVLink 등의 구성 요소가 결합된 백플레인 구조의 보드를 의미.HGX 플랫폼에는 일반적으로 4개 또는 8개의 A100, H100 같은 고성능 GPU가 탑재됩니다.서버 브랜드들(Dell, Supermicro, Inspur 등)이 이걸 기반으로 AI 서버 제품을 개발합니다.유연성이 큰 장점이에요 — 메모리, CPU, 네트워크 등은 서버 제조사가 조정 가능.사용 .. 2025. 4. 21.
Snowflake AI Data Cloud Snowflake AI Data Cloud는 Snowflake가 제공하는 클라우드 기반 데이터 플랫폼을 기반으로 한 데이터 관리 및 분석 서비스입니다. Snowflake는 기본적으로 데이터 웨어하우징, 데이터 파이프라인, 데이터 분석 및 기계 학습(ML) 등 다양한 기능을 제공하는 플랫폼으로 잘 알려져 있습니다. "AI Data Cloud"는 특히 AI와 기계 학습을 위한 최적화된 기능들을 강조하는 차별화된 접근 방식을 가지고 있습니다.주요 특징클라우드 네이티브 아키텍처Snowflake는 클라우드 네이티브로 설계되어 다양한 클라우드 제공자(AWS, Azure, Google Cloud 등)에서 실행됩니다. 이로 인해 별도의 서버 관리 없이 스케일링 및 리소스 할당이 가능합니다.통합된 데이터 플랫폼데이터 웨.. 2025. 4. 13.
KATA Containers https://katacontainers.io/ Kata Containers - Open Source Container Runtime SoftwareKata Containers is an open source container runtime, building lightweight virtual machines that seamlessly plug into the containers ecosystem.katacontainers.io  🛡️ 컨테이너처럼 가볍고, VM처럼 안전하게 – Kata Containers 소개최근 클라우드 환경에서 컨테이너 기술은 거의 기본이 되었죠.빠르고, 가볍고, 배포도 쉬워서 안 쓸 이유가 없을 정도입니다. 하지만 한 가지 고민은 여전히 존재합니다.“컨테이너는 호스트 커널을 공.. 2025. 3. 15.
echo와 리디렉션을 통해 텍스트 파일 생성 # echo "1'm fine, thank you" echo명령어를 이용해서 CLI에 텍스트를 출력할 수 있다.   CLI에 출력할 문구를 다음 명령어와 함께 텍스트파일로 생성할 수 있다. # echo "1'm fine, thank you" > 1.txt 다음 커맨드로 텍스트를 추가가 가능하다. # echo "1'm fine, thank you" >> 1.txt 다시 '>' 이용한다면# echo "1'm fine, thank you" > 1.txt텍스트를 덮어씌우게 된다.  이에 유의하자. 2025. 3. 15.
A100에서 MIG 구성 가능 최대 수량 ✅ A100에서 MIG 구성 가능 수량 요약항목최대 개수 (A100 40GB / 80GB 기준)GPU Instance (GI)최대 7개Compute Instance (CI)GI별로 다르지만, 최대 총 7개까지 생성 가능 🧩 중요한 개념: GI와 CI의 1:1 관계하나의 GI에는 최소 하나의 CI가 있어야 연산이 가능하나의 GI 안에 여러 CI를 만들 수 있는 경우도 있음, 하지만 총 CI 수는 7개를 초과할 수 없음대부분의 경우, GI 1개에 CI 1개 (1:1 매핑) 으로 사용하는 것이 일반적하지만 특정 크기의 GI를 만들면, 그 안에서 여러 개의 CI를 나누어 사용할 수 있는 구조도 존재합니다. (CI 다중 구성 가능)🔍 예시로 살펴보기 (A100 40GB 기준)GI 프로파일 (형태)GPU 메모리.. 2025. 3. 9.
MIG Instance 정리. NVIDIA의 MIG(Multi-Instance GPU) 기능에서 GPU Instance와 Compute Instance는 서로 다른 역할을 합니다.🛠️ 1. GPU Instance (GI)란?물리적인 GPU의 하드웨어 리소스를 논리적으로 분할한 것메모리(RAM), 캐시, SM(Streaming Multiprocessors) 등의 자원을 분리하여 가상화할당된 GPU 메모리와 연산 유닛을 독립적으로 사용 가능각 Instance는 다른 사용자 또는 프로세스에서 독립적으로 실행➡️ 하드웨어 리소스를 나누는 기본 단위⚡ 2. Compute Instance (CI)란?GPU Instance 내부에서 실행되는 연산 단위하나의 GPU Instance(GI) 안에서 여러 개의 Compute Instance(CI)를 .. 2025. 3. 9.
반응형