Nvidia/Nvidia 공부

nvidia-smi 옵션값 정리

ccclog 2025. 3. 8. 18:08
반응형

 

🔹 nvidia-smi (NVIDIA System Management Interface) 정리

✅ nvidia-smi는 NVIDIA GPU의 상태를 모니터링 및 관리하는 CLI 도구야.
Windows 및 Linux에서 사용 가능하며, CUDA 및 드라이버 정보도 제공해.
✅ AI, 머신러닝, 데이터센터 환경에서 GPU 리소스를 최적화하는 데 사용됨.


📌 기본 사용법

 
#nvidia-smi # 기본 GPU 상태 출력 nvidia-smi --help # 사용 가능한 옵션 확인

 

📌 주요 옵션 정리 (줄임 옵션 포함)

GPU 정보 확인 관련 옵션

긴 옵션 (--long-option)짧은 옵션 (-short)설명예제

--query -q GPU 전체 정보 조회 nvidia-smi -q
--query-gpu 없음 GPU 특정 정보 조회 nvidia-smi --query-gpu=name,temperature.gpu --format=csv
--query-compute-apps 없음 실행 중인 CUDA 프로세스 확인 nvidia-smi --query-compute-apps
--format=csv 없음 CSV 형식으로 출력 nvidia-smi --query-gpu=utilization.gpu --format=csv
--loop=<n> -l <n> n초 간격으로 정보 갱신 nvidia-smi -l 5

GPU 상태 및 제어 옵션

긴 옵션 (--long-option)짧은 옵션 (-short)설명예제

--persistence-mode=1 -pm 1 GPU 지속 모드 활성화 nvidia-smi -pm 1
--reset-gpu 없음 GPU 초기화 nvidia-smi --gpu-reset -i 0
--set-power-limit=<W> -pl <W> 전력 제한 설정 nvidia-smi -i 0 -pl 200 (200W 제한)
--set-clocks=<gpu,mem> 없음 클럭 속도 설정 nvidia-smi -i 0 --set-clocks=1500,5000
--applications-clocks=<gpu,mem> -ac <gpu,mem> 애플리케이션 클럭 설정 nvidia-smi -i 0 -ac 1400,6000
--reset-clocks 없음 클럭 기본값 복구 nvidia-smi -i 0 --reset-clocks

CUDA 프로세스 및 메모리 관리

긴 옵션 (--long-option)짧은 옵션 (-short)설명예제

--query-compute-apps 없음 현재 실행 중인 CUDA 프로세스 조회 nvidia-smi --query-compute-apps
--query-supported-clocks -q -d SUPPORTED_CLOCKS 지원되는 클럭 속도 확인 nvidia-smi -q -d SUPPORTED_CLOCKS

📌 자주 사용하는 명령어 예시

1️⃣ GPU 상태 확인 (기본 정보 출력)

#nvidia-smi

2️⃣ 실시간 GPU 사용량 확인 (5초 간격 갱신)

#nvidia-smi -l 5

3️⃣ 현재 실행 중인 CUDA 프로세스 조회

#nvidia-smi --query-compute-apps

4️⃣ GPU 클럭 속도 조정 (GPU 1600MHz, 메모리 5000MHz)

#nvidia-smi -i 0 --set-clocks=1600,5000

5️⃣ GPU 전력 제한 설정 (200W로 제한)

#nvidia-smi -i 0 -pl 200

6️⃣ 애플리케이션 클럭 설정 (GPU 1400MHz, 메모리 6000MHz)

#nvidia-smi -i 0 -ac 1400,6000

7️⃣ GPU 지속 모드(Persistence Mode) 활성화

#nvidia-smi -pm 1


정리

🔹 nvidia-smi는 NVIDIA GPU 상태를 실시간으로 모니터링하고 제어하는 도구
🔹 Windows 및 Linux에서 사용 가능
🔹 AI, 머신러닝, 데이터센터 GPU 최적화에 필수
🔹 핵심 기능:

  • GPU 온도 및 사용량 확인 (-q, -l)
  • 클럭 조정 (-ac, --set-clocks)
  • 전력 제한 (-pl)
  • CUDA 프로세스 관리 (--query-compute-apps)

 

 

 

해당 글은 Chat GPT에 의해서 작성되었습니다. 

반응형