레이블이 hw인 게시물을 표시합니다. 모든 게시물 표시

[컴] NVidia Multi-Instance GPU (MIG)

엔비디아

NVidia Multi-Instance GPU (MIG)

MIG 개념

Multi-Instance GPU (MIG) | NVIDIA

GPU를 최대 7개의 인스턴스로 분할할 수 있으며,
각 인스턴스는 고대역폭 메모리, 캐시 및 컴퓨팅 코어를 갖춘 완벽한 격리 환경을 제공
이를 통해 관리자는 가장 작은 워크로드부터 가장 큰 워크로드까지 모든 워크로드를 지원하고,
서비스 품질(QoS)을 보장하며,
- MIG(메모리 통합)를 사용하지 않으면 동일한 GPU에서 실행되는 여러 작업(예: 서로 다른 AI 추론 요청)이 동일한 리소스를 놓고 경쟁.
- 메모리 대역폭을 많이 사용하는 작업이 다른 작업에 자원을 부족하게 만들어 여러 작업이 목표 지연 시간을 달성하지 못하게 된다.
- MIG를 사용하면 작업이 서로 다른 인스턴스에서 동시에 실행되며, 각 인스턴스는 컴퓨팅, 메모리 및 메모리 대역폭에 대한 전용 리소스를 갖게 되어 QoS(서비스 품질)를 보장하고 GPU 활용률을 극대화하여 예측 가능한 성능을 제공한다.
GPU는 크기가 다른 MIG 인스턴스로 분할할 수 있다.
- 예를 들어 NVIDIA GB200 의 경우 관리자는 각각 95GB 메모리를 가진 인스턴스 2개, 각각 45GB 메모리를 가진 인스턴스 4개 또는 각각 23GB 메모리를 가진 인스턴스 7개를 생성할 수 있다.
MIG 인스턴스는 동적으로 재구성할 수 있으므로 관리자는 변화하는 사용자 및 비즈니스 요구에 맞춰 GPU 리소스를 조정할 수 있다.
- 예를 들어, 낮에는 7개의 MIG 인스턴스를 낮은 처리량의 추론에 사용하고 밤에는 딥러닝 학습을 위해 하나의 대규모 MIG 인스턴스로 재구성할 수 있다.
- 이전 암페어(Ampere) 아키텍처에선 GPU 를 reset 해야 MIG mode 를 켤 수 있었지만, Hopper 부터는 reset 이 필요없다.
  - 참고: Getting Started with MIG — NVIDIA Multi-Instance GPU User Guide
- MIG Manager supports dynamic reconfiguration of the MIG geometry.
  - 현재 사용하지 않는 노는 조각들만 합치거나 다시 나눌 수 있다.
  - 참고: GPU Operator with MIG — NVIDIA GPU Operator

MIG profile 구성

로봇칩에선 어떻게 쓰이나?

Multi-Instance GPU | 피지컬 AI를 위한 궁극의 플랫폼 NVIDIA Jetson Thor을 소개합니다. - NVIDIA Technical Blog

이를 통해 중요한 워크로드에는 리소스를 고정할 수 있고, 우선순위가 낮은 작업은 병렬로 실행할 수 있어, 다양한 중요도가 혼합된 로보틱스 애플리케이션에 적합

PVA, Programmable Vision Accelerator

PVA backend, VPI - Vision Programming Interface: Architecture

PVA 는 프로세서, 이미지 처리 및 컴퓨터 비전 알고리즘에 특화되어 있습니다.
GPU만 수행할 수 있는 다른 작업을 실행하기 위해 GPU를 자유롭게 해야 할 경우 PVA 백엔드를 사용해라.
- 딥러닝 추론 단계나 CUDA 백엔드에서만 구현되는 알고리즘처럼
PVA 하드웨어는 CPU 및 CUDA 하드웨어보다 전력 효율이 훨씬 높다. 따라서 전력 소모가 중요한 경우 가능한 한 PVA 백엔드를 사용해라.

Optimizing the CV Pipeline in Automotive Vehicle Development Using the PVA Engine | NVIDIA Technical Blog

PVA(Programmable Vision Accelerator) 의 구조
자율주행 차량을 개발하는 많은 개발자들은 SoC의 연산 자원이 부족해 CPU, GPU, VIC, DLA에 과부하가 걸리는 문제에 직면하고 있다. 이것이 시스템 안정성과 지연 시간에 부정적인 영향을 미칠 수 있다.
이러한 문제를 해결하기 위한 방안으로, 과도하게 사용 중인 SoC 하드웨어 엔진의 부하를 줄이기 위해 PVA 하드웨어를 이용해서 연산을 분산시키는(오프로딩) 방법이 검토되고 있다.
PVA로 오프로딩할 수 있는 처리 작업의 예
- 이미지 처리: 일부 이미지 처리 및 컴퓨터 비전(CV) 작업은 PVA로 포팅하여 GPU, CPU, VIC, 심지어 DLA의 부하까지 줄일 수 있습니다.
- 딥러닝 연산: 딥러닝 네트워크 내에서 특정 레이어나 연산 집약적인 오퍼레이터(예: ROI Align)는 PVA로 오프로딩할 수 있습니다. 특정 조건에서는 소규모 딥러닝 네트워크 전체를 PVA로 포팅하는 것도 가능합니다.
- 수학 연산: PVA는 벡터 SIMD VLIW DSP 구조를 갖추고 있어 행렬 연산, FFT 등과 같은 수학 연산을 효율적으로 처리할 수 있습니다.

[컴] BIOS 에서 보이는 FCLK

바이오스 FCLK , 오버클럭 / 오버클럭킹 / 바이오스 삐소리 / 비프음 5번 이유 / 커피레이크 / 인텔 cpu / amd cpu

BIOS 에서 보이는 FCLK

FCLK in Coffee lake

FCLK 는 cpu 에서 ’그래픽카드’로 가는 data 의 전송속도이다. 기본적으로 Coffee Lake 는 800MHz FCLK 를 갖고 있다.[ref. 2]

만약 외장 그래픽카드를 사용한다면, 이 FCLK 주파수를 올리는 것으로 아주 약간의 성능향상을 줄 수 있다고 한다.[ref. 2] ref. 3의 글을 보면 FCLK 를 overclocking 하는 것은 대체로 큰 문제가 없이 잘 되는 듯 하다.

다만 필자는 1GHz 로 한동안 잘 썼지만, 추후에 부팅시점에 계속해서 바이오스(BIOS) 의 삐-소리가 5번이 났다. 그래서 다시 FCLK 를 800Mhz 로 돌려놨다.

FCLK in AMD

FCLK, or Fabric Clock FLK 는 주파수(frequency)이다. 이 주파수로 IF(Infinity Fabric 무한 기본구조) 가 동작한다. 이 IF 가 연결된 구성들 사이에서 ’data 전송’과 ’제어 전송’을 이용해서 시스템의 핵심구성들(CPU, RAM 등)을 연결해준다.

FCLK 는 RAM 에 의해 사용되어 진다. 그래서 원래 RAM clock 과 이 FCLK 를 맞춰야 한다.

Reference

What is Fclk frequency Ryzen? - Quora, 2021-01
How to Overclock an Intel CPU: Get the Most MHz from Your Processor | Tom’s Hardware
FCLK 1GHz on Coffee Lake | TechPowerUp Forums : 오랜기간 FCLK 를 1GHz 로 뒀었는데, 괜찮았다. 등의 이야기

[컴][hw] 아두이노 센서들

aduino /

아두이노 센서들

from ref. 1

온도/환경센서

from ref. 2

소리
- 사운드 소리감지 센서 LM393 / Arduino Sound Sensor
- 마이크로폰 소리 증폭 감지 센서 MAX9814
  - 증폭이득 40dB, 50dB, 60dB 선택 가능
온도
- 고정밀 온습도 온도 습도 센서 DHT-22 모듈 / DHT22
- 온습도 센서 DHT-11
- 온도센서 TMP36
- 방수 온도센서 프로브 (DS18B20 Waterproof Digital Thermal Probe)
- 비접촉식 적외선 온도센서 모듈
- LM35 아날로그 온도센서상품
가스센서
- 메탄(천연)가스 MQ-4 가스센서 모듈
- 일산화탄소(CO) MQ-7 가스센서 모듈
- 일산화탄소 MQ-7 가스센서 모듈
- LPG, 부탄, 프로판가스 MQ-5 가스센서 모듈
- 가연성 가스, 연기 MQ-2 가스센서 모듈(Arduino Gas Sensor)
  - 알콜, 부탄가스, 수소가스, 연기 등 검출
기체
- 공기품질센서 PMS5003ST / 미세먼지 / HCHO 포름알데히드, 온도 , 습도, PM2.5 , PM10, PM1.0
- 정밀 고도계 대기압 I2C / SPI 통신 압력센서 BMP280
- 미세먼지 측정 센서 PM2.5 GP2Y1014AU
- 이산화탄소 및 TVOC 공기품질 센서 CCS811 / CO2 Arduino Air Quality Sensor
- 이산화탄소 CO2 센서 / CM1106 / Single channel, NDIR방식/0~2000ppm 측정, 디지털출력
물
- 토양 수분감지 센서 모듈
- 빗물 빗방울 감지 센서 모듈
- 유량 측정 센서 1~30L/min YF-S201 / Water Flow Sensor
- 고성능 수압센서 MS5540-CM
- 수위 측정 센서 모듈(Water Level Sensor)
기타
- 알코올 감지 가스 센서 MQ-3

초음파 / 거리

초음파센서 HC-SR04 / Arduino Ultrasonic
적외선(IR) 송수신 센서(라인트레이서 센서) / 라인(선) 추적, 라인트레이서 제작용 / Arduino IR Sensor
적외선(IR) 송수신 센서 / Arduino IR Sensor / 장애물 감지, 장애물 회피용 센서
적외선 940nm 발광, 수광 센서
적외선 거리측정센서 / 10~80cm / 2Y0A21
적외선 IR 장애물 감지센서(LED형) 4핀 모듈
적외선 송수신 TCRT5000 센서 / 라인트레이서 / Arduino IR Sensor
적외선 거리측정센서 / 20~150cm / 2Y0A02
라인트레이서 5채널 센서 모듈 / 라인 추적 센서
고정밀 ToF 거리센서 2-200cm 측정 VL53L0X V2 (납땜됨) / Time Of Flight Sensor

쿠...sal

[컴] NVidia Multi-Instance GPU (MIG)

NVidia Multi-Instance GPU (MIG)

MIG 개념

MIG profile 구성

로봇칩에선 어떻게 쓰이나?

PVA, Programmable Vision Accelerator

[컴] BIOS 에서 보이는 FCLK

BIOS 에서 보이는 FCLK

FCLK in Coffee lake

FCLK in AMD

Reference

[컴][hw] 아두이노 센서들

아두이노 센서들

온도/환경센서

초음파 / 거리

See Also

Reference