레이블이 hw인 게시물을 표시합니다. 모든 게시물 표시
레이블이 hw인 게시물을 표시합니다. 모든 게시물 표시

[컴] NVidia Multi-Instance GPU (MIG)

 

엔비디아

NVidia Multi-Instance GPU (MIG)

MIG 개념

Multi-Instance GPU (MIG) | NVIDIA

  • GPU를 최대 7개의 인스턴스로 분할할 수 있으며,
  • 각 인스턴스는 고대역폭 메모리, 캐시 및 컴퓨팅 코어를 갖춘 완벽한 격리 환경을 제공
  • 이를 통해 관리자는 가장 작은 워크로드부터 가장 큰 워크로드까지 모든 워크로드를 지원하고,
  • 서비스 품질(QoS)을 보장하며,
    • MIG(메모리 통합)를 사용하지 않으면 동일한 GPU에서 실행되는 여러 작업(예: 서로 다른 AI 추론 요청)이 동일한 리소스를 놓고 경쟁.
    • 메모리 대역폭을 많이 사용하는 작업이 다른 작업에 자원을 부족하게 만들어 여러 작업이 목표 지연 시간을 달성하지 못하게 된다.
    • MIG를 사용하면 작업이 서로 다른 인스턴스에서 동시에 실행되며, 각 인스턴스는 컴퓨팅, 메모리 및 메모리 대역폭에 대한 전용 리소스를 갖게 되어 QoS(서비스 품질)를 보장하고 GPU 활용률을 극대화하여 예측 가능한 성능을 제공한다.
  • GPU는 크기가 다른 MIG 인스턴스로 분할할 수 있다.
    • 예를 들어 NVIDIA GB200 의 경우 관리자는 각각 95GB 메모리를 가진 인스턴스 2개, 각각 45GB 메모리를 가진 인스턴스 4개 또는 각각 23GB 메모리를 가진 인스턴스 7개를 생성할 수 있다.
  • MIG 인스턴스는 동적으로 재구성할 수 있으므로 관리자는 변화하는 사용자 및 비즈니스 요구에 맞춰 GPU 리소스를 조정할 수 있다.
    • 예를 들어, 낮에는 7개의 MIG 인스턴스를 낮은 처리량의 추론에 사용하고 밤에는 딥러닝 학습을 위해 하나의 대규모 MIG 인스턴스로 재구성할 수 있다.
    • 이전 암페어(Ampere) 아키텍처에선 GPU 를 reset 해야 MIG mode 를 켤 수 있었지만, Hopper 부터는 reset 이 필요없다.
    • MIG Manager supports dynamic reconfiguration of the MIG geometry.

MIG profile 구성

로봇칩에선 어떻게 쓰이나?

Multi-Instance GPU | 피지컬 AI를 위한 궁극의 플랫폼 NVIDIA Jetson Thor을 소개합니다. - NVIDIA Technical Blog

  • 이를 통해 중요한 워크로드에는 리소스를 고정할 수 있고, 우선순위가 낮은 작업은 병렬로 실행할 수 있어, 다양한 중요도가 혼합된 로보틱스 애플리케이션에 적합

PVA, Programmable Vision Accelerator

PVA backend, VPI - Vision Programming Interface: Architecture

  • PVA 는 프로세서, 이미지 처리 및 컴퓨터 비전 알고리즘에 특화되어 있습니다.
  • GPU만 수행할 수 있는 다른 작업을 실행하기 위해 GPU를 자유롭게 해야 할 경우 PVA 백엔드를 사용해라.
    • 딥러닝 추론 단계나 CUDA 백엔드에서만 구현되는 알고리즘처럼
  • PVA 하드웨어는 CPU 및 CUDA 하드웨어보다 전력 효율이 훨씬 높다. 따라서 전력 소모가 중요한 경우 가능한 한 PVA 백엔드를 사용해라.

Optimizing the CV Pipeline in Automotive Vehicle Development Using the PVA Engine | NVIDIA Technical Blog

  • PVA(Programmable Vision Accelerator) 의 구조
  • 자율주행 차량을 개발하는 많은 개발자들은 SoC의 연산 자원이 부족해 CPU, GPU, VIC, DLA에 과부하가 걸리는 문제에 직면하고 있다. 이것이 시스템 안정성과 지연 시간에 부정적인 영향을 미칠 수 있다.
  • 이러한 문제를 해결하기 위한 방안으로, 과도하게 사용 중인 SoC 하드웨어 엔진의 부하를 줄이기 위해 PVA 하드웨어를 이용해서 연산을 분산시키는(오프로딩) 방법이 검토되고 있다.
  • PVA로 오프로딩할 수 있는 처리 작업의 예
    • 이미지 처리: 일부 이미지 처리 및 컴퓨터 비전(CV) 작업은 PVA로 포팅하여 GPU, CPU, VIC, 심지어 DLA의 부하까지 줄일 수 있습니다.
    • 딥러닝 연산: 딥러닝 네트워크 내에서 특정 레이어나 연산 집약적인 오퍼레이터(예: ROI Align)는 PVA로 오프로딩할 수 있습니다. 특정 조건에서는 소규모 딥러닝 네트워크 전체를 PVA로 포팅하는 것도 가능합니다.
    • 수학 연산: PVA는 벡터 SIMD VLIW DSP 구조를 갖추고 있어 행렬 연산, FFT 등과 같은 수학 연산을 효율적으로 처리할 수 있습니다.

[컴] BIOS 에서 보이는 FCLK

바이오스 FCLK , 오버클럭 / 오버클럭킹 / 바이오스 삐소리 / 비프음 5번 이유 / 커피레이크 / 인텔 cpu / amd cpu

BIOS 에서 보이는 FCLK

FCLK in Coffee lake

FCLK 는 cpu 에서 ’그래픽카드’로 가는 data 의 전송속도이다. 기본적으로 Coffee Lake 는 800MHz FCLK 를 갖고 있다.[ref. 2]

만약 외장 그래픽카드를 사용한다면, 이 FCLK 주파수를 올리는 것으로 아주 약간의 성능향상을 줄 수 있다고 한다.[ref. 2] ref. 3의 글을 보면 FCLK 를 overclocking 하는 것은 대체로 큰 문제가 없이 잘 되는 듯 하다.

다만 필자는 1GHz 로 한동안 잘 썼지만, 추후에 부팅시점에 계속해서 바이오스(BIOS) 의 삐-소리가 5번이 났다. 그래서 다시 FCLK 를 800Mhz 로 돌려놨다.

FCLK in AMD

FCLK, or Fabric Clock FLK 는 주파수(frequency)이다. 이 주파수로 IF(Infinity Fabric 무한 기본구조) 가 동작한다. 이 IF 가 연결된 구성들 사이에서 ’data 전송’과 ’제어 전송’을 이용해서 시스템의 핵심구성들(CPU, RAM 등)을 연결해준다.

FCLK 는 RAM 에 의해 사용되어 진다. 그래서 원래 RAM clock 과 이 FCLK 를 맞춰야 한다.

Reference

  1. What is Fclk frequency Ryzen? - Quora, 2021-01
  2. How to Overclock an Intel CPU: Get the Most MHz from Your Processor | Tom’s Hardware
  3. FCLK 1GHz on Coffee Lake | TechPowerUp Forums : 오랜기간 FCLK 를 1GHz 로 뒀었는데, 괜찮았다. 등의 이야기

[컴][hw] 아두이노 센서들

 

aduino /

아두이노 센서들

from ref. 1

온도/환경센서

from ref. 2

  • 소리
    • 사운드 소리감지 센서 LM393 / Arduino Sound Sensor
    • 마이크로폰 소리 증폭 감지 센서 MAX9814
      • 증폭이득 40dB, 50dB, 60dB 선택 가능
  • 온도
    • 고정밀 온습도 온도 습도 센서 DHT-22 모듈 / DHT22
    • 온습도 센서 DHT-11
    • 온도센서 TMP36
    • 방수 온도센서 프로브 (DS18B20 Waterproof Digital Thermal Probe)
    • 비접촉식 적외선 온도센서 모듈
    • LM35 아날로그 온도센서상품
  • 가스센서
    • 메탄(천연)가스 MQ-4 가스센서 모듈
    • 일산화탄소(CO) MQ-7 가스센서 모듈
    • 일산화탄소 MQ-7 가스센서 모듈
    • LPG, 부탄, 프로판가스 MQ-5 가스센서 모듈
    • 가연성 가스, 연기 MQ-2 가스센서 모듈(Arduino Gas Sensor)
      • 알콜, 부탄가스, 수소가스, 연기 등 검출
  • 기체
    • 공기품질센서 PMS5003ST / 미세먼지 / HCHO 포름알데히드, 온도 , 습도, PM2.5 , PM10, PM1.0
    • 정밀 고도계 대기압 I2C / SPI 통신 압력센서 BMP280
    • 미세먼지 측정 센서 PM2.5 GP2Y1014AU
    • 이산화탄소 및 TVOC 공기품질 센서 CCS811 / CO2 Arduino Air Quality Sensor
    • 이산화탄소 CO2 센서 / CM1106 / Single channel, NDIR방식/0~2000ppm 측정, 디지털출력
    • 토양 수분감지 센서 모듈
    • 빗물 빗방울 감지 센서 모듈
    • 유량 측정 센서 1~30L/min YF-S201 / Water Flow Sensor
    • 고성능 수압센서 MS5540-CM
    • 수위 측정 센서 모듈(Water Level Sensor)
  • 기타
    • 알코올 감지 가스 센서 MQ-3

초음파 / 거리

  • 초음파센서 HC-SR04 / Arduino Ultrasonic
  • 적외선(IR) 송수신 센서(라인트레이서 센서) / 라인(선) 추적, 라인트레이서 제작용 / Arduino IR Sensor
  • 적외선(IR) 송수신 센서 / Arduino IR Sensor / 장애물 감지, 장애물 회피용 센서
  • 적외선 940nm 발광, 수광 센서
  • 적외선 거리측정센서 / 10~80cm / 2Y0A21
  • 적외선 IR 장애물 감지센서(LED형) 4핀 모듈
  • 적외선 송수신 TCRT5000 센서 / 라인트레이서 / Arduino IR Sensor
  • 적외선 거리측정센서 / 20~150cm / 2Y0A02
  • 라인트레이서 5채널 센서 모듈 / 라인 추적 센서
  • 고정밀 ToF 거리센서 2-200cm 측정 VL53L0X V2 (납땜됨) / Time Of Flight Sensor

See Also

  1. 버섯돌이의 최저가 전자 부품(제품) .. : 네이버블로그 : 알리익스프레스에서 구매가능한 저렴한 제품을 알려준다.

Reference

  1. Arduino 37 sensors - TkkrLab
  2. 에듀이노-코딩교육 전문 쇼핑몰