KOKY043A january   2022  – march 2023 AM67 , AM67A , AM68 , AM68A , AM69 , AM69A , TDA4AEN-Q1 , TDA4AH-Q1 , TDA4AL-Q1 , TDA4AP-Q1 , TDA4VE-Q1 , TDA4VEN-Q1 , TDA4VH-Q1 , TDA4VL-Q1 , TDA4VM , TDA4VM-Q1 , TDA4VP-Q1

 

  1.   한눈에 보기
  2.   Authors
  3.   머리말
  4.   에지에서 AI 정의
  5.   효율적인 에지 AI 시스템이란 무엇입니까?
    1.     SoC 아키텍처 선택
    2.     프로그래머블 코어 유형 및 가속기
  6.   TI 비전 프로세서로 에지 AI 시스템 설계
    1.     딥 러닝 가속기
    2.     이미징 및 컴퓨터 비전 하드웨어 가속기
    3.     스마트 내부 버스 및 메모리 아키텍처
    4.     최적화된 시스템 BOM
    5.     사용하기 쉬운 소프트웨어 개발 환경
  7.   결론

프로그래머블 코어 유형 및 가속기

이제 에지 AI 시스템에서 가능한 핵심 유형을 살펴보겠습니다.

CPU

CPU(중앙 처리 장치)는 순차적 워크로드를 처리할 수 있는 범용 처리 장치입니다. 이러한 API는 프로그래밍 유연성이 뛰어나며 기존의 대규모 코드 베이스를 활용할 수 있는 이점을 제공합니다. 일반적으로 대부분의 에지 AI 시스템에는 플랫폼과 기능이 풍부한 애플리케이션을 관리하기 위한 2~8개의 CPU 코어가 있습니다. 그러나 CPU만 사용하는 시스템은 픽셀 수준 이미징, 컴퓨터 비전, CNN(Convolution Neural Network) 처리와 같이 고도로 전문화된 작업에 적합하지 않습니다. 또한 CPU는 전력 소비량이 높지만 여러 코어 유형 중 처리량이 가장 적습니다. AI 가속, 이미지 처리와 같은 전용 하드웨어 블록과 결합된 단일 코어 CPU 시스템을 사용하여 저비용 애플리케이션의 전력 예산 요구 사항을 충족할 수 있습니다.

GPU

GPU(그래픽 처리 장치)에는 병렬 처리 작업에 적합한 수백 개에서 수천 개의 작은 코어가 있습니다. 원래 일련의 그래픽 작업을 구현하도록 설계된 GPU는 딥 러닝 애플리케이션에서 일반적으로 사용되는 GPU로, DNN 교육에 특히 유용합니다. 주요 단점 중 하나는 코어 수가 많기 때문에 GPU는 많은 전력을 소비하고 온칩 메모리 요구 사항이 더 많다는 점입니다.

DSP

DSP(디지털 신호 프로세서)는 일반적으로 여러 복잡한 수학 문제를 해결하도록 설계된 전력 효율적인 특수 코어입니다. DSP는 실제 비전, 오디오, 음성, 레이더 및 소나 센서의 저전력 실시간 데이터를 처리합니다. DSP는 클록 사이클당 처리를 극대화하는 데 도움이 됩니다. 프로그래밍하기가 쉽지 않지만 최고의 성능을 달성하기 위해 DSP 하드웨어 기능, 프로그래밍 환경 및 DSP 소프트웨어 최적화에 대해 익숙해야 합니다.

ASIC

ASIC(애플리케이션별 통합 회로) 및 가속기는 시스템 애플리케이션에 대해 최저 전력으로 최대의 성능을 제공합니다. 가속할 함수의 코어 커널을 알고 있을 때 많이 사용되는 선택 요소입니다. 예를 들어, CNN의 코어 계산에는 항상 행렬 곱셈이 포함됩니다. 기존의 컴퓨터 비전 작업 시, 전용 하드웨어 가속기는 이미지 스케일링, 렌즈 왜곡 보정 및 잡음 필터링과 같은 작업을 계산할 수 있습니다.

프로세서를

FPGA(Field Programmable Gate Array)는 특정 애플리케이션에 대해 하드웨어 블록을 다시 프로그래밍하고 대상을 지정할 수 있는 통합 회로 클래스입니다. GPU 및 CPU보다 전력 소비량이 낮지만 ASIC보다 더 많은 전력을 사용합니다. 그러나 하드웨어는 프로그래밍하기 어렵고 Verilog 또는 초고속 IC 하드웨어 설명 언어 같은 하드웨어 설명자 언어에 대한 전문 지식이 필요합니다.