Logo

회원가입로그인 ENGLISH naver youtube  
search 

IP명 A fast and flexible deep-learning processor
Category Mixed Application Neural processing unit
실설계면적 4㎛ X 4㎛ 공급 전압 1.3V
IP유형 Hard IP 동작속도 250MHz
검증단계 Silicon 참여공정 SS28-2001
IP개요 Convolution 연산의 가속을 위하여 36개의 common neural processing unit을 설계하였다. 각 neural processing unit은 neural network processing 가속을 위한 processing unit과 data reuse를 위하여 3종류의 on_chip memory를 가진다. 더불어, 각 common neural processing unit의 flexible한 동작을위하여 ARM9 processor를 탑재하여 router 및 processing unit를 컨트롤하며 다른 잡다한 연산을 처리하도록 하였다.
36개의 common neural processing unit 사이의 데이터 병목 현상을 줄이는 interconnection을 위하여 router architecture를 설계하였으며, 새롭게 제안하는 highway topology를 접목시켜 낮은 data transfer latency를 달성할 수 있었다.
- 레이아웃 사진 -